微软发布开源视觉推理模型Phi-4-Reasoning-Vision-15B，能自主决定何时思考

Microsoft • 2026年3月5日 14:25:00 • AI

微软日前通过官方开发者社区博客宣布，推出一款名为Phi-4-Reasoning-Vision-15B的全新开源模型。作为Phi-4系列中首个兼具高分辨率视觉感知与深度推理能力的小语言模型，这款产品的核心突破在于实现了“看得清楚”与“想得深入”的同步进化。

传统的视觉模型通常只停留在被动感知阶段，即识别图像中有什么物体。而Phi-4-Reasoning-Vision-15B则引入了结构化、多步骤的推理机制。它不仅能够理解图像中的视觉结构，还能将其与文本上下文进行关联，最终得出可操作的结论。这一进步使得开发者可以利用该模型构建从图表分析到图形用户界面自动化等一系列智能应用。

该模型最具创新性的设计在于其混合推理行为。它能够根据具体提示，在“推理模式”与“非推理模式”之间自主切换。当面临数学问题或逻辑分析等需要深度思考的任务时，模型会启动多步推理链进行细致处理；而当任务仅需快速感知，如光学字符识别或界面元素定位时，它则会直接输出结果以降低响应延迟。这种灵活的性能平衡机制，显著提升了模型在实际应用中的效率。

在实际应用层面，该模型尤其适合搭配计算机智能体使用。例如，模型在接收到屏幕截图和自然语言指令后，能够准确输出目标用户界面元素的边界框坐标，从而引导其他智能体模型执行点击、滚动等后续操作。根据微软公布的性能对比，Phi-4-Reasoning-Vision-15B在图表理解、光学字符识别及数学推理等关键任务上均表现出色，展现了小型多模态模型在复杂场景下的巨大潜力。

原创文章，作者：Microsoft，如若转载，请注明出处：https://www.kejixun.co/article/746262.html

Phi-4-Reasoning-Vision-15B 微软

Microsoft认证作者

0 0

新闻

微软Win10推送4月安全更新：修复登录与远程桌面漏洞

在本月补丁星期二活动日中，微软面向Windows 10系统推送了KB5082200安全更新，重点修复了登录与远程桌面漏洞，用户安装后版本号将升级至19045.7184和19044.…

Microsoft
2026年4月15日
AI

微软推出低成本高效文生图模型MAI-Image-2-Efficient，成本降低41%

本月初刚公布一系列自研AI模型的微软，如今又推出了MAI-Image-2-Efficient。这款模型是其旗舰级文本生成图像模型的低成本、高速版本，微软表示以近一半的价格即可提供可…

李小白
2026年4月15日
新闻

微软推送Win11四月安全更新：智能应用控制可一键开关

在2026年4月的补丁星期二活动日中，微软面向Windows 11系统推送了编号为KB5083769的安全更新。本次更新重点优化了安全控制与系统设置体验，安装后25H2版本将升级至…

Microsoft
2026年4月15日
新闻

微软正研发另一款类 OpenClaw 智能体，将整合进 Microsoft 365 Copilot

4月14日，微软正测试将类 OpenClaw 功能整合到其现有 Microsoft 365 Copilot 工具中的方法。该公司向科技媒体《The Information》证实，这…

秋秋
2026年4月14日
AI

微软发布 Harrier 系列嵌入 AI 模型，MTEB-v2 基准测试超越谷歌夺冠

4月9日，微软必应（Bing）团队于 4 月 7 日发布博文，宣布为满足现代 AI 智能体系统对信息处理的高标准需求，开源推出业界领先的文本嵌入模型系列 Harrier，该模型在多…

潮玩君
2026年4月9日
AI

Anthropic最强AI模型Calude Mythos登场苹果、微软等合力推进网安项目

4月8日，Anthropic联合苹果、英伟达、微软、亚马逊云服务、谷歌、Linux基金会等11家科技巨头，共同启动Project Glasswing项目，并发布前沿AI模型Clau…

马会林
2026年4月8日
AI

OpenAI发布AI经济蓝图：公共财富基金、机器人税与四天工作制

4月7日，据TechCrunch报道，OpenAI发布了一系列政策提案，勾勒出“智能时代”财富与就业可能被重塑的路径。这份文件将公共财富基金、扩大社会保障网等传统偏左翼机制，与以资…

好奇宝宝
2026年4月7日
新闻

微软发布 Win11 专项补丁，紧急修复 3 月可选更新 0x80073712 报错

4月1日，微软昨日面向 Windows 11 设备，紧急推送修复补丁 KB5086672，专门解决本月早些时候出现的安装故障。微软此前发布三月可选更新 KB5079391，大量用…

李森
2026年4月1日
新闻

微软冻结多部门招聘，AI投入高压下严控成本

微软近日悄然启动部分核心部门招聘冻结，引发科技行业关注。据《The Information》援引三位知情人士消息，公司已通知云计算、北美销售等关键事业部，暂停所有尚未发出正式录用通…

Microsoft
2026年3月30日
新闻

微软计划重大整改 Exchange Server，未来十年将聚焦网络安全与单一版本

3月24日，据报道，微软承认许多企业客户仍然偏爱可自主管理、部署的 Exchange Server。随着该套件即将迎来 30 岁生日，官方最近公布其未来发展计划。据报道，Exch…

Microsoft
2026年3月25日
新闻

OpenAI披露IPO风险文件坦承对微软依赖构成潜在威胁

OpenAI近日向潜在投资者发布了一份形似IPO招股说明书的文件，坦承其与微软的紧密关系可能构成重大业务风险。这家ChatGPT开发商正筹备最快于今年公开上市，目前估值已达7300…

小丸子
2026年3月24日
AI

微软最强生图 AI 模型 MAI-Image-2 登场，搞定复杂信息图表

3月20日，微软 AI 首席执行官穆斯塔法 · 苏莱曼（Mustafa Suleyman）昨日（3 月 19 日）在 X 平台发布推文，宣布推出第二代图像生成模型 MAI-Imag…

Microsoft
2026年3月20日
新闻

微软整合Copilot产品线：简化品牌矩阵，任命新帅聚焦AI模型

3月18日，据报道，微软正大刀阔斧整合旗下人工智能业务，通过简化产品线在竞争白热化的AI市场中赢得先机。微软CEO Satya Nadella发给员工的内部备忘录显示，微软已将旗下…

itech
2026年3月18日
新闻

谷歌为 Play 商店引入跨平台“一次购买，随处游玩”功能

3月17日，谷歌发文宣布为 Play 商店引入一项名为“Buy Once, Play Anywhere（一次购买，随处游玩）”的跨平台购买功能，首批支持《Dungeon Clawl…

泡沫大盗
2026年3月17日
新闻

微软更新Teams功能整合Win11勿扰模式并强化管理工具

微软近日更新Microsoft 365路线图，宣布为Teams应用带来多项重要更新，其中最为引人关注的是与Windows 11系统功能的深度整合。新版Teams将正式支持系统内置的…

Microsoft
2026年3月17日
新闻

微软推送Win11 RP 26×00.8106预览版更新支持超1000Hz刷新率并接入Copilot

今日，微软面向Release Preview通道推送了Windows 11 24H2和25H2的最新累积更新，升级后版本号分别提升至Build 26100.8106和Build 2…

Microsoft
2026年3月13日
新闻

微软下月起将向所有 Windows 11 PC 推送“Xbox FSE 全屏体验（Xbox 模式）”功能

3月12日，微软去年 6 月推出了 Xbox FSE 全屏体验（Xbox Full Screen Experience 界面），ROG Xbox Ally 系列掌机率先搭载，今天微…

校草
2026年3月12日
新闻

微软推送 Win10 三月安全更新：修复卡死、更新证书、提升部分显卡稳定性等

3月11日，微软在本月补丁星期二活动日（3 月 10 日），面向已加入“扩展安全更新”（ESU）计划的 Windows 10 用户推送 KB5078885 累积更新，用户安装后版本…

Microsoft
2026年3月11日
新闻

微软彻底禁用 Microsoft Lens 扫描应用，要求用户迁移至 OneDrive

3月9日，微软 Microsoft Lens 扫描应用于 2 月 9 日从各大应用商店中下架，官方当时称 3 月 9 日（今天）起该应用将被关闭。目前微软已对应用开启“时间炸弹”…

李森
2026年3月9日
AI

微软必应视频创作者接入Sora 2，免费生成更强AI视频

微软昨日宣布，其旗下的必应视频创作者服务Bing Video Creator已完成重大升级，全面接入了OpenAI最新推出的Sora 2视频生成模型。这意味着所有必应用户现在都可以…

Microsoft
2026年3月6日

发表回复

登录后才能评论

微软发布开源视觉推理模型Phi-4-Reasoning-Vision-15B，能自主决定何时思考

相关推荐

发表回复