百度发布PaddleOCR-VL-1.6，复杂文档识别准确率全球第一

百度 • 2小时前 • AI

百度近日正式推出基于文心大模型衍生出的多模态模型PaddleOCR-VL-1.6。在权威评测集OmniDocBench v1.6中，该模型以96.33%的准确率超越Gemini-3-Pro、GPT-5.2及GLM-OCR等国内外主流大模型，刷新业界SOTA，综合性能荣登全球第一，标志着多模态大模型在复杂文档理解与真实场景解析能力上取得重要突破。

作为文心大模型多模态能力的核心组成部分，PaddleOCR目前支持超100种语言识别，用户覆盖全球170多个国家和地区。本次升级的PaddleOCR-VL-1.6在保持0.9B轻量化架构的前提下，通过模型驱动的数据构建机制与渐进式训练优化，显著提升了表格、古籍、生僻字、印章及图表识别等复杂场景的核心识别能力。在面向真实复杂场景的Real5-OmniDocBench评测中，该模型以93.19%的总指标同样保持领先，攻克了扫描件、弯折、屏幕拍照、光照变化及倾斜文档等业界公认的解析痛点。

由于延续了前代架构，企业和开发者可实现无需额外适配的平滑迁移。目前PaddleOCR在GitHub上的Star数已突破79.2K，超越谷歌Tesseract OCR，成为全球最受欢迎的开源OCR项目。新模型现已上线官网并开源代码与权重。在当前大模型向多模态深度演进的趋势下，PaddleOCR-VL-1.6不仅为文档数字化提供了更高效的产业级解决方案，也将进一步加速AI在复杂多模态场景下的落地进程。

原创文章，作者：百度，如若转载，请注明出处：https://www.kejixun.co/article/754080.html

PaddleOCR-VL-1.6 文心大模型百度

百度认证作者

0 0

AI

百度 DuMate 全量上线号称首个国产企业级“满血版”OpenClaw

3月23日，据报道，百度智能云 DuMate 正式上线，面向用户全量开放。这是国内首个国产企业级龙虾产品，支持本地部署，号称“首个国产企业级满血版 OpenClaw”。据介绍，针对…

AI
2026年3月23日
AI

百度秒哒发布全球首个 OpenClaw 应用开发 Skill，实现“对话即应用”

3月17日，据报道，百度通过官方微信公众号宣布，旗下无代码开发平台秒哒发布全球首个OpenClaw应用开发Skill——“Miaoda App Builder”。这是业内首次将专业…

clin
2026年3月17日
AI

百度发布首款手机龙虾应用“红手指 Operator”：支持打车、订外卖等跨 App 交互操作

3月12日，百度智能云发布了一款即开即用的零部署服务 DuClaw。今天，百度智能云带来全球首款手机龙虾应用 —— 红手指 Operator，已正式上线安卓市场。官方介绍称红手指 …

校草
2026年3月12日
新闻

市场监管总局约谈7家平台企业，要求杜绝“内卷式”竞争

有媒体报道，国家市场监督管理总局近日对国内主要平台企业进行集中约谈，剑指促销推广活动中存在的突出问题。2月13日，市场监管总局约谈了阿里巴巴、抖音、百度、腾讯、京东、美团、淘宝闪购…

柠萌
2026年2月15日
AI

百度因AI生成虚假犯罪信息遭起诉，律师索赔百万

据澎湃新闻报道，北京律师黄贵耕起诉百度公司侵犯名誉权一案，2月6日在北京市海淀区人民法院一审开庭。黄贵耕指控百度AI在2025年5月自动生成其涉及刑事犯罪的虚假信息，对其执业造成损…

百度
2026年2月8日
智车

百度萝卜快跑首度在阿联酋启动全无人驾驶收费服务

百度旗下自动驾驶出行服务平台“萝卜快跑”今日迈出全球化关键一步。其与阿联酋当地合作伙伴AutoGo共同宣布，在阿联酋首都阿布扎比正式启动面向公众的全无人驾驶商业化收费运营。这标志着…

智能汽车时代
2026年1月18日
AI

百度文心5.0登顶全球AI榜首中国模型首次超越GPT系列

在国际权威评测平台Lrena最新公布的文本能力榜单中，百度ERNIE-5.0-Preview-1203模型以1451分强势登顶，不仅超越Claude-Opus-4-1、GPT-5.…

百度
2025年12月24日
新闻

‌百度启动大规模裁员：AI竞争加剧与广告收入下滑双重压力下的战略调整

近日，据路透社援引6名知情人士消息，百度本周启动了新一轮人员缩减，裁员规模覆盖多个业务部门，调整将持续至年底。公司内部普遍认为此次规模较大，个别团队裁减比例可能高达40%。这一举措…

百度
2025年11月29日
AI

百度全面开放25年技术积累推出“猎户座”AI引擎赋能企业

百度近日正式推出“猎户座”AI引擎，首次全面对外开放其25年来积累的搜索技术与前沿AI能力。这一举措标志着百度在AI技术应用领域迈出关键一步，旨在为企业和开发者提供更便捷的AI工具…

小科同学
2025年11月14日
AI

‌百度“文心”App 5.0 版本重磅升级：更名回归，功能全面革新

百度旗下AI助手“文心一言”App（曾用名“文小言”）于昨日正式发布5.0.0版本，并重新启用“文心”这一品牌名称。该应用自2023年7月首次上架App Store以来，历经多次迭…

百度
2025年11月2日
AI

‌百度世界2025大会11月启幕聚焦”效果涌现”与AI实践

近日，百度官方宣布，备受瞩目的百度世界2025大会将于11月13日在北京国家会议中心二期隆重举行，大会主题定为”效果涌现 | AI In Action”。这…

柠萌
2025年10月18日
AI

‌国内AI大模型安全众测结果揭晓：60%为特有漏洞，腾讯百度等产品防护表现突出

昨日，在第22届中国网络安全年会上，国内首次针对AI大模型的实网众测结果正式发布，揭示了当前大模型面临的安全挑战。本次活动由中央网信办网络安全协调局指导，国家计算机网络应急技术处理…

AI
2025年9月17日
AI

放弃DeepSeek的用户都跑哪去了？独立AI应用面临渠道分流挑战

曾备受关注的AI搜索原生应用DeepSeek正经历用户规模持续下滑，那么放弃DeepSeek的用户都跑哪去了？QuestMobile数据显示，其月活跃用户数从2025年3月的193…

AI
2025年8月6日
出海

萝卜快跑联手Uber 全球无人驾驶服务加速落地

昨日，百度旗下萝卜快跑与全球最大移动出行平台Uber达成战略合作，双方计划将无人驾驶出行服务拓展至美国和中国大陆以外的全球多个市场，标志着自动驾驶技术商业化迈出关键一步。通过此次合…

百度
2025年7月16日
商业

美股收盘:百度大涨8.65%

昨夜今晨，美股大盘整体呈现冲高回落态势，三大指数分化明显，其中标普500指数一度历史性突破6300点关口，但最终收跌0.4%至6243.76点，纳斯达克综合指数微涨0.18%报20…

秋秋
2025年7月16日
新闻

百度Robotaxi技术路线大转弯李彦宏押注纯视觉对抗特斯拉

百度创始人李彦宏在季度高管会上罕见推翻自动驾驶技术路线，宣布旗下萝卜快跑Robotaxi将从多传感器融合转向纯视觉方案，这场战略急转被内部视为”与特斯拉赛跑的最后机会&…

百度
2025年7月14日
新闻

百度商业发布视频生成模型MuseSteamer：一张图即可生成10S电影级高清有声视频

百度发布自研视频生成模型“MuseSteamer”和创作平台“绘想”，打破传统AIGC视频流程。MuseSteamer具备多项技术突破，支持一张图生成10秒1080p电影级画质视频，人物微表情与运镜效果达专业影视水准。

潮玩君
2025年7月3日
新闻

百度高管轮岗迎新：CFO何海建加盟并担任集团首席财务官

今日，百度创始人李彦宏通过发布的内部信宣布重大人事调整：何海建（Henry）正式加盟并担任集团首席财务官，全面负责财务体系管理。此前担任代理CFO的何俊杰（Jackson）轮岗至人…

百度
2025年7月1日
AI

百度开源文心大模型4.5系列，10款模型免费开放部署

今日，百度正式开源文心大模型4.5系列模型，涵盖47亿参数、3亿激活参数的混合专家(MoE)模型及0.3亿参数的稠密型模型等10款产品，并首次实现预训练权重与推理代码的完全开放下载…

百度
2025年6月30日
出海

‌百度萝卜快跑将登陆新加坡与马来西亚无人驾驶出租车市场

据彭博社最新报道，百度计划于今年在新加坡和马来西亚推出其无人驾驶出租车服务——萝卜快跑。此举标志着百度正加速拓展海外市场的步伐，与当地潜在合作方积极接洽，探索最适合两国市场的运营模…

百度
2025年6月20日

发表回复

登录后才能评论

百度发布PaddleOCR-VL-1.6，复杂文档识别准确率全球第一

相关推荐

发表回复