‌智谱开源全球最强视觉推理模型GLM-4.5V，多模态AI迈入新阶段

AI • 2025年8月12日 11:18:00 • AI

智谱AI近日宣布推出并开源全球首个100B级视觉推理大模型‌GLM-4.5V‌，其总参数达1060亿，激活参数120亿，在魔搭社区与Hugging Face同步开放下载。作为通向AGI的重要探索，该模型在41个多模态榜单中综合性能达到开源模型最高水平（SOTA），覆盖图像、视频、文档解析及GUI交互等全场景任务。

基于新一代文本基座‌GLM-4.5-Air‌，该模型通过高效混合训练实现突破性能力：新增“思考模式”开关可灵活切换快速响应与深度推理，支持64K长上下文输入，并采用三维卷积与‌3D-RoPE编码‌技术强化视频与空间关系理解。实际测试中，它能精准定位图像目标、复刻网页结构，甚至从数十页复杂文档中提取关键信息。

为降低使用门槛，智谱同步开源‌桌面助手应用‌，可实时截屏处理代码辅助、游戏攻略等视觉任务。API服务已在‌BigModel.cn‌上线，提供2000万Tokens免费额度，调用成本低至输入2元/百万Tokens，响应速度达60-80 Tokens/秒。企业用户可借此快速部署高性价比的多模态解决方案，如工业质检、智能客服等场景。

技术层面，模型创新性融合视觉编码器、MLP适配器与语言解码器，通过双三次插值增强极端比例图像处理能力。分析人士认为，GLM-4.5V的开源将加速视觉推理技术产业化，推动AI向通用场景落地迈出关键一步。

原创文章，作者：AI，如若转载，请注明出处：https://www.kejixun.co/article/730981.html

AI GLM-4.5V‌智谱

AI认证作者

0 0

商业

OpenAI收购云环境初创公司Ona，为编程助手Codex打造安全部署基石

OpenAI昨日宣布收购初创公司Ona，后者专注于为AI智能体提供安全、预配置的云环境。双方未披露交易金额，Ona团队将整体加入OpenAI并参与Codex项目研发。这项收购旨在帮…

野游栗
13小时前
AI

阿里云发布Meoo CLI开源工具，一键打通本地AI编程到云端部署

针对本地AI编程项目上线繁琐的长期痛点，阿里云今日正式推出了一款名为Meoo（秒悟）的开源命令行工具Meoo CLI，旨在打通本地开发与云端部署之间的壁垒，帮助开发者快速将本地原型…

net
15小时前
AI

塔塔咨询为5万员工部署Claude模型，加速企业级AI规模化落地

在人工智能深度赋能企业转型的浪潮中，科技咨询巨头塔塔咨询服务公司（TCS）日前宣布，已与AI厂商Anthropic达成全球战略合作伙伴关系，计划通过全面引入Claude大模型，加速…

AI
17小时前
AI

OpenAI预计明年内上市，奥尔特曼称技术发展速度或影响IPO时机

据科技媒体The Information报道，萨姆·奥尔特曼在本周致员工的内部邮件中透露，OpenAI公司预计将在“明年内”上市，但具体时间表仍具有灵活性。此前，OpenAI已于6…

好奇宝宝
1天前
新闻

亚马逊升级购物搜索体验：AI图像生成器与按风格购物功能上线

随着人工智能技术在电商领域的渗透愈发深入，亚马逊近期通过一系列技术更新，进一步强化了其购物应用在视觉搜索和智能交互方面的能力，帮助消费者更高效地在海量商品中锁定心仪之选。回顾202…

校草
2天前
新闻

三星电子拟在韩国光州新建先进封装工厂，加码AI芯片产业链布局

据韩国经济日报援引业内消息人士报道，随着AI相关芯片需求持续爆发，三星电子正进一步强化自身产业链布局，计划在韩国光州建设一座先进半导体封装工厂。该投资计划有望于6月29日总统会谈期…

三星
2天前
AI

Anthropic推出两款Claude新模型，最强版本向公众开放

昨日（6月9日），人工智能公司Anthropic发布博文，宣布推出Claude Fable 5与Claude Mythos 5两款AI模型。其中，Claude Fable 5面向普…

AI
2天前
新闻

苹果WWDC26一文汇总：库克“最后一舞”，iOS 27携AI Siri登场

北京时间6月9日凌晨1点，苹果WWDC26全球开发者大会主题演讲如期举行。这不仅是苹果一年一度的系统盛宴，更是蒂姆·库克作为CEO主讲“最后一舞”——今年9月1日起，他将出任董事会…

NEWS
3天前
商业

日韩股市遭遇黑色星期一 AI板块重挫引泡沫担忧

6月8日，亚太市场迎来黑色星期一，日韩两大股指双双大幅收跌，其中日经225指数跌幅超过3%，韩国综合股价指数（KOSPI）则重挫近4%，而领跌的正是此前持续火爆的AI与半导体板块。…

商业头条
3天前
AI

国家安全部发布AI中转站风险提示：用户隐私泄露与数据倒卖问题频发

国家安全部今日发布安全提示指出，随着人工智能应用需求迅猛增长，批量提供海内外大模型访问服务的“AI中转站”在国内迅速走红，但当前市场鱼龙混杂，部分站点运营资质缺失、安全防护薄弱，用…

若安丶
4天前
AI

苹果批准首个iMessage AI智能体，Poke可回邮件也能设提醒

据外媒Appleinsider昨日报道，苹果已批准Poke成为首个接入Apple Messages for Business平台的第三方AI智能体。Apple Messages f…

Apple
2026年6月5日
AI

Meta商务智能体全球上线，WhatsApp变身商家生产力工具

当地时间6月3日，Meta正式宣布旗下专为商家打造的客户支持AI机器人——现更名为“Meta商务智能体（Meta Business Agent）”，已在全球范围内的WhatsApp…

野游栗
2026年6月5日
AI

OpenAI发布Codex工作插件，六大岗位技能AI正式“上岗”

北京时间周三凌晨，人工智能巨头OpenAI举行了以“AI上岗”为主题的发布会，正式推出面向股票投资、创意设计等岗位的Codex工作流插件，让AI深度介入企业日常任务。面对竞争对手在…

好奇宝宝
2026年6月4日
AI

OpenAI扩展Codex使用场景，新增六款岗位插件覆盖62个应用

今日，OpenAI发布公告，宣布进一步拓展AI智能体助手Codex的使用场景，新增6个岗位插件，总计覆盖62个应用和110项技能。Codex最初服务于软件开发，如今周活跃用户已超过…

AI
2026年6月3日
AI

微软发布全天候AI助理Scout，深度整合365生态

在今日举行的Build 2026开发者大会上，微软正式推出名为“Microsoft Scout”的全天候AI助理产品。这款代号为“龙虾（OpenClaw）”的新工具与Outlook…

小科同学
2026年6月3日
AI

微软在Build 2026大会上为Edge浏览器新增三项端侧AI能力

在今日开幕的Build 2026开发者大会上，微软宣布进一步扩展Edge浏览器的端侧AI能力，在去年推出的基于Phi-4-mini模型的写作辅助API基础上，新增了模型和API。本…

Microsoft
2026年6月3日
新闻

Sesame推出对话式AI应用公测版，打破传统聊天机器人“一问一答”模式

由Oculus创始人及前VR团队核心成员联合创立的AI初创公司Sesame，于当地时间5月28日正式推出其对话式AI智能体的iOS应用公测版。该应用试图打破由ChatGPT等传统聊…

AI
2026年5月30日
AI

阿里云推出Cloud Agents平台，企业AI Agent开发周期缩短至1天

昨日，阿里云正式发布全托管AI Agent运行平台——Cloud Agents。该平台提供涵盖Agent底座、模型服务及运行环境的全栈能力，企业通过API即可直接调用，将传统需要1…

AI
2026年5月29日
AI

Meta推出多档订阅服务，AI算力按月收费最低2.99美元

科技外媒TechCrunch报道，Meta公司正大幅调整AI产品策略，将旗下多款应用和AI功能推向付费订阅模式，寻求广告之外的新变现渠道。此次推出的订阅方案覆盖社交、AI算力及专业…

小丸子
2026年5月28日
AI

环球音乐与TikTok达成新协议，联手严打未经授权的AI生成音乐

近日，环球音乐集团与TikTok正式宣布签署一项全新的多年期战略授权协议。此次续约不仅延续了双方在音乐发现与推广领域的合作，更将对未经授权的人工智能生成音乐的治理提升到了前所未有的…

小科同学
2026年5月28日

发表回复

登录后才能评论

‌智谱开源全球最强视觉推理模型GLM-4.5V，多模态AI迈入新阶段

相关推荐

发表回复