‌阿里通义千问开源20B图像生成模型中文文本渲染能力突破

小丸子 • 2025年8月5日 14:36:00 • AI

阿里通义千问团队宣布开源其首个图像生成基础模型Qwen-Image，这款20B参数的MMDiT模型在复杂文本渲染和精准图像编辑领域取得重大突破。该模型不仅能生成宫崎骏动漫风格等多样化图像，更在中文文本嵌入方面展现出超越同类产品的性能，解决了AI图像生成中长期存在的”文字失真”难题。

Qwen-Image的核心优势体现在三大维度：其文本渲染系统支持中英双语段落级生成，对联、招牌等复杂排版效果逼真；图像编辑功能通过多任务训练保持操作一致性，可实现风格迁移、细节增强等专业操作；在GenEval、DPG等12个基准测试中均达到SOTA水平，中文文本渲染得分较现有最优模型提升显著。实际测试显示，模型能准确生成包含”云计算””云存储”等专业术语的商业场景，以及”智启通义”等书法对联的完整版面。

目前该模型已在魔搭社区和Hugging Face开源，支持从照片写实到赛博朋克等数十种艺术风格转换。业界认为，这项技术将大幅降低视觉创作门槛，其开源性更有助于构建生成式AI的可持续发展生态。

原创文章，作者：小丸子，如若转载，请注明出处：https://www.kejixun.co/article/730547.html

Qwen-Image 通义千问阿里

小丸子认证作者

0 0

AI

阿里千问全面开放第三方Agent，企业可打造专属品牌智能体

近日，阿里千问宣布向第三方Agent和Skill全面开放，允许所有企业在千问生态中运营专属的品牌Agent。这一举措标志着千问正从大语言模型加速向“超级Agent”个人助手战略升级…

AI
2026年6月4日
AI

阿里推出Qwen3.7-Plus多模态模型，视觉理解能力跻身全球前五

今日，阿里千问大模型团队发布博文，正式推出Qwen3.7-Plus模型。该模型定位为多模态交互混合智能体，是此前Qwen3.7的多模态升级版，旨在打造视觉与语言统一的智能体基座。 …

AI
2026年6月2日
AI

阿里达摩院玄铁 9 系列 RVA23 处理器官宣全球首发

5月25日，阿里达摩院玄铁团队今日宣布，玄铁旗下 9 系列高性能处理器已完成对 Android 16 操作系统的适配，并面向战略客户定向发布玄铁安卓平台。玄铁团队表示，作为全球首…

科技观察者
2026年5月25日
AI

Qwen3.7系列预览版上线，阿里云峰会即将正式发布

近日，阿里通义千问两款最新大模型——Qwen3.7-Max-Preview与Qwen3.7-Plus-Preview已率先登陆Qwen Chat及Arena AI（原LMArena…

AI
2026年5月19日
AI

阿里通义 CoPaw 1.0 发布：定制小模型、安全机制与多智能体全面进化

4月1日，阿里通义实验室宣布 CoPaw 1.0 版本正式发布。此次更新重点围绕定制小模型、安全机制、多智能体协同以及记忆管理四大方面进行能力升级。CoPaw 基于 AgentSc…

科技观察者
2026年4月1日
AI

阿里千问发布Qwen3.5-Omni全模态大模型自然涌现音视频编程能力

3月30日晚，阿里千问正式发布全模态大模型Qwen3.5-Omni。这款模型能够无缝理解文本、图片、音频及音视频输入，支持细粒度、带时间戳的音视频描述生成，在215项评测中取得SO…

泡沫大盗
2026年3月31日
AI

千问上线AI打车能力阿里加速布局本地生活服务入口

近日，千问正式上线“AI打车”功能，用户只需通过自然语言对话即可完成从叫车到行程规划的全流程。这一动作标志着阿里正试图通过AI原生服务重新定义本地生活服务的流量入口。此次升级的核…

小科同学
2026年3月24日
AI

阿里通义千问 3.5-Max-Preview 首发亮相 LM Arena 国际大模型竞技场

3月20日，阿里千问大模型家族再迎新成员。今日，Qwen3.5-Max-Preview 作为千问 3.5 系列的旗舰模型预览版，在全球大模型竞技平台 LM Arena 正式亮相，并…

聆听
2026年3月20日
新闻

阿里速卖通加入YouTube购物联盟

3月18日，据报道，阿里旗下跨境电商平台速卖通（AliExpress）宣布与YouTube达成合作，作为官方合作伙伴正式加入YouTube“购物联盟计划”。据悉，速卖通是首个在韩国…

happy
2026年3月18日
新闻

阿里 CEO 吴泳铭现身千问“换帅”沟通会，表态 Qwen 是“第一优先级”

3月5日，据报道，阿里千问核心负责人林俊旸官宣将从千问项目 step down（卸任）引发广泛关注。新浪科技从内部渠道了解到，事实上，早在一个月以前，林俊旸便已开始准备 step …

李森
2026年3月5日
AI

阿里千问接入支付宝AI付一句话即可点外卖

近日，阿里旗下千问App正式接入支付宝“AI付”功能，用户在与AI对话过程中即可直接完成外卖点单与支付，标志着AI技术与日常消费场景的融合更进一步。据悉，用户只需在千问App内说…

AI
2026年2月9日
AI

阿里千问开源 Qwen3-ASR 语音识别模型：支持 52 种语种与方言

1月30日，阿里千问团队正式开源 Qwen3-ASR 系列模型，该模型是由 Qwen 开发的一系列功能强大的语音识别模型，包括两个强大且全面的语音识别模型 Qwen3-ASR-1.…

科技观察者
2026年1月30日
AI

‌通义Qwen-Image-2512开源发布，AI图像生成迈入真实感新纪元

近日，阿里通义实验室正式开源发布新一代图像生成大模型Qwen-Image-2512，标志着国产AI视觉技术在真实感生成领域实现关键突破。该模型聚焦人物质感、自然纹理与文字渲染三大维…

AI
2026年1月1日
AI

阿里巴巴通义千问发布Qwen-Image-Layered 颠覆图像编辑规则

阿里巴巴通义千问团队近日发布革命性模型Qwen-Image-Layered，首次实现将普通照片自动分解为多个可独立编辑的RGBA图层，彻底打破AI图像编辑“整体重绘”的局限。用户无…

AI
2025年12月22日
AI

‌阿里发布Qwen3-Omni-Flash全模态大模型支持119种语言交互与自定义AI人设

近日，阿里Qwen团队推出新一代原生全模态大模型Qwen3-Omni-Flash-2025-12-01，该模型在Qwen3-Omni基础上实现全面升级，支持文本、图像、音视频的无缝…

小丸子
2025年12月11日
AI

阿里通义千问发布Qwen3-TTS语音合成AI模型支持49种音色与多方言

近日，阿里通义千问正式推出新一代语音合成AI模型Qwen3-TTS，该模型通过Qwen API开放访问，在音色多样性、多语种支持及拟人化表现上实现显著突破。 Qwen3-TTS提供…

李森
2025年12月11日
AI

阿里通义千问发布Qwen Code v0.3.0 全面升级开发者AI编程体验

阿里通义千问正式推出Qwen Code命令行AI工具的最新版本v0.3.0，该版本专为Qwen3-Coder模型优化，通过增强代码理解、自动化任务和智能辅助功能，显著提升开发者效率…

柠萌
2025年12月10日
AI

‌阿里千问APP推出免费学习大模型Qwen3-Learning 拍题答疑与作业批改功能全面升级

阿里旗下千问APP正式上线基于Qwen3训练的学习大模型Qwen3-Learning，该模型专为学习场景设计，提供‌拍题答疑‌和‌作业批改‌两大核心服务，且全部免费、无使用次数限制…

AI
2025年12月5日
AI

‌阿里巴巴通义千问团队斩获NeurIPS 2025最佳论文奖，中国AI研究再登国际顶会

全球人工智能顶级会议NeurIPS 2025于昨晚公布获奖名单，阿里巴巴通义千问团队凭借论文《Attention Gating Makes Better Foundation Mo…

柠萌
2025年11月30日
AI

阿里千问视觉模型登顶空间推理榜领先Gemini与GPT

在最新发布的SpatialBench榜单中，阿里千问视觉模型Qwen3-VL与Qwen2.5-VL以13.5分和12.9分的成绩包揽前两名，大幅领先Gemini 3.0 Pro P…

net
2025年11月27日