‌通义千问推出Qwen-Image-Edit：精准编辑图片文字，实现语义与外观双重控制

李小白 • 2025年8月19日 10:14:00 • AI

今日，通义千问正式发布Qwen-Image-Edit，这是其20B规模的Qwen-Image模型的升级版本，首次将强大的文本渲染能力延伸至图像编辑领域。用户只需通过Qwen Chat的“图像编辑”功能，即可体验这一创新工具。

Qwen-Image-Edit的核心优势在于其双重编辑能力：通过结合Qwen2.5-VL的视觉语义控制和VAE Encoder的外观控制，用户不仅能精准修改图片中的文字（中英文皆可），还能实现从低层级元素增删到高层级风格迁移的多样化操作。例如，它可以为吉祥物卡皮巴拉生成不同风格的MBTI表情包，或通过90度旋转展示物体背面，甚至将人物头像转换为吉卜力动画风格。

在实际应用中，该模型的表现尤为突出。无论是添加指示牌并自动生成倒影，还是删除头发丝等微小瑕疵，Qwen-Image-Edit都能保持图像其他区域不变。此外，它还支持链式编辑，例如逐步修正书法作品中的错字，最终生成准确的《兰亭集序》版本。官方测试显示，该模型在多项基准任务中已达到行业领先水平，为设计、广告和内容创作提供了高效工具。

原创文章，作者：李小白，如若转载，请注明出处：https://www.kejixun.co/article/731472.html

Qwen-Image-Edit 通义千问

李小白认证作者

0 0

AI

Qwen3.7系列预览版上线，阿里云峰会即将正式发布

近日，阿里通义千问两款最新大模型——Qwen3.7-Max-Preview与Qwen3.7-Plus-Preview已率先登陆Qwen Chat及Arena AI（原LMArena…

AI
2026年5月19日
AI

阿里巴巴通义千问发布Qwen-Image-Layered 颠覆图像编辑规则

阿里巴巴通义千问团队近日发布革命性模型Qwen-Image-Layered，首次实现将普通照片自动分解为多个可独立编辑的RGBA图层，彻底打破AI图像编辑“整体重绘”的局限。用户无…

AI
2025年12月22日
AI

阿里通义千问发布Qwen3-TTS语音合成AI模型支持49种音色与多方言

近日，阿里通义千问正式推出新一代语音合成AI模型Qwen3-TTS，该模型通过Qwen API开放访问，在音色多样性、多语种支持及拟人化表现上实现显著突破。 Qwen3-TTS提供…

李森
2025年12月11日
AI

阿里通义千问发布Qwen Code v0.3.0 全面升级开发者AI编程体验

阿里通义千问正式推出Qwen Code命令行AI工具的最新版本v0.3.0，该版本专为Qwen3-Coder模型优化，通过增强代码理解、自动化任务和智能辅助功能，显著提升开发者效率…

柠萌
2025年12月10日
AI

‌阿里巴巴通义千问团队斩获NeurIPS 2025最佳论文奖，中国AI研究再登国际顶会

全球人工智能顶级会议NeurIPS 2025于昨晚公布获奖名单，阿里巴巴通义千问团队凭借论文《Attention Gating Makes Better Foundation Mo…

柠萌
2025年11月30日
AI

阿里通义千问能力最强语言模型，Qwen3-Max 已在官网上线深度思考功能

11月2日，阿里通义千问最新旗舰模型 Qwen3-Max 已在官网上线“深度思考”模式，该功能通过增强推理链分析与多步骤问题拆解能力，显著提升复杂任务处理效率。阿里云于 9 月 2…

happy
2025年11月3日
AI

‌通义千问推出Qwen3-ASR-Flash语音识别模型：歌声识别错误率低于8%

在全球语音识别技术快速发展的背景下，通义千问今日正式发布其最新语音识别模型Qwen3-ASR-Flash。该模型基于Qwen3基座模型，经过海量多模态数据及数千万小时自动语音识别（…

好奇宝宝
2025年9月9日
AI

‌通义千问全面升级：Qwen3性能提升3倍，AI图像生成进入秒级时代

近日，阿里云旗下通义千问迎来重磅升级，Qwen3系列模型能力大幅提升，长文本处理性能提升高达3倍。此次升级不仅拓展了Qwen3的上下文至100万tokens，还引入了双块注意力（D…

AI
2025年8月16日
AI

‌通义千问发布Qwen3-4B-2507双模型：手机端AI性能再突破

近日，阿里通义千问正式推出Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507两款新模型，以轻量化设计实现性能跃升，进一步推动端侧AI部署的普…

AI
2025年8月7日
AI

‌阿里通义千问开源20B图像生成模型中文文本渲染能力突破

阿里通义千问团队宣布开源其首个图像生成基础模型Qwen-Image，这款20B参数的MMDiT模型在复杂文本渲染和精准图像编辑领域取得重大突破。该模型不仅能生成宫崎骏动漫风格等多样…

小丸子
2025年8月5日
产品

阿里通义千问发布 Qwen3-Coder-Flash 模型

8 月 1 日，阿里通义千问 Qwen 昨日（7 月 31 日）发布公告，宣布推出 Qwen3-Coder-Flash（全称 Qwen3-Coder-30B-A3B-Instruc…

AI
2025年8月1日
AI

‌阿里通义千问开源全新推理模型Qwen3-30B-A3B 多项评测超越国际竞品

阿里云旗下通义千问今日正式推出新一代开源推理模型Qwen3-30B-A3B-Thinking-2507，该模型在数学推理、代码生成等核心能力上实现突破，并在多项基准测试中超越Gem…

AI
2025年7月31日
AI

‌阿里通义千问发布新模型Qwen3-30B-A3B，AI能力逼近GPT-4o

今日，阿里云旗下AI大模型通义千问在X平台宣布，正式推出Qwen3-30B-A3B的非思考模式更新版本——Qwen3-30B-A3B-Instruct-2507。新模型在指令理解、…

AI
2025年7月30日
产品

通义千问发布Qwen3-Coder代码模型性能媲美Claude Sonnet4

7月23日，阿里通义千问今日发布 Qwen3-Coder，宣称这是迄今为止最具代理能力的代码模型。据悉，Qwen3-Coder 拥有多个尺寸，其中最强大的版本是Qwen3-Co…

科技观察者
2025年7月23日
AI

阿里云通义千问Qwen3升级性能全面超越行业标杆

阿里云今日正式发布通义千问Qwen3旗舰版的最新升级，全新推出的Qwen3-235B-A22B-Instruct-2507-FP8模型采用非思考模式设计，在多项关键指标上实现突破性…

李小白
2025年7月22日
AI

Manus联手阿里通义千问，国产大模型首度实现全功能迁移

今日，AI公司Manus合伙人张涛宣布，与阿里云通义千问团队达成战略合作，双方将基于通义千问开源模型，在国产化算力平台上实现Manus产品的全功能适配，为中国用户打造更高效、更具创…

AI
2025年3月12日
AI

‌阿里开源通义千问QwQ-32B：高能推理+低成本部署

近日，阿里巴巴正式发布并开源全新推理模型‌通义千问QwQ-32B‌，主打“高性能+低门槛”特性。该模型基于320亿参数规模，在数学推理、代码生成及通用任务中表现亮眼，综合性能对标D…

AI
2025年3月7日
AI

阿里发布开源模型QwQ-32B，消费级显卡实现满血版性能

3月6日上午消息，阿里巴巴官宣发布并开源全新的推理模型通义千问QwQ-32B。通过大规模强化学习，千问QwQ-32B在数学、代码及通用能力上实现质的飞跃，整体性能比肩DeepSeek-R1。

科技观察者
2025年3月6日
AI

阿里通义千问开源Qwen2-Audio 7B：无需文本自由对话

近日，阿里巴巴通义千问团队宣布开源了其最新的音频语言模型Qwen2-Audio系列，包括Qwen2-Audio-7B和Qwen2-Audio-7B-Instruct两个版本。这一大…

AI
2024年8月13日
AI

阿里云开源大模型Qwen2-72B登顶Hugging Face新排行榜

近日，人工智能领域传来喜讯，阿里巴巴集团开源的通义千问（Qwen）指令微调模型Qwen2-72B在Hugging Face公布的全新开源大语言模型排行榜上荣登榜首，成功超越Meta…

AI
2024年6月30日

发表回复

登录后才能评论

‌通义千问推出Qwen-Image-Edit：精准编辑图片文字，实现语义与外观双重控制

相关推荐

发表回复