阿里巴巴中国电商事业群郑波：多模态智能是淘宝最重要的AI技术域

陈晨 • 2025年10月24日 14:47:45 • 产经

10月24日，阿里巴巴中国电商事业群首席科学家、技术总裁郑波在CNCC2025大会上，首次透露淘宝全模态大模型最新进展，并系统介绍了多模态智能在淘宝AIGX技术体系的研究和应用，包括多模态生成、生成式推荐（AIGR）、AI Agent等多项最新技术突破。

郑波指出，从过去两年多的发展来看，AI处理问题的复杂度每年以5-10倍速度增加，而AI的错误率每年降低50%，模型inference（推理）的成本每年也降低一个数量级，按照这一发展趋势，狭义AGI（在多数开放环境任务完成度超过95%的人类）将在未来5至10年之间实现。淘宝自2003年上线以来，始终坚持技术发展和商业变革双向驱动，在新的AI时代，多模态智能将是“万能的淘宝”最重要的技术域。

据介绍，淘宝的全模态大模型“TStars-Omni”，支持输入文本、图像、视频、音频，输出文本和音频，极大程度的对齐了人类感官。该模型在模型基座、视觉编码器、音频理解、语音合成等方面进行了深度优化，实现体量小、吞吐快的显著优势显著，性能处于领域第一梯队，并通过全面的商品理解，满足用户深层次推理需求。比如，用户输入冰箱和厨房平面图两张图片后提问：“我可以把这个冰箱放进我的厨房吗？”TStars-Omni模型对图片进行分析推理后回答：“无法直接嵌入”，并给出建议和提醒。

在多模态生成方面，淘宝推出视频生成模型的升级版——淘宝星辰·视频生成模型3.0。该模型采用了更紧凑的16x16x4时空压缩VAE，在大幅增加DIT参数的情况下，保持推理的高效。高品质、类别平衡的训练数据，搭配大幅提升的语义理解模块，使得模型动作更加灵动，语义更精确，画面更原生。

郑波现场演示了多模态生成技术在电商场景中的应用。商家只需提供一件连衣裙的平铺照片，系统将匹配生成一个虚拟模特，之后生成多张模特穿着此连衣裙的、在不同场景的摆拍照片；进一步的，视频生成模型可将照片生成为视频片段，并根据首尾帧生成视频转场，再生成虚拟模特讲解视频之后，多模态剧本生成和自动剪辑技术将全自动的制作出一条完整的带货视频，大幅降低了商家的内容制作成本。

据悉，多模态智能已经在淘宝AIGX技术体系发挥着越来越重要的作用。淘宝自研的推荐大模型“RecGPT”已全面接入手机淘宝首屏“猜你喜欢”信息流。这款百亿参数的多模态大模型，能对10万量级的上下文进行总结，理解长达十年的用户信息，全模态认知数亿商品，并结合世界知识进行推理。数据显示，搭载RecGPT的推荐信息流实现用户点击量增长超16%，用户加购次数和停留时长均提升超5%。

此外，郑波还介绍了近期发布的AI Agent——iFlow CLI。iFlow CLI支持命令行、IDE插件和Agent SDK等多种使用方式，提供完全免费的国产模型市场，涵盖编程、广告创意、学术写作、攻略制定、流程图绘制等多个应用场景，面向个人用户永久免费开放。

特别值得一提的是，为向业界共享AIGX技术体系创新能力，淘宝近期陆续开源了强化学习训练框架ROLL和生成式预估训练框架RecIS，通过强化学习和深度学习的大模型训练完整框架，打通从小模型到超大模型的训练落地路径，为推荐系统结合多模态大模型训练提供技术支撑。

本文来自投稿，不代表科技讯立场，如若转载，请注明出处：https://www.kejixun.co/article/736888.html

陈晨管理团队

0 0

产经

深耕鸿蒙生态创新全场景服务人民日报客户端以技术研发拓宽主流媒体信息服务边界

人工智能与万物互联技术的深度普及，改变了大众获取信息的场景与习惯。传统单一手机端、被动式的资讯阅读模式，已无法适配多终端协同、场景化触达、智能化交互的全新用户需求。作为主流媒体核心…

若安丶
9小时前
产经

世界杯观赛100寸电视推荐：海信E5S Pro看清每个细节

　　一场世界杯比赛的走向，往往从球员起脚前就开始了。　　2026世界杯K组第二轮，葡萄牙获得禁区弧顶任意球。C罗深呼吸、站定、盯球、绷紧身体，摆出标志性的主罚姿态。但下一秒，C罗…

若安丶
9小时前
产经

ROG玩家国度×索尼影业 7月29日与蜘蛛侠开启崭新之日

7月1日，ROG玩家国度正式官宣与索尼影业出品的超级英雄大片——《蜘蛛侠：崭新之日》达成合作，成为中国大陆地区电脑品类独家联合推广伙伴。这部由漫威与索尼联合出品的超级英雄大片将于7…

陈晨
10小时前
产经

不只是浏览，更是陪伴！华为浏览器做你的“全天候生活搭子”

在快节奏的都市生活中，浏览器作为看世界的窗口，正经历一场从“搜索工具”到“生活搭子”的蜕变。最近，华为浏览器发布的产品视频，以完整一日为叙事主线，跳出传统浏览器“单一搜索工具”定位…

陈晨
10小时前
欢聚（JOYY.US）旗下BIGO Ads 荣获 The Sammy 2026 年销售与营销卓越奖，AI广告技术能力获国际认可

欢聚集团（JOYY.US）旗下以深度学习为基础的智能广告平台 BIGO Ads 近日荣获 Business Intelligence Group 颁发的 The Sammy 202…

若安丶
产经 11小时前
产经

二次元DNA动了！微星神影16 魔龙姬限定款首发预约

微星品牌成立40周年之际，为回馈广大年轻玩家与二次元爱好者，微星笔记本人气IP联名机型 —— 神影16 魔龙姬限定款 2026，它来了！星云白清爽配色，魔龙姬专属元素，满功耗硬核性…

小丸子
12小时前
极速表现可观、提速表现出众，绿源 S86GT 战神依托四大核心优势正式上市

国内电摩消费市场正迎来需求升级，选购思路逐步从 “满足基础代步够用” 转向追求综合使用体验出众。当不少消费者不再满足于不少常规车型动力储备偏保守、内饰用料基础、智能化配置偏少的现状…

陈晨
产经 12小时前
持续投入绿色经营中国三星以低碳行动书写可持续发展新篇章

当技术创新加速改变世界，地球所面临的环境压力也更加引人深思。在发展和保护之间，在便利与责任之间，科技企业理应坚持低碳发展，保护人类家园。作为全球领先的科技企业，三星电子始终将可持续…

陈晨
产经 12小时前
产经

16强悬念拉满！世界杯观赛认准海信100寸电视：看清决胜瞬间

　　世界杯1/16决赛打响，首日欧洲豪门球队德国、荷兰同天相继折戟，次日，姆巴佩破门双响，法国队3:0大胜瑞典；哈兰德绝杀破门，助力挪威时隔28年重返世界杯16强。至此，赛前被称为…

若安丶
15小时前
产经

锚定实景落地深耕产业赛道吉翼智能发布全栈具身智能解决方案

在具身智能赛道，“被看见”和“被信赖”之间，吉翼智能选择了后者。产品进入真实产线被验证之前，这家企业几乎没有任何声量——没有跳舞视频，没有马拉松热搜，没有Demo刷屏。直到6月27…

陈晨
17小时前
产经

智梦可dreamok AI睡眠超充垫震撼上市以智驾级数据闭环重塑睡眠体验

2026年7月1日，智梦可dreamok AI睡眠超充垫正式在京东平台独家开启预售。作为睡眠科技行业的创新品类，AI睡眠超充垫凭借前期超千人的预约热度，以及京东首届“新兴Aidol…

陈晨
1天前
产经

新的外形比例？三星折叠屏新品亮相在即

2026年7月1日，三星在社交平台发布了六段趣味短视频，引发热议。结合三星将于7月举办新品发布会并推出新一代折叠屏机型的惯例，这些视频中的内容显然暗示了与即将登场的新品有关的一些信…

陈晨
1天前
软件定义高速总线赋能开放式航天信息系统 ——杨水华在第八届全国空间数据系统学术交流会作专题报告

近日，第八届全国空间数据系统学术交流会在湖南长沙举行。北京中航通用科技有限公司总经理杨水华受邀作题为《SDB软件定义高速总线技术及单芯片实现》的专题报告，围绕新一代高速总线技术发展…

李森
产经 1天前
产经

覆盖经营、员工、客户三大场景，京东政企业务以阳光采购平台助力长安汽车“业采融合”

在国家深入推进新型工业化、加快“人工智能+”行动落地的背景下，制造业正加速从“制造”向“智造+服务”转型升级。面对大型制造企业跨区域运营管理、员工福利普惠覆盖、客户服务提质增效等…

陈晨
1天前
买二手3C，综合平台和垂直平台怎么选？客观对比4大平台

想买二手手机或平板，打开App能看到好几类平台。有的什么都卖——手机、电脑、家具、服装、母婴用品全都有；有的只做3C——手机、平板、笔记本、耳机，围绕电子产品深耕。这两类平台没有高…

科技观察者
产经 1天前
产经

真正的差距，不在技术，而在赛场｜ITEC2026具身智能行业赛招募

　　01 所有商业的终极竞争，本质是「赛场维度」的竞争　　很多创业者误以为：科创竞争，拼的是谁的技术更极致。　　其实不是。技术决定你的下限，赛道决定你的上限。　　当下具身智能…

陈晨
1天前
产经

Cityline：与鸿蒙共建出境文娱体验，让每一次出行都智能无忧

6月13日，在HDC 2026耀星同行·全球生态发展高峰论坛上，中国香港领先的IT与票务解决方案公司Cityline分享了与华为鸿蒙的最新合作成果。通过接入鸿蒙生态，Citylin…

陈晨
2天前
樱花油烟机维修方便吗？数字化服务打造省心维保体验

买油烟机，很多人最担心的不是“好不好用”，而是“坏了怎么办”——维修要等多久？会不会被乱收费？找不找得到靠谱的人？这些焦虑往往比故障本身更让人头疼。樱花油烟机维修方便吗？答案其实藏…

潮玩君
产经 2天前
产经

别只盯着最强模型了，Agent 场景更该看这类 Flash 档模型

最近，GLM 5.2 接连刷屏，国产模型又热闹起来了。加上 DeepSeek V4、MiniMax M3，还有阶跃星辰的 Step-3.7-Flash，国产大模型这一波可以说是你…

好奇宝宝
2天前
中国移动联合华为打造的无线网络智能化方案斩获GSMA GLOMO Asia双料大奖

在2026 MWC 上海期间，中国移动联合华为创新打造的无线网络智能化解决方案，一举斩获GLOMO Asia “亚洲最佳AI驱动网络解决方案奖”、“亚洲最佳促进气候行动移动创新奖”…

若安丶
产经 2天前

发表回复

登录后才能评论

阿里巴巴中国电商事业群郑波：多模态智能是淘宝最重要的AI技术域

相关推荐

发表回复