‌腾讯发布AudioStory模型实现长篇叙事音频生成突破

若安丶 • 2025年9月1日 14:22:00 • AI

腾讯ARC团队近日推出创新性AudioStory模型，该模型通过结合大语言模型（LLMs）与音频生成系统，成功解决了传统文本转音频技术在长篇叙事中面临的时间连贯性与组合推理难题。这一突破为视频配音、音频延续和长篇叙事合成等多样化任务提供了全新解决方案。

AudioStory的核心在于其统一的理解与生成框架，能够将复杂叙事分解为时序子任务，同时保持场景转换与情感基调的一致性。其技术亮点包括创新的去耦合桥接机制，将大语言模型与音频生成器分工协作，以及端到端训练方式，显著提升了指令理解与音频生成的协同效应。

为验证模型性能，团队构建了包含动画音景和自然声音叙事的AudioStory-10K基准数据集。实验表明，该模型在单音频和长篇叙事生成任务中均超越现有技术，展现出卓越的指令跟随能力与音频质量。目前团队已公开推理代码，并发布《猫和老鼠》配音等演示案例，充分验证了其广泛适用性。

原创文章，作者：若安丶，如若转载，请注明出处：https://www.kejixun.co/article/732637.html

AudioStory LLMs 腾讯腾讯ARC

若安丶管理团队

0 0

AI

腾讯混元Hy3预览版周调用量达3.66万亿，跃居市场双第一

腾讯混元近日公布的最新数据显示，自Hy3预览版上线以来，模型Token调用量持续攀升，目前已达到前代模型Hy2的十倍之多。这一显著增长主要集中在代码及智能体应用场景，特别是在腾讯旗…

若安丶
3天前
AI

腾讯开源440MB超紧凑AI翻译模型，手机可离线运行

腾讯近日正式开源了一款名为Hy-MT1.5-1.8B-1.25bit的紧凑型AI翻译模型。该公司声称，该模型在保持高性能的同时，可在智能手机上完全离线运行。目前，Hy-MT支持包括…

若安丶
2026年5月3日
新闻

2026腾讯算法大赛人数再创新高！全球超13000名选手、5700多支队伍报名

截至北京时间4月24日，2026腾讯广告算法大赛报名阶段落幕，共吸引超13000名选手报名，组成超5700支队伍，报名人数、组队数量均刷新赛事历史纪录，围绕“大模型推荐系统中序列建…

若安丶
2026年4月27日
AI

腾讯发布开源混元Hy3 preview模型：295B参数聚焦Agent与实用性能

腾讯混元团队于昨日正式发布并开源Hy3 preview语言模型，这是混元大模型技术体系完成基础设施重建后的首个成果，也是首席AI科学家姚顺雨入职后主导发布的首款模型。Hy3 pre…

柠萌
2026年4月24日
新闻

腾讯发布出行全场景智能体开放平台，升级座舱智能体解决方案

腾讯发布“出行全场景智能体开放平台”，覆盖基础能力、平台工具到应用生态全栈，助力车企加速智能化落地。其座舱大模型实现毫秒级响应，七大场景智能体重塑用户出行体验，如随行点单智能体精准匹配行程与餐饮需求。目前腾讯服务超100家车企，智能座舱方案渗透率达80%，并加速全球化布局，支撑中国车企出海合规发展。

潮玩君
2026年4月23日
新闻

腾讯汤道生：汽车智能化不止是“把AI装上车”，更是“用AI重构车企”

未来车企的差距，将取决于AI规模化落地的速度。腾讯通过”车云一体”战略，助力40多家主流车企构建”可感知、会思考、能执行”的智能汽车，并重塑研发、营销等全链路运营——如一汽大众销售线索成本降低25%，到店转化率提升30%。

潮玩君
2026年4月23日
商业

传腾讯阿里正洽谈投资DeepSeek，估值或超200亿美元

据科技媒体The Information报道，腾讯控股与阿里巴巴集团正就投资AI初创公司DeepSeek展开洽谈。若交易达成，DeepSeek的估值将超过200亿美元，约合1367…

商业头条
2026年4月23日
AI

腾讯推出具身智能基础模型HY-Embodied-0.5

腾讯Robotics X实验室联合混元团队近日正式推出专为具身智能打造的基础模型HY-Embodied-0.5，旨在解决通用视觉语言模型因缺乏精细三维空间感知与物理交互能力、难以落…

AI
2026年4月11日
AI

腾讯宣布QClaw V2大版本上线

4月10日，腾讯宣布QClaw V2大版本上线，新版本（V0.2.5）实现多Agent、应用连接器和龙虾管家三大核心能力，支持用户创建多个Agent，每个Agent可自定义不同的专…

苹果派
2026年4月10日
新闻

腾讯发布2025年ESG报告：加速绿电转型，完善AI治理，推动可持续社会价值创新

2026年4月9日，腾讯发布了2025年ESG（即“环境、社会及管治”）报告。腾讯在AI驱动下实现高质量增长，并实现内部治理提升，其ESG表现也获得广泛认可。报告详细披露了腾讯在…

苹果派
2026年4月9日
AI

腾讯上线浏览器“龙虾”QQ浏览器QBotClaw

4月9日，据报道，腾讯正式发布国内首个浏览器“龙虾”QBotClaw，支持用户自由配置国内各大主流大模型 API Key，内置QQ浏览器Skill，用户直接提问即可使用，实现人人都…

小丸子
2026年4月9日
AI

微信推出官方龙虾插件 “ClawBot”插件官方教程发布

3月23日，据报道，昨日下午微信正式推出微信“ClawBot”插件，支持接入 OpenClaw。用户扫码或复制命令，即可将 OpenClaw 接入微信。连接后，用户就能通过微信聊天…

科技观察者
2026年3月23日
商业

腾讯发布2025年财报 ToB业务与AI战略双轮驱动增长

昨日，腾讯控股发布2025年第四季度及全年业绩报告。数据显示，公司继续保持稳健增长态势，第四季度营收同比增长13%，达到1943.7亿元，全年营收总额攀升至7517.7亿元。这份亮…

商业头条
2026年3月19日
新闻

马化腾详解腾讯AI战略：“龙虾”打开新场景，2026年投入将翻倍

3月19日，据报答，在昨日举办的腾讯控股2025年第四季度及全年业绩发布会上，腾讯CEO马化腾与总裁刘炽平围绕近期爆火的“龙虾”类AI应用、微信AI布局及未来战略规划给出详尽回应。…

若安丶
2026年3月19日
新闻

腾讯2025年游戏营收同比增长22%，长青、出海、AI驱动游戏业务增长

3月18日，腾讯控股（00700.HK）发布2025年第四季度及全年财报。游戏作为核心业务增长稳健，全年游戏业务收入达2416亿元，同比增长22%。其中，本土市场游戏年收入同比增长…

泡沫大盗
2026年3月18日
AI

腾讯 QQ 机器人接入 OpenClaw，官方“养虾”指南发布

3月17日，据报道，腾讯技术工程官方宣布，QQ机器人已正式接入OpenClaw，并同步发布“养虾”指南，为用户提供从创建机器人到安装插件的全流程指引。用户首先通过QQ机器人开放平…

李森
2026年3月17日
新闻

OpenClaw开发者指责腾讯未经授权抓取数据，腾讯回应称系镜像站

近日，热门智能体项目OpenClaw的开发者Peter Steinberger在社交平台X上公开指责腾讯，称其未经授权抓取了ClawHub平台的所有技能数据，用于构建自家的Skil…

聆听
2026年3月13日
AI

腾讯龙虾技能社区 SkillHub 上线，专为中国用户优化

腾讯云于3月11日宣布，专为中国用户打造的SkillHub技能平台正式上线，包含13000多个针对OpenClaw生态的“龙虾技能”。同时，腾讯旗下10余款产品已完成技能化改造，用…

小丸子
2026年3月12日
AI

腾讯版小龙虾 WorkBuddy 爆火致服务不稳定，公司致歉并紧急扩容

3月10日，腾讯旗下全场景 AI 智能体 WorkBuddy 昨日正式上线，但随后便出现了服务器不稳定的问题。对此，腾讯云代码助手（CodeBuddy）团队昨晚发布致歉信。据介绍…

科技观察者
2026年3月10日
新闻

马化腾谈腾讯免费安装 OpenClaw 引排队：没想到会这么火

3月9日，据报道，腾讯公司创始人马化腾在朋友圈转发有关腾讯免费为用户安装“龙虾”的相关新闻，并表示“没有想到会这么火”。据悉，近日，腾讯云公众号，腾讯宣布免费安装 OpenCla…

柠萌
2026年3月9日

发表回复

登录后才能评论

‌腾讯发布AudioStory模型 实现长篇叙事音频生成突破

相关推荐

发表回复

‌腾讯发布AudioStory模型实现长篇叙事音频生成突破