AI
-
AI突破引力波探测瓶颈:Deep Loop Shaping技术将低频噪声降至1/100
据外媒报道称,谷歌DeepMind与LIGO(激光干涉仪引力波探测器)团队、GSSI(格兰萨索科学研究所)合作开发的Deep Loop Shaping技术取得重大突破,成功解决…
-
阿里云开源Qwen3-Next大模型架构 80B参数版本实现十倍推理效率提升
阿里云通义团队今日正式发布下一代基础模型架构Qwen3-Next,并开源基于该架构的Qwen3-Next-80B-A3B系列模型(含Instruct与Thinking版本)。这一创…
-
Stable Audio2.5发布:AI音频生成迈入多段创作时代
Stability AI近日推出其最新音频生成模型Stable Audio2.5,标志着专业音效制作效率的又一次飞跃。该模型通过创新的多段音乐生成能力,可完整创作包含引子、发展和尾…
-
微软Copilot推出全新音频模式 三种语音场景满足多样化需求
微软近日在其Copilot工具中创新性地推出了基于自主研发MAI-Voice-1模型的Copilot Audio音频模式,为用户提供了三种截然不同的语音交互方式。这一突破性进展不仅…
-
阿联酋推出全球最快开源AI模型K2Think 性能超越万亿参数巨头
近日,阿联酋穆罕默德·本·扎耶德人工智能大学(MBZUAI)与初创公司G42AI联合发布了新一代开源大语言模型K2Think,该模型自称”全球最快的开源AI模型R…
-
腾讯开源文生图模型混元图像2.1 支持2K分辨率与复杂语义生成
腾讯近日正式发布其最新开源文生图模型”混元图像2.1(HunyuanImage2.1)”,该模型在生成效果与性能间实现显著平衡,原生支持2K分辨率图像生成,…
-
微软引入Anthropic AI技术 结束对OpenAI的独家依赖
据The Information报道,微软公司将付费使用Anthropic的AI技术为Office365应用提供支持,标志着其结束了在办公套件中完全依赖OpenAI技术的策略。根据…
-
阿里巴巴集团与荣耀宣布全面深化战略合作,覆盖AI、云等多个领域
9月9日,阿里云官方渠道宣布,阿里巴巴集团与荣耀宣布全面深化战略合作,合作覆盖AI云基础设施、AI模型、AI智能体(Agent)生态等多个领域,以及线上线下商业生态。这是阿里巴巴…
-
昆仑万维全球首发AI音乐单曲《Digital Heartbeat》 展现多语言创作实力
今日,昆仑万维集团正式宣布由最新Mureka V7.5模型创作的AI音乐单曲《Digital Heartbeat》全球首发。这首时长1分47秒的作品全程由AI生成,不仅包含10种语…
-
通义千问推出Qwen3-ASR-Flash语音识别模型:歌声识别错误率低于8%
在全球语音识别技术快速发展的背景下,通义千问今日正式发布其最新语音识别模型Qwen3-ASR-Flash。该模型基于Qwen3基座模型,经过海量多模态数据及数千万小时自动语音识别(…
-
AI行业人才争夺白热化:MiniMax与字节跳动豪掷期权激励
近日,MiniMax和字节跳动相继启动大规模期权激励计划,反映出行业对顶尖人才的迫切需求。据《科创板日报》报道,MiniMax已开始实施期权增发,激励金额从数十万美元到数百万美元不…
-
微软开源140亿参数AI模型rStar2-Agent 性能超越千亿级对手
微软近日在AI领域取得重大突破,开源了一款名为rStar2-Agent的智能推理模型。该模型仅用140亿参数,就在AIME24数学推理测试中达到80.6%的准确率,远超拥有6710…
-
苹果自研AI搜索产品WKA明年3月上线 将整合至Siri与Safari
上月初,彭博社披露苹果正在秘密开发一款名为”World Knowledge Answers”(WKA)的生成式AI搜索产品,由新成立的”答案、知…
-
谷歌Gemini推出”Nano Banana”模型:一键将照片变手办
继ChatGPT掀起”吉卜力、像素风”AI生图热潮后,谷歌Gemini 2.5 Flash Image(代号Nano Banana)模型近日上线”…
-
谷歌Veo 3模型登陆Google Photos 静态照片秒变4秒视频
谷歌今日宣布,其最新AI视频生成模型Veo 3已正式集成至第一方相册应用Google Photos,美国用户现可通过“创建”选项卡中的“细微动作”或“手气不错”功能,将静态照片一键…
-
DeepL进军企业AI智能体市场 挑战微软OpenAI巨头地位
德国知名翻译技术公司DeepL近日宣布战略转型,正式进军企业通用AI智能体领域。这家估值20亿美元的初创企业推出的新型智能体产品,能够通过自然语言指令跨部门执行人力资源、市场营销等…
-
OpenAI宣布向所有免费用户开放ChatGPT的Projects功能
北京时间9月4日,OpenAI正式宣布向所有免费用户开放ChatGPT的Projects功能,这项曾被视作付费特权的高级工具,如今成为全民共享的智能助手。这一变革预计将惠及全球超过…
-
温州加挂”人工智能局”开创浙江先河 政教联动构建AI发展新生态
9月3日下午,温州市数据局正式加挂”温州市人工智能局”牌子,标志着浙江省首个市级人工智能行政管理机构诞生。这一创新举措不仅凸显了温州布局人工智能产业的决心,…
-
腾讯混元翻译模型Hunyuan-MT-7B开源 国际比赛斩获30项第一
近日,腾讯宣布其轻量级翻译模型Hunyuan-MT-7B正式开源,该模型在国际机器翻译领域表现惊艳。在刚刚结束的ACL WMT2025比赛中,Hunyuan-MT-7B以7亿参数的…
-
AI生成内容强化标识 多家平台更新用户协议
近日,据国家网信办等四部门联合发布的《人工智能生成合成内容标识办法》(以下简称《标识办法》)正式施行,所有AI生成的文字、图片、视频等内容均须“亮明身份”。新规落地之际,多家互联网…
-
Nvidia发布Nemotron-Nano-9B-v2小型语言模型 推理速度提升6倍
英伟达(Nvidia)近日正式推出新型小型语言模型Nemotron-Nano-9B-v2,进一步推动小型模型的技术发展。该模型拥有9亿参数,虽比同类小型模型规模更大,但较原始12亿…
-
x AI被曝已起诉前员工窃取商业机密转投OpenAI
9月2日,据媒体报道,马斯克xAI公司正在起诉其前员工Xuechen Li,指控其窃取与Grok人工智能聊天机器人相关的商业机密,并将其带到了竞争对手OpenAI。马斯克发帖称,L…
-
苹果FastVLM模型开放试用:Mac用户秒享“闪电级”视频字幕
据外媒9to5Mac昨日报道,苹果公司在Hugging Face平台推出了FastVLM视觉语言模型的浏览器试用版。该模型以“闪电般”的视频字幕生成速度著称,仅需搭载Apple S…
-
美团开源高效AI大模型LongCat-Flash-Chat 性能与算力平衡再突破
近日,美团正式发布并开源其最新AI大模型LongCat-Flash-Chat,该模型以5600亿总参数和186亿至313亿激活参数的动态范围,实现了计算效率与性能的卓越平衡。其核心…
-
腾讯发布AudioStory模型 实现长篇叙事音频生成突破
腾讯ARC团队近日推出创新性AudioStory模型,该模型通过结合大语言模型(LLMs)与音频生成系统,成功解决了传统文本转音频技术在长篇叙事中面临的时间连贯性与组合推理难题。这…
-
医疗AI新突破:MedResearcher-R1框架发布,助力智能医疗研究
近日,针对医疗领域AI推理的挑战,MedResearcher-R1知识驱动轨迹合成框架正式发布。该框架通过智能化的数据生成与合成技术,为医疗研究提供全新支持,其核心创新在于三大集成…
-
Meta被曝将在应用中使用谷歌、OpenAI模型
9月1日,据报道Meta正考虑与竞争对手谷歌或OpenAI建立合作,以增强其应用中的人工智能功能。 据报道称,Meta新成立的人工智能机构“Meta超级智能实验室”(Meta Su…
-
小米AI眼镜开启新功能内测 招募200名用户体验支付宝扫码等创新功能
据报道,小米官方宣布启动AI眼镜新功能内测计划,面向全国招募200名”米粉”参与体验。此次内测将重点测试支付宝”看一下”支付、小爱随…
-
xAI推出Grok Code Fast 1:低成本智能代码生成模型挑战行业格局
据外媒报道,埃隆·马斯克旗下人工智能初创公司xAI于周四正式发布智能代码生成模型Grok Code Fast 1,以“快速且经济”为核心卖点,切入AI企业竞争激烈的代码助手领域。该…
-
夸克加速AI生态布局:推出“造点”创作平台,加码教育及硬件赛道
据报道,阿里旗下智能搜索平台夸克正在研发一款名为“造点”的AI产品,定位为“融合AI创作与内容互动表达的平台”。尽管具体功能细节尚未披露,但该产品标志着夸克在内容生成领域的进一步探…