AI
-
昆仑万维全球首发AI音乐单曲《Digital Heartbeat》 展现多语言创作实力
今日,昆仑万维集团正式宣布由最新Mureka V7.5模型创作的AI音乐单曲《Digital Heartbeat》全球首发。这首时长1分47秒的作品全程由AI生成,不仅包含10种语…
-
通义千问推出Qwen3-ASR-Flash语音识别模型:歌声识别错误率低于8%
在全球语音识别技术快速发展的背景下,通义千问今日正式发布其最新语音识别模型Qwen3-ASR-Flash。该模型基于Qwen3基座模型,经过海量多模态数据及数千万小时自动语音识别(…
-
AI行业人才争夺白热化:MiniMax与字节跳动豪掷期权激励
近日,MiniMax和字节跳动相继启动大规模期权激励计划,反映出行业对顶尖人才的迫切需求。据《科创板日报》报道,MiniMax已开始实施期权增发,激励金额从数十万美元到数百万美元不…
-
微软开源140亿参数AI模型rStar2-Agent 性能超越千亿级对手
微软近日在AI领域取得重大突破,开源了一款名为rStar2-Agent的智能推理模型。该模型仅用140亿参数,就在AIME24数学推理测试中达到80.6%的准确率,远超拥有6710…
-
苹果自研AI搜索产品WKA明年3月上线 将整合至Siri与Safari
上月初,彭博社披露苹果正在秘密开发一款名为”World Knowledge Answers”(WKA)的生成式AI搜索产品,由新成立的”答案、知…
-
谷歌Gemini推出”Nano Banana”模型:一键将照片变手办
继ChatGPT掀起”吉卜力、像素风”AI生图热潮后,谷歌Gemini 2.5 Flash Image(代号Nano Banana)模型近日上线”…
-
谷歌Veo 3模型登陆Google Photos 静态照片秒变4秒视频
谷歌今日宣布,其最新AI视频生成模型Veo 3已正式集成至第一方相册应用Google Photos,美国用户现可通过“创建”选项卡中的“细微动作”或“手气不错”功能,将静态照片一键…
-
DeepL进军企业AI智能体市场 挑战微软OpenAI巨头地位
德国知名翻译技术公司DeepL近日宣布战略转型,正式进军企业通用AI智能体领域。这家估值20亿美元的初创企业推出的新型智能体产品,能够通过自然语言指令跨部门执行人力资源、市场营销等…
-
OpenAI宣布向所有免费用户开放ChatGPT的Projects功能
北京时间9月4日,OpenAI正式宣布向所有免费用户开放ChatGPT的Projects功能,这项曾被视作付费特权的高级工具,如今成为全民共享的智能助手。这一变革预计将惠及全球超过…
-
温州加挂”人工智能局”开创浙江先河 政教联动构建AI发展新生态
9月3日下午,温州市数据局正式加挂”温州市人工智能局”牌子,标志着浙江省首个市级人工智能行政管理机构诞生。这一创新举措不仅凸显了温州布局人工智能产业的决心,…
-
腾讯混元翻译模型Hunyuan-MT-7B开源 国际比赛斩获30项第一
近日,腾讯宣布其轻量级翻译模型Hunyuan-MT-7B正式开源,该模型在国际机器翻译领域表现惊艳。在刚刚结束的ACL WMT2025比赛中,Hunyuan-MT-7B以7亿参数的…
-
AI生成内容强化标识 多家平台更新用户协议
近日,据国家网信办等四部门联合发布的《人工智能生成合成内容标识办法》(以下简称《标识办法》)正式施行,所有AI生成的文字、图片、视频等内容均须“亮明身份”。新规落地之际,多家互联网…
-
Nvidia发布Nemotron-Nano-9B-v2小型语言模型 推理速度提升6倍
英伟达(Nvidia)近日正式推出新型小型语言模型Nemotron-Nano-9B-v2,进一步推动小型模型的技术发展。该模型拥有9亿参数,虽比同类小型模型规模更大,但较原始12亿…
-
x AI被曝已起诉前员工窃取商业机密转投OpenAI
9月2日,据媒体报道,马斯克xAI公司正在起诉其前员工Xuechen Li,指控其窃取与Grok人工智能聊天机器人相关的商业机密,并将其带到了竞争对手OpenAI。马斯克发帖称,L…
-
苹果FastVLM模型开放试用:Mac用户秒享“闪电级”视频字幕
据外媒9to5Mac昨日报道,苹果公司在Hugging Face平台推出了FastVLM视觉语言模型的浏览器试用版。该模型以“闪电般”的视频字幕生成速度著称,仅需搭载Apple S…
-
美团开源高效AI大模型LongCat-Flash-Chat 性能与算力平衡再突破
近日,美团正式发布并开源其最新AI大模型LongCat-Flash-Chat,该模型以5600亿总参数和186亿至313亿激活参数的动态范围,实现了计算效率与性能的卓越平衡。其核心…
-
腾讯发布AudioStory模型 实现长篇叙事音频生成突破
腾讯ARC团队近日推出创新性AudioStory模型,该模型通过结合大语言模型(LLMs)与音频生成系统,成功解决了传统文本转音频技术在长篇叙事中面临的时间连贯性与组合推理难题。这…
-
医疗AI新突破:MedResearcher-R1框架发布,助力智能医疗研究
近日,针对医疗领域AI推理的挑战,MedResearcher-R1知识驱动轨迹合成框架正式发布。该框架通过智能化的数据生成与合成技术,为医疗研究提供全新支持,其核心创新在于三大集成…
-
Meta被曝将在应用中使用谷歌、OpenAI模型
9月1日,据报道Meta正考虑与竞争对手谷歌或OpenAI建立合作,以增强其应用中的人工智能功能。 据报道称,Meta新成立的人工智能机构“Meta超级智能实验室”(Meta Su…
-
小米AI眼镜开启新功能内测 招募200名用户体验支付宝扫码等创新功能
据报道,小米官方宣布启动AI眼镜新功能内测计划,面向全国招募200名”米粉”参与体验。此次内测将重点测试支付宝”看一下”支付、小爱随…
-
xAI推出Grok Code Fast 1:低成本智能代码生成模型挑战行业格局
据外媒报道,埃隆·马斯克旗下人工智能初创公司xAI于周四正式发布智能代码生成模型Grok Code Fast 1,以“快速且经济”为核心卖点,切入AI企业竞争激烈的代码助手领域。该…
-
夸克加速AI生态布局:推出“造点”创作平台,加码教育及硬件赛道
据报道,阿里旗下智能搜索平台夸克正在研发一款名为“造点”的AI产品,定位为“融合AI创作与内容互动表达的平台”。尽管具体功能细节尚未披露,但该产品标志着夸克在内容生成领域的进一步探…
-
微软推出其首款自研 AI 模型:MAI-Voice-1 秒级生成音频
8月29日,微软人工智能部门正式推出其首批两款自研 AI 模型 ——MAI-Voice-1 语音模型与 MAI-1-preview 通用模型。据微软介绍,全新的 MAI-Voice…
-
微软推出自研AI双模型:MAI-Voice-1秒级生成音频,MAI-1-preview重塑Copilot未来
当地时间周四,微软人工智能部门正式发布首批两款自研AI模型——MAI-Voice-1语音模型与MAI-1-preview通用模型,标志着其在AI领域的技术自主化迈出关键一步…
-
OpenAI Realtime API正式上线:支持情感感知与多语言切换
OpenAI近日宣布其“Realtime API”正式结束测试阶段(Beta),投入生产环境。这一面向企业与开发者的新API,核心搭载了gpt-realtime语音对话模型,采…
-
云知声2025年中期业绩:营收同比增加20.2%,大模型收入飙涨457%
8月28日,云知声(9678.HK)发布截至2025年6月30日止六个月的中期业绩公告。 2025年上半年,云知声实现营业收入4.05亿元人民币,同比增长20.2%;其中,大模型收…
-
AI新星GPT-5仅用9517步通关《宝可梦水晶》 效率远超前代
近日,在一场引发全球关注的AI对决中,OpenAI最新模型GPT-5以惊人的9517步成功通关经典游戏《宝可梦水晶》,击败终极对手赤爷(Red)。这一表现不仅让直播观众刷屏“GG”…
-
OpenAI拟改进ChatGPT 以更好地支持存在心理困扰的用户
8月28日,OpenAI拟改进ChatGPT,旨在更精准地识别用户的心理与情绪困扰信号,并做出更恰当的回应。该公司在一篇博客文章中表示:“近期发生了多起令人痛心的案例——人们在严重…
-
OpenAI与Anthropic互评AI模型:GPT被指存在谄媚行为,Claude抗幻觉能力突出
据外媒Engadget报道,OpenAI与Anthropic近日宣布将互相评估对方公开AI系统的安全对齐情况,并共享分析结果。这一举措引发业界关注,尤其是在两家公司此前因技术合作纠…
-
全球首个 AI 勒索软件现身:滥用 OpenAI 开源模型,跨平台搜索、窃取、加密文件
8月27日,网络安全公司 ESET 昨日发布博文,报告发现“全球首个 AI 勒索软件”,并将其命名为 PromptLock,调用 gpt-oss:20b 模型在受感染设备本地生成恶…