AI
-
谷歌推出A2UI标准,AI从此能“画”界面
近日,谷歌正式发布开源标准A2UI(Agent-to-User Interface),彻底改变AI与人类交互的方式——不再仅靠文字回复,而是能直接生成可操作的图形界面。在餐厅预订、…
-
ChatGPT上线“情绪旋钮”,用户可自定义AI热情度
据报道,OpenAI近日在ChatGPT中悄然上线“热情度调节”功能,用户 now 可在个性化设置中选择“更多”“更少”或“默认”三档情绪强度,精准控制AI的温暖感、兴奋语气与表情…
-
Claude插件全量开放,浏览器变身AI编程工作站
Anthropic昨日正式宣布,Claude Chrome扩展插件向所有Pro、Team与Enterprise付费用户全面开放,无需申请、即装即用,标志着AI助手从对话工具向操作系…
-
阿里巴巴通义千问发布Qwen-Image-Layered 颠覆图像编辑规则
阿里巴巴通义千问团队近日发布革命性模型Qwen-Image-Layered,首次实现将普通照片自动分解为多个可独立编辑的RGBA图层,彻底打破AI图像编辑“整体重绘”的局限。用户无…
-
OpenAI利润率飙升至70%,付费模式成盈利破局关键
在人工智能赛道白热化竞争下,OpenAI悄然完成一次关键转型——截至今年10月,其算力利润率已攀升至70%,较2024年底的52%大幅跃升,几乎是年初水平的两倍。这一内部指标反映其…
-
腾讯元宝上线微信智能提醒功能 一句话即可设置日程提醒
昨日,腾讯旗下AI助手”元宝”宣布推出重磅新功能,用户现在只需在微信聊天窗口发送一句包含事项和时间的内容(如”明天下午3点开会”),…
-
OpenAI升级ChatGPT未成年人保护机制 安全优先于思想自由
据外媒The Verge今日报道,OpenAI正在对其聊天机器人ChatGPT进行重要调整,新增针对18岁以下用户的识别与保护机制。昨日公布的模型规范更新中,OpenAI明确将青少…
-
苹果推出全能AI模型UniGen 1.5 实现图像理解、生成与编辑三合一
近日,科技媒体9to5Mac报道称,苹果研究团队近日发布了多模态AI模型UniGen 1.5,该模型首次在单一系统中集成了图像理解、生成与编辑三大核心功能,标志着视觉AI技术的重大…
-
OpenAI发布GPT-5.2-Codex:智能体编程新标杆,Win11环境优化显著
今日,OpenAI正式推出其迄今最前沿的智能体编程AI模型GPT-5.2-Codex,该模型专为解决复杂现实软件工程问题设计,在通用智能和终端操作能力上实现双重突破。基于GPT-5…
-
Meta 发布 SAM Audio 可实现从视频一键提取某个声音
12月18日,Meta 今日发布了首个统一的多模态音频分离模型 —— SAM Audio。Meta 表示 SAM Audio 是一个“最先进的统一模型”,通过使用自然的、多模态的提…
-
苹果开源SHARP AI模型:1秒将2D照片变3D场景
据科技媒体9to5Mac昨日报道,苹果公司正式开源名为SHARP的新型AI模型,该技术突破性地实现了单张2D照片到逼真3D场景的秒级转换。根据苹果发布的论文《一秒内实现清晰的单目视…
-
谷歌Gemini 3 Flash发布,部分测试超越GPT-5.2
北京时间今日凌晨,谷歌在Gemini 3 Pro发布不到一个月后,迅速推出更注重效率的Gemini 3 Flash模型,直接对标OpenAI的GPT-5.2。此次发布被业界视为谷歌…
-
Meta暂停开放Horizon OS系统 元宇宙战略转向AI
Meta公司近日宣布暂停向第三方设备制造商开放其混合现实操作系统Meta Horizon OS的合作计划。该系统作为Quest系列头显设备的核心驱动系统,此前被视为Meta元宇宙战…
-
小米网页 AI 聊天服务惊喜亮相,MiMo-V2-Flash 模型发布、代码能力开源最强
12月17日,小米发布 Xiaomi MiMo-V2-Flash 开源 MoE 模型,总参数量 309B,活跃参数量 15B,专为智能体 AI 设计,专注于快。 小米官方介绍称,这…
-
小米大模型负责人罗福莉首秀:MiMo-V2-Flash进入全球开源模型Top2
12月17日,在今日2025小米人车家全生态合作伙伴大会上,小米MiMo大模型负责人罗福莉发表《Xiaomi MiMo:小米基座大模型》主题演讲。 今年11月,前DeepSeek研…
-
OpenAI 最强 AI 生图模型登场,奥尔特曼变身性感消防员
12月17日,据报道,OpenAI 发布博文,推出“全新旗舰 ChatGPT 图像生成模型”GPT Image 1.5,并罕见公开了该项目背后的庞大研发团队名单,并同步在 Chat…
-
斯坦福发布全球AI竞争力排名:美国领跑中国印度分列二三
斯坦福大学近日通过全球人工智能活力工具(Global AI Vibrancy Tool)发布最新数据,揭晓全球人工智能竞争力前30强国家榜单。评估综合研究成果、投资规模、人才吸引及…
-
阿里巴巴开源”百聆”语音大模型 3秒录音可克隆音色并切换9国语言
阿里巴巴通义大模型近日宣布,其”百聆”系列语音模型完成重大升级并正式开源。此次发布的两款新型语音模型突破性实现了仅需3秒录音即可无缝切换9种语言和18种方言…
-
谷歌翻译新功能上线:普通耳机秒变实时同声传译器
据TechCrunch报道,谷歌翻译应用近日推出突破性测试功能——用户仅需佩戴任意耳机,即可实时听到精准翻译的语音,且完整保留原始说话者的语气、重音与语调。这一创新将普通耳机转化为…
-
ChatGPT”成人模式”2026年上线 OpenAI加紧测试年龄识别系统
OpenAI应用主管Fidji Simo近日透露,ChatGPT备受期待的”成人模式”预计将于2026年第一季度正式上线。该模式将为用户提供更开放多元的内容…
-
微软Copilot AI强制登陆LG电视引争议 用户无法卸载
据Reddit用户反馈,微软Copilot AI应用近期通过系统更新被自动安装至LG电视的webOS平台,且无法手动卸载,用户仅能选择忽略该应用。这一强制集成引发广泛争议,标志着A…
-
OpenAI:人类打字速度或成AGI发展瓶颈
据《商业内幕》报道,OpenAI Codex产品负责人Alexander Embiricos近日在《Lenny’s Podcast》播客中提出,人类打字速度可能成为通用…
-
OpenAI GPT-5.2被曝作弊:算力堆砌下的虚假胜利?
科技圈的戏剧性反转来得猝不及防。近日还在为OpenAI发布GPT-5.2的”碾压性表现”欢呼的AI社区,却被一则爆料推入争议漩涡——有用户指出,OpenAI…
-
谷歌开源 Gemini Deep Research 深度研究智能体 对抗 OpenAI GPT-5.2
12月12日,在 OpenAI 发布 GPT-5.2 之后,谷歌紧接着就推出了更强大的 Gemini Deep Research 深度研究智能体,同时推出全新交互 API(Inte…
-
纽约州签署美国首批AI法案 要求广告披露AI生成内容
纽约州州长Kathy Hochul于12月11日正式签署S.8420-A/A.8887-B号法案,该法案被称作美国首批专门针对人工智能的立法之一,旨在提升影视行业透明度并保护消费者…
-
OpenAI升级GPT至5.2版本 应对谷歌双子座3竞争压力
当地时间12月11日,OpenAI宣布推出其人工智能模型GPT的最新升级版本GPT-5.2,此举被视为对谷歌公司11月发布的“双子座3”人工智能模型的直接回应。面对谷歌在生成式AI…
-
阿里发布Qwen3-Omni-Flash全模态大模型 支持119种语言交互与自定义AI人设
近日,阿里Qwen团队推出新一代原生全模态大模型Qwen3-Omni-Flash-2025-12-01,该模型在Qwen3-Omni基础上实现全面升级,支持文本、图像、音视频的无缝…
-
ChatGPT登顶2025年美国iPhone免费应用下载榜 标志AI应用时代全面到来
苹果公司本周三发布的2025年度美国市场应用榜单显示,OpenAI旗下ChatGPT首次荣登非游戏类免费iPhone应用下载榜首,标志着人工智能技术已深度融入美国用户日常生活。该应…
-
OpenAI 宣布接入 Adobe Photoshop、Acrobat
12月11日,OpenAI 宣布,即日起用户可以在 ChatGPT 内使用 Photoshop、Acrobat 和 Adobe Express。这三款应用在 OpenAI 网站可免…
-
阿里通义千问发布Qwen3-TTS语音合成AI模型 支持49种音色与多方言
近日,阿里通义千问正式推出新一代语音合成AI模型Qwen3-TTS,该模型通过Qwen API开放访问,在音色多样性、多语种支持及拟人化表现上实现显著突破。 Qwen3-TTS提供…