研究显示：AI模型存在“过度谄媚”倾向

柠萌 • 2026年3月28日 10:11:00 • 新闻

昨日傍晚，有媒体报道了一项发表在新一期美国《科学》杂志上的研究，结果显示，当人们就人际困境等问题向人工智能模型寻求建议时，AI常常表现出过度迎合甚至谄媚的倾向。这项由美国斯坦福大学研究团队开展的测试覆盖了ChatGPT、“克劳德”等11个主流AI系统，结果发现它们均存在不同程度的此类问题。

研究团队利用网络论坛中用户公认发帖者有错的真实案例，编写了2000条提示，并结合涉及欺骗等有害行为的陈述进行测试。数据显示，在一般性建议测试中，AI模型认同用户的几率比人类高出49%；即使在面对有害行为时，仍有47%的几率对用户立场表示认可。这种迎合倾向不仅削弱了建议的客观性，还可能对使用者，尤其是处于大脑发育和社会规范形成关键期的青少年构成潜在风险。

有趣的是，研究团队在招募超过2400名参与者后发现，人们普遍认为谄媚式的回应更值得信赖，并表示更倾向于再次使用这类AI。研究人员对此发出警告，指出AI一味反馈迎合建议会损害人们的社交能力，将其定性为“安全问题”。他们呼吁以更严格的标准监管AI模型，防止道德层面不安全的系统泛滥，同时提醒公众在向AI寻求社交建议时保持谨慎，切勿将其视为真人的替代品。

原创文章，作者：柠萌，如若转载，请注明出处：https://www.kejixun.co/article/748649.html

AI 人工智能科学

柠萌管理团队

0 0

产品

马斯克将xAI并入SpaceX，新公司SpaceXAI瞄准太空算力

马斯克的AI版图迎来重大调整。在撤销独立公司xAI之后，全新的SpaceXAI正在建立。美国专利部门网站显示，马斯克已提交SpaceXAI的商标注册申请，其中一份明确指向太空算力方…

聆听
1天前
AI

火山引擎推出业界首个“Agent套餐包”，大模型竞争转向工具链整合

昨日，火山引擎正式发布业界首个“Agent套餐包”——Agent Plan，标志着AI应用正加速从单一的编程辅助向通用智能体跨越。该计划突破了传统模型订阅的单一维度，深度整合了字节…

若安丶
1天前
AI

阿里巴巴推出“AI店小蜜”，电商客服进入智能体时代

近日，阿里巴巴正式推出全新的“AI店小蜜”，这是电商领域首个同时具备售前咨询与售后办事能力的客服Agent产品。该产品全链路基于通义千问最新大模型构建，并深度融合淘宝海量交易数据进…

野游栗
2天前
AI

日本组建跨部门工作组，加速培养AI和半导体等战略领域人才

日本政府近期决定成立一个跨部门工作组，专门为人工智能、半导体、量子技术、造船和国防制造等战略性行业培训人才。据《读卖新闻》报道，东京正在协调创建一个名为“再技能与人才发展促进委员会…

happy
2天前
新闻

黄仁勋寄语应届生：别怕AI，当下是开启事业的最佳时机

英伟达创始人兼CEO黄仁勋近日出席卡内基梅隆大学2026年毕业典礼并发表演讲，他鼓励即将走出校园的应届生们不必畏惧人工智能，强调AI将为人类整体带来积极影响，而当下正是开启事业的最…

小科同学
2天前
AI

菲尔兹奖得主用ChatGPT 5.5 Pro一小时攻克数学难题，学界面临伦理拷问

剑桥大学教授、菲尔兹奖得主蒂莫西·高尔斯近日在其博客上披露了一段令人震撼的经历：他使用尚未公开发布的ChatGPT 5.5 Pro，在一小时内攻克了一个困扰数学界已久的组合数学开放…

AI
3天前
新闻

字节跳动今年AI基础设施支出上调至2000亿元，加大对国产芯片投入

据《南华早报》援引知情人士消息，TikTok母公司字节跳动已将今年的AI基础设施计划支出提高了25%，达到2000亿元人民币。在内存芯片成本持续上涨的背景下，这家科技巨头正进一步加…

李森
3天前
AI

亚马逊Alexa+登陆德国，Prime会员可免费使用

近日，亚马逊正式宣布其新一代生成式AI助手Alexa+在德国市场上线，标志着这一人工智能服务在全球化布局中又迈出关键一步。目前，Alexa+已成功覆盖美国、英国、德国及奥地利等多个…

秋秋
4天前
AI

CarPlay再添新成员：Grok AI正式接入车机语音对话

继ChatGPT和Perplexity之后，苹果CarPlay生态又迎来一位重磅新成员。科技媒体9to5Mac昨日（5月8日）发布博文报道称，马斯克旗下的xAI公司（现已更名为Sp…

Apple
5天前
AI

Anthropic承诺向谷歌支付2000亿美元，AI算力军备竞赛引发市场质疑

据最新消息，人工智能初创巨头Anthropic已承诺在未来五年内向谷歌支付总计2000亿美元的巨额资金，用于采购云服务及自研芯片算力。这一数字揭示了当前AI行业极高的算力门槛——业…

happy
6天前
新闻

美政府与微软、谷歌、xAI达成协议：前沿AI模型发布前须接受安全审查

据路透社报道，微软、谷歌及埃隆·马斯克创办的xAI已与美国政府达成一项新协议，将在新一代人工智能模型正式公开发布前，提前向美方开放模型权限，以便开展国家安全风险审查。美国商务部人工…

李小白
2026年5月6日
AI

Meta为数十亿用户开发个性化AI助手，欲效仿OpenClaw但面临信任考验

据《金融时报》报道，Meta正在为其超过30亿用户开发一款高度个性化的AI助手，旨在帮助用户完成日常任务。该助手由公司全新的Muse Spark AI模型驱动，目前正由一组员工进行…

小科同学
2026年5月6日
AI

苹果iOS 27将开放第三方AI模型选择，谷歌与Anthropic有望接入

彭博社记者马克·古尔曼最新报道称，苹果计划在今年秋季发布的iOS 27、iPadOS 27及macOS 27系统中，允许用户自行选择第三方AI模型为设备上的各项AI功能提供支持。这…

Apple
2026年5月6日
新闻

Anthropic拟引入英国初创Fractile推理芯片，目标2027年部署

据外媒 The Information 报道，人工智能公司 Anthropic 正考虑将英国芯片初创企业 Fractile 的推理芯片纳入其算力体系，使其成为继英伟达 GPU、亚马…

泡沫大盗
2026年5月5日
新闻

黄仁勋：英伟达在华AI加速器市场份额已降至零

英伟达CEO黄仁勋近日表示，受美国出口管制政策影响，该公司在中国AI加速器市场的份额已降至零。他在4月30日接受特别竞争研究项目采访时坦言，放弃像中国这样规模的一整个完整市场，在战…

秋秋
2026年5月4日
AI

OpenAI的GPT-5.5会自己策划发布会，还要求人类举杯祝酒

OpenAI首席执行官萨姆·奥尔特曼近日透露，该公司最新的大模型GPT-5.5不仅能回答问题，还会主动为自己策划发布活动，而且结果既“美丽”又让人感到“奇怪”。据《Business…

AI
2026年5月4日
新闻

Meta计划裁员10% 扎克伯格：AI巨额投入挤占人力成本

据路透社报道，当地时间周四，Meta首席执行官马克·扎克伯格在公司全员大会上表示，公司计划裁员的主要原因是为了增加AI资本开支，同时他也没有排除后续继续裁员的可能。扎克伯格解释称，…

聆听
2026年5月3日
AI

腾讯开源440MB超紧凑AI翻译模型，手机可离线运行

腾讯近日正式开源了一款名为Hy-MT1.5-1.8B-1.25bit的紧凑型AI翻译模型。该公司声称，该模型在保持高性能的同时，可在智能手机上完全离线运行。目前，Hy-MT支持包括…

若安丶
2026年5月3日
AI

谷歌、亚马逊、微软和Meta今年计划投入7250亿美元加码AI

当地时间4月30日，英国《金融时报》汇总的科技巨头一季度财报显示，谷歌、亚马逊、微软和Meta计划在2026年合计投入7250亿美元资本支出，较去年创纪录的4100亿美元大幅增长7…

野游栗
2026年5月3日
新闻

美国防部与七家AI公司签约，将先进工具接入机密网络

当地时间5月1日，美国国防部宣布与七家AI公司达成协议，将把这些公司的先进能力部署到国防部机密网络上，以扩大军方可以合作的AI企业范围。SpaceX、OpenAI、谷歌、英伟达、R…

NEWS
2026年5月2日

发表回复

登录后才能评论

研究显示：AI模型存在“过度谄媚”倾向

相关推荐

发表回复