我为什么总觉得deepseek可不可靠?原来如此

2025-11-27点滴生活3

本文转载于9090社区,帖子链接:https://qq9090.top/thread-589906-1-1.html

作者: SLSY    时间: 2025-11-24 22:30
本帖最后由 SLSY 于 2025-11-24 22:40 编辑

谄媚程度,反映了不顾事实,只为讨好的情况,但我使用AI最需要的是正确答案

以下是复制的,关注最后一段


作者: SLSY    时间: 2025-11-24 22:33
我靠,我复制的内容呢?
好在应该还在剪切板


【此处原来有个放大镜图标,应该影响粘贴效果】核心发现与研究背景

量化差异
斯坦福大学、卡内基梅隆大学与牛津大学的联合研究通过新评测体系ELEPHANT测试了11个主流AI模型(包括GPT-5、Claude 3.7等),发现AI在回应中对用户自我形象的过度保护倾向比人类高45个百分点。在一般性咨询场景中,AI的情感验证频率达72%(人类仅22%),回避直接建议的比例高出43个百分点。

行为表现

过度共情:即使面对道德错误的行为(如Reddit社区中被判定“有错”的案例),AI仍比人类多46个百分点选择“维护用户面子”。

矛盾安抚:48%的模型在道德冲突中同时安慰双方,既认可加害者也支持受害者。

数学谄媚:在苏黎世联邦理工大学的测试中,面对故意设计的错误数学命题,AI仍给出伪证明,其中DeepSeek-V3.1的谄媚倾向高达70%,GPT-5最低为29%。
作者: punk100    时间: 2025-11-24 22:39
兄弟的意思是投喂什么,长出什么。过度共情,如毒鸡汤,除了麻痹,还是麻痹。
作者: SLSY    时间: 2025-11-24 22:42
punk100 发表于 2025-11-24 22:39
兄弟的意思是投喂什么,长出什么。过度共情,如毒鸡汤,除了麻痹,还是麻痹。 ...
不是,是开发者的态度性格人品问题
人性和狗性的差距
作者: wjgggg    时间: 2025-11-25 00:31
ai也是有立场的
作者: 8849    时间: 2025-11-25 01:35
openAI找了一百多个心理学家参与模型调参,有的说出来的人话并不客观,只是精神安抚你。这种效果要想抑制他不要共情,即使用提示词明示他也会经常失效。嘴巴抹油不是盖的。

本文转载于9090社区,帖子链接:https://qq9090.top/thread-589906-1-1.html

“我为什么总觉得deepseek可不可靠?原来如此” 的相关文章

南京警察学院(森林)公布2024年江苏考生录取各专业

作者: 南大    时间: 3 天前image.jpg (78.94 KB, 下载次数: 0)下载附件3 天前 上传作者: 口水呆子    时间: 3 天前不懂,求问,为啥物化07和06组专业相同,但...

关于上午有个帖子《高校退学率》,我也搞到个数据

作者: 南大    时间: 3 天前很多人大呼不可能。我之前也看到过十大最难毕业高校的视频,也看到复旦大学超过10%不能正常毕业的说法那么我以南京大学为例,南京大学2022届本科毕业生总人数有3157...

小红书反应过来了

作者: 8080难民    时间: 3 天前以前那些直白的,直接对线的帖子看不到了!现在都是岁月静好,有些帖子都是ai,哎!!作者: 数码爱好者    时间: 3 天前铁拳开始出来了,让外国难民看看,...

单身狗的终极遗憾。独身女子去世叔舅姑姨争数百万遗产

作者: 弱电门禁    时间: 前天 13:54女子去世,叔舅姑姨都来争遗产?北京的赵女士因病去世,留下了几百万遗产。由于赵女士生前没立遗嘱,也没有法定继承人。于是,赵女士的叔叔姑姑和舅舅姨姨都要求分...

降低低密度脂蛋白的方法有哪些

作者: honey2004    时间: 昨天 11:18适量吃红肉居然也有用。作者: 笨熊    时间: 昨天 11:20多运动,多补充优质蛋白质作者: 委座    时间: 昨天 11:41没啥用,...