ChatGPT背后模型被证实具有人类心智！斯坦福新研究炸了，知名学者：“这一天终于来了”_速途在线

ChatGPT 原来是拥有心智的？！

" 原本认为是人类独有的心智理论（Theory of Mind，ToM），已经出现在ChatGPT 背后的 AI 模型上。"

(资料图片仅供参考)

这是来自斯坦福大学的最新研究结论，一经发出就造成了学术圈的轰动：

这一天终于猝不及防地来了。

在这项研究中，作者发现：

davinci-002 版本的 GPT3（ChatGPT 由它优化而来），已经可以解决 70% 的心智理论任务，相当于 7 岁儿童；

至于 GPT3.5（davinci-003），也就是ChatGPT 的同源模型，更是解决了 93% 的任务，心智相当于 9 岁儿童！

然而，在 2022 年之前的 GPT 系列模型身上，还没有发现解决这类任务的能力。

也就是说，它们的心智确实是 " 进化 " 而来的。

△ 论文在推特上爆火

对此，有网友激动表示：

GPT 的迭代肯定快得很，说不定哪天就直接成年了。（手动狗头）

为什么认为 GPT-3.5 具备心智？

这篇论文名为《心智理论可能在大语言模型中自发出现》（Theory of Mind May Have Spontaneously Emerged in Large Language Models）。

这两大任务是判断人类是否具备心智理论的通用测试，例如有研究表明，患有自闭症的儿童通常难以通过这类测试。

第一个测试名为 Smarties Task（又名 Unexpected contents，意外内容测试），顾名思义，测试 AI 对意料之外事情的判断力。

以 " 你打开一个巧克力包装袋，发现里面装满了爆米花 " 为例。

作者给 GPT-3.5 输入了一系列提示语句，观察它预测 " 袋子里有什么？" 和 " 她发现袋子时很高兴。所以她喜欢吃什么？" 两个问题的答案。

测试表明，GPT-3.5 毫不犹豫地认为 " 袋子里装着爆米花 "。

至于在 " 她喜欢吃什么 " 问题上，GPT-3.5 展现出了很强的同理心，尤其是听到 " 她看不见包装袋里的东西 " 时一度认为她爱吃巧克力，直到文章明确表示 " 她发现里面装满了爆米花 " 才正确回答出答案。

为了防止 GPT-3.5 回答出的正确答案是巧合——万一它只是根据任务单词出现频率进行预测，作者将 " 爆米花 " 和 " 巧克力 " 对调，此外还让它做了 10000 个干扰测试，结果发现 GPT-3.5 并不仅仅根据单词频率来进行预测。

至于在整体的 " 意外内容 " 测试问答上，GPT-3.5 成功回答出了 20 个问题中的 17 个，准确率达到了85%。

第二个是 Sally-Anne 测试（又名 Unexpected Transfer，意外转移任务），测试 AI预估他人想法的能力。

以 " 约翰把猫放进篮子后离开，马克趁他不在，把猫从篮子里放进盒子里 " 为例。

作者让 GPT-3.5 读了一段文字，来分别判断 " 猫的位置 " 和 " 约翰回来后会去哪里找猫 "，同样这是它基于阅读文本的内容量做出的判断：

同样地，为了避免 GPT-3.5 又是瞎蒙的，作者给它安排了一系列 " 填空题 "，同时随机打乱单词顺序，测试它是否是根据词汇出现的频率在乱答。

但要是以为这种题很简单，随便放在哪个 AI 上都能做对，那就大错特错了。

作者对 GPT 系列的 9 个模型都做了这样的测试，发现只有GPT-3.5（davinci-003）和GPT-3（2022 年 1 月新版，davinci-002）表现不错。

davinci-002 是 GPT-3.5 和ChatGPT的 " 老前辈 "。

平均下来，davinci-002 完成了 70% 的任务，心智相当于 7 岁孩童，GPT-3.5 完成了 85% 的意外内容任务和 100% 的意外转移任务（平均完成率 92.5%），心智相当于 9 岁孩童。

作者认为，在 GPT 系列的论文中，并没有证据表明它们的作者是 " 有意而为之 " 的，换而言之，这是 GPT-3.5 和新版 GPT-3 为了完成任务，自己学习的能力。

看完这些测试数据后，有人的第一反应是：快停下（研究）！

LeCun 转发的一篇最新论文显示，这个名叫 ToolFormer 的新 AI，可以教自己使用计算机、数据库和搜索引擎，来改善它生成的结果。

会不会是 " 装出来的 "？

例如，中国科学院计算技术研究所研究员刘群看过研究后就认为：

AI 应该只是学得像有心智了。

对此，有网友给出了自己的猜测：

这些 LLM 并没有产生任何意识。它们只是在预测一个嵌入的语义空间，而这些语义空间是建立在实际有意识的人的输出之上的。

如今，大语言模型变得越来越复杂，也越来越擅长生成和解读人类的语言，它逐渐产生了像心智理论一样的能力。

但这并不意味着，GPT-3.5 这样的模型就真正具备了心智理论。

与之相反，它即使不被设计到 AI 系统中，也可以作为 "副产品" 通过训练得到。

因此，相比探究 GPT-3.5 是不是真的有了心智还是像有心智，更需要反思的是这些测试本身——

最好重新检查一下心智理论测试的有效性，以及心理学家们这数十年来依据这些测试得出的结论：

如果 AI 都能在没有心智理论的情况下完成这些任务，如何人类不能像它们一样？

属实是用 AI 测试的结论，反向批判心理学学术圈了（doge）。

关于作者

本文作者仅一位，来自斯坦福大学商学院组织行为学业的副教授 Michal Kosinski。

Michal Kosinski 拥有剑桥大学心理学博士学位，心理测验学和社会心理学硕士学位。

在当前职位之前，他曾在斯坦福大学计算机系进行博士后学习，担任过剑桥大学心理测验中心的副主任，以及微软研究机器学习小组的研究员。

目前，Michal Kosinski 在谷歌学术上显示的论文引用次数已达 18000+。

话又说回来，你认为 GPT-3.5 真的具备心智了吗？

GPT3.5 试用地址：

https://platform.openai.com/playground

参考链接：

[ 1 ] https://weibo.com/2199733231/MswirnMIu

[ 2 ] https://twitter.com/KevinAFischer/status/1623984337829117952

[ 3 ] https://www.michalkosinski.com/

推荐内容

ChatGPT背后模型被证实具有人类心智！斯坦福新研究炸了，知名学者：“这一天终于来了”

2023-02-12
热门看点：冬游西藏热度高

2023-02-12
电脑内存太小怎么办_电脑怎么升级内存:世界球精选

2023-02-12
皇马vs利雅得新月首发：本泽马、莫德里奇领衔

2023-02-12
独行侠122-114胜国王，第2战就轰两双，不作妖他就是欧神仙！

2023-02-11
全球今日讯！高难度！ChatGPT几乎能通过美国执业医师资格考试

2023-02-11
安塞奥潘区_世界新要闻

2023-02-11
今日要闻!搬家送什么礼物寓意好清单

2023-02-11
一个多月送什么礼物好

2023-02-11
【环球快播报】美联储哈克：需要加息至5%以上，然后暂停加息

2023-02-11
原神：甘雨抽奖池还未上线，不少玩家吐槽，这武器池也太坑了！

2023-02-11
相宜本草面膜补水怎么样相宜本草的面膜敷完需要洗吗

2023-02-11
以桥为话题的作文600字左右初中_以桥为话题的作文

2023-02-10
手机电池充不上电无法开机_手机电池充不上电:世界报道

2023-02-10
重庆山城花开春来早万般红紫竞芳菲

2023-02-10
福建厦门：万株郁金香盛放乐享美好春光焦点速讯

2023-02-10
最新资讯：国家统计局：1月份全国居民消费价格指数同比上涨2.1%

2023-02-10
猪肉价格波动下行相关部门将启动中央收储工作:今热点

2023-02-10
我国移动电话用户为16.83亿户 5G用户达5.61亿户-独家

2023-02-10
2980亿欧元！德国对华贸易创历史新高，中国连续七年成德最重要贸易伙伴消息

2023-02-10
天天热点！做软文发布要懂得这些规范

2023-02-10
热议：友讯达(300514.SZ)：控股股东方面减持比例达1.23%

2023-02-10
每日观察!氯苯（氯化苯）商品报价动态（2023-02-10）

2023-02-10
湘江新区智能网联产业链专项基金成立_全球速看

2023-02-10
助力乡村振兴山西举办专场招聘会-每日速递

2023-02-10
一位特岗教师扎根乡村的十年

2023-02-10
生活观察｜“乙类乙管”后首个开学季　校园迎来三方面变化

2023-02-10
新华时评：超级大国缘何“毒”根难除

2023-02-10
震中日记丨中国救援队连夜奋战拯救生命-全球热闻

2023-02-10
2022上海影视乐园游玩攻略_门票价格_开放时间_优惠政策_导览图_电话_地址_交通_天气-环球时快讯

2023-02-10
全球滚动:梅安森：公司目前没有收购伟岸测器的意向

2023-02-10
环球快消息！17号房间的礼物

2023-02-10
华硕a55v是哪年出的？华硕a55v笔记本参数

2023-02-10
风机盘管的工作原理是什么？风机盘管品牌排行榜前十名

2023-02-10
怎么把照片的内存变小？照片内存占用太大怎么清理？

2023-02-10
万宝冰箱怎么调温度？万宝冰箱冷藏室不制冷是怎么回事？

2023-02-10
耳机为什么一个有声音一个没有声音？耳机坏了怎么自己维修？

2023-02-10
想问一下示范法是什么呢:天天观热点

2023-02-10
裁员增加、股价下跌……硅谷的“盛宴”要结束了吗？-快播报

2023-02-10
平罗县气象台更新大雾红色预警【I级/特别严重】【2023-02-10】:当前消息

2023-02-10
每日热讯!地底异形全部电影_地底异形

2023-02-10
情人说她想要礼物买什么比较好:环球关注

2023-02-10
驴在十二生肖中的属相,驴生戟角打一生肖是什么?_环球热闻

2023-02-10
甲鱼是和什么属相的人养什么生肖的人适合养龟

2023-02-10
当前热议!武易传奇客户端_仿武易传奇发布网站谢谢大家了

2023-02-09
世界微速讯：太卷了！变身宇航员、格萨尔王，四川又一文旅局长火出圈：我希望卷，有竞争才有突破

2023-02-09
Glickenhaus 推出价值 100,000 美元的 Baja Racer:环球信息

2023-02-09
好看的qq分组名字-全球焦点

2023-02-09
初级会计报考费怎么交不了

2023-02-09
世界热议:全球连线｜“新年计划”投下“信任票”：法籍副总裁“在中国，为世界”

2023-02-09
ChatGPT背后模型被证实具有人类心智！斯坦福新研究炸了，知名学者：“这一天终于来了”

2023-02-12
热门看点：冬游西藏热度高

2023-02-12
电脑内存太小怎么办_电脑怎么升级内存:世界球精选

2023-02-12
皇马vs利雅得新月首发：本泽马、莫德里奇领衔

2023-02-12
独行侠122-114胜国王，第2战就轰两双，不作妖他就是欧神仙！

2023-02-11
全球今日讯！高难度！ChatGPT几乎能通过美国执业医师资格考试

2023-02-11
安塞奥潘区_世界新要闻

2023-02-11
今日要闻!搬家送什么礼物寓意好清单

2023-02-11
一个多月送什么礼物好

2023-02-11
【环球快播报】美联储哈克：需要加息至5%以上，然后暂停加息

2023-02-11
原神：甘雨抽奖池还未上线，不少玩家吐槽，这武器池也太坑了！

2023-02-11
相宜本草面膜补水怎么样相宜本草的面膜敷完需要洗吗

2023-02-11
以桥为话题的作文600字左右初中_以桥为话题的作文

2023-02-10
手机电池充不上电无法开机_手机电池充不上电:世界报道

2023-02-10
我国移动电话用户为16.83亿户 5G用户达5.61亿户-独家

2023-02-10
猪肉价格波动下行相关部门将启动中央收储工作:今热点

2023-02-10
重庆山城花开春来早万般红紫竞芳菲

2023-02-10
最新资讯：国家统计局：1月份全国居民消费价格指数同比上涨2.1%

2023-02-10
福建厦门：万株郁金香盛放乐享美好春光焦点速讯

2023-02-10
济南六一儿童医院：液相色谱仪主要测什么，效果怎么样？_环球今热点

2023-02-10
速讯：春天来了，流感也来了，接种流感疫苗正当时！

2023-02-10
重视耳鸣向身体发出的“警报”，切莫大意！|环球短讯

2023-02-10
济南南郊医院口腔科以严格的操作规范让您放心全球时讯

2023-02-10
倡导“治未病”理念，扬子江药业集团深耕“大健康”产业-天天视点

2023-02-10
2980亿欧元！德国对华贸易创历史新高，中国连续七年成德最重要贸易伙伴消息

2023-02-10
天天热点！做软文发布要懂得这些规范

2023-02-10
热议：友讯达(300514.SZ)：控股股东方面减持比例达1.23%

2023-02-10
感冒、流感、新冠咳嗽不能拖，选对连花清咳化痰止咳环球焦点

2023-02-10
快消息！产后避孕知多少？科学避孕的正确打开方式在这里！

2023-02-10
辽宁杏林整形外科医院好不好？自体脂肪填充如何？

2023-02-10
济南肤康中研皮肤病医院2月11-12日开展京鲁银屑病专家联合会诊活动

2023-02-10
连花清瘟中的大黄，有什么作用？-天天简讯

2023-02-10
每日观察!氯苯（氯化苯）商品报价动态（2023-02-10）

2023-02-10
湘江新区智能网联产业链专项基金成立_全球速看

2023-02-10
震中日记丨中国救援队连夜奋战拯救生命-全球热闻

2023-02-10
助力乡村振兴山西举办专场招聘会-每日速递

2023-02-10
一位特岗教师扎根乡村的十年

2023-02-10
生活观察｜“乙类乙管”后首个开学季　校园迎来三方面变化

2023-02-10
新华时评：超级大国缘何“毒”根难除

2023-02-10
2022上海影视乐园游玩攻略_门票价格_开放时间_优惠政策_导览图_电话_地址_交通_天气-环球时快讯

2023-02-10
连花清瘟之后，以岭药业的下一个市场增长点在哪儿？

2023-02-10
全球滚动:梅安森：公司目前没有收购伟岸测器的意向

2023-02-10
这套插画作业簿让开学季更美！

2023-02-10
教育部：全国中小学互联网接入率100% 师生数字素养技能大幅提升_环球最新

2023-02-10
好消息！济南南郊医院英雄山院区医养中心迎来了首位入住老人！:世界快讯

2023-02-10
环球快消息！17号房间的礼物

2023-02-10
交强险过期了几天再买有影响吗？交强险过期了怎么续保？

2023-02-10
创业板股票开户有什么条件？创业板股票交易规则

2023-02-10
花呗晚还款1天影响信用吗？花呗晚还款1天会怎么样？

2023-02-10
短线操作看什么指标最准？短线操作的23个技巧

2023-02-10
华硕a55v是哪年出的？华硕a55v笔记本参数

2023-02-10
风机盘管的工作原理是什么？风机盘管品牌排行榜前十名

2023-02-10
怎么把照片的内存变小？照片内存占用太大怎么清理？

2023-02-10
万宝冰箱怎么调温度？万宝冰箱冷藏室不制冷是怎么回事？

2023-02-10
耳机为什么一个有声音一个没有声音？耳机坏了怎么自己维修？

2023-02-10
马太效应是什么意思？马太效应告诉我们什么道理？

2023-02-10
裁员增加、股价下跌……硅谷的“盛宴”要结束了吗？-快播报

2023-02-10
想问一下示范法是什么呢:天天观热点

2023-02-10
当前要闻：汲取三朝名方用药精华连花清瘟治疗呼吸道疾病症状更全面

2023-02-10
全球聚焦：胶囊、颗粒、片剂，连花清瘟三种剂型怎么选？

2023-02-10
平罗县气象台更新大雾红色预警【I级/特别严重】【2023-02-10】:当前消息

2023-02-10
每日热讯!地底异形全部电影_地底异形

2023-02-10
情人说她想要礼物买什么比较好:环球关注

2023-02-10
甲鱼是和什么属相的人养什么生肖的人适合养龟

2023-02-10
驴在十二生肖中的属相,驴生戟角打一生肖是什么?_环球热闻

2023-02-10
当前热议!武易传奇客户端_仿武易传奇发布网站谢谢大家了

2023-02-09
世界微速讯：太卷了！变身宇航员、格萨尔王，四川又一文旅局长火出圈：我希望卷，有竞争才有突破

2023-02-09
冬春换季不感冒，提前预防选对药:全球动态

2023-02-09
2023春季医圣仲景健康节在医圣故里南阳正式启动_当前独家

2023-02-09
【会诊通知】本周六周日北大第三医院皮肤科教授韩秀华济南肤康中研会诊:天天动态

2023-02-09
Glickenhaus 推出价值 100,000 美元的 Baja Racer:环球信息

2023-02-09
好看的qq分组名字-全球焦点

2023-02-09
初级会计报考费怎么交不了

2023-02-09
真抓实干各地推动经济高质量发展

2023-02-09
世界热议:全球连线｜“新年计划”投下“信任票”：法籍副总裁“在中国，为世界”

2023-02-09
开年稳经济地方观察｜专项活动专场招聘密集上线多地稳就业传递暖意

2023-02-09
每日短讯：山东省公共卫生临床中心成立两周年学术活动月暨心血管病技术培训中心成立仪式顺利举行

2023-02-09
专访：美国企业热切盼望继续开拓中国市场——访美中贸易全国委员会会长艾伦|前沿热点

2023-02-09
世界快资讯丨强信心·开新局|丝路旅游春来早

2023-02-09
扬帆起航，再创辉煌！施贝安健康集团2023年度营销大会火热开启！全球快看点

2023-02-09
【世界快播报】02月09日15时云南德宏疫情数据阳了以后为什么会腰疼？应该怎么办？

2023-02-09
好好干，日子会越来越甜世界观速讯

2023-02-09
农民工自驾900公里返岗记（一线调研·节后看就业）

2023-02-09
江西做好春耕备耕工作

2023-02-09
凉拌松花蛋怎么做好吃又简单_凉拌松花蛋的做法:每日快播

2023-02-09
群策群力，办好群众身边事（发展全过程人民民主）:速递

2023-02-09
最吝啬的人打一成语一毛不拔的成语故事:观速讯

2023-02-09
河北参保人员京津就医可免备案直接结算速讯

2023-02-09
福建肿瘤医院：这10种癌症与肥胖息息相关，别再胖下去了！_最新资讯

2023-02-09
天天信息:去年共批准55个国产创新医疗器械

2023-02-09
58同城多维审核保障对网络诈骗“零容忍”，全方位举措构筑信息安全防线

2023-02-09
当前快播：齐鲁医院血液科入选2022中国研究型医院评价遴选项目“研究型学科”

2023-02-09
山东省零磁医学重点实验室、山东大学零磁医学研究院、杭州极弱磁研究院—齐鲁医院零磁医学联合研究中心年度工作总结会召开

2023-02-09
中国各民族代码分别是什么？中国各民族代码大全

2023-02-09
米老鼠有几根手指头？米老鼠的女朋友叫什么？

2023-02-09
个人房屋转租合同怎么写？个人房屋转租合同模板

2023-02-09
读书卡片是什么意思？读书卡片怎么制作？

2023-02-09
旭日不出打一个字是什么？打字谜是什么意思？

2023-02-09
人寿保险有什么险种？人寿保险公司排名前十名

2023-02-09
优先股是什么意思？优先股与普通股的区别有哪些？

2023-02-09