C114门户论坛百科APPEN| 举报 切换到宽版

亚星游戏官网

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

亚星游戏官网-yaxin222  少将

注册:2015-1-2873
发表于 2024-5-27 14:33:16 |显示全部楼层
站长之家(ChinaZ.com)5月27日 消息:Nature杂志上发表的最新研究显示,GPT-4在心智理论(Theory of Mind, ToM)方面的表现与人类相当,甚至在某些方面超过了人类。这项研究由James W. A. Strachan等人进行,他们通过一系列测试来评估GPT-4、GPT-3.5、Llama2以及人类参与者的表现,并进行了比较。

亚星游戏官网-yaxin222

以下是研究的主要发现:

心智理论的表现:心智理论是理解他人心理状态的能力,对于社会互动至关重要。GPT-4在心智理论方面的表现与人类无异,甚至在检测讽刺和暗示方面优于人类。

测试项目:研究包括了5个测试项目,分别是错误信念、反讽、失言、暗示和奇怪故事。GPT-4在反讽、暗示和奇怪故事这3项测试中的表现明显优于人类,在错误信念测试中与人类持平,仅在失言测试中表现不如人类。

保守性:GPT-4在失言测试中的低分并非因为它缺乏理解能力,而是因为它采取了保守策略,不轻易给出确定性意见。

失言可能性测试:在失言可能性测试中,GPT-4展现了完美的性能,表明它能够成功推断说话者的心理状态,并确定无意冒犯的可能性大于故意侮辱。

能力和表现的分离:研究表明,GPT模型可能具备计算类似心智推理的技术复杂性,但在不确定情况下的表现与人类不同。人类倾向于消除不确定性,而GPT则不会自发地计算推论以减少不确定性。

谨慎行为:GPT-4在失言测试中的保守性可能源于其底层架构中的缓解措施,这些措施旨在提高事实性并避免用户过度依赖模型。

这项研究的结果表明,GPT-4在理解人类心理状态方面的能力可能被低估了。研究者呼吁建立“机器心理学”,使用实验心理学的工具和范式来系统地研究大型语言模型的能力和局限性。

论文地址:https://www.nature.com/articles/s41562-024-01882-z

举报本楼

本帖有 6 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图  

GMT+8, 2024-9-22 16:52 , Processed in 0.103623 second(s), 17 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部
XML 地图 | Sitemap 地图