江南GPT和LLaMA2哪个“情商”更高—新闻—科学网

时间:2024-08-27 11:48:25 已阅读:77次

《天然-人类举动》5月20日揭晓的一篇论文显示,于测试追踪别人生理状况威力——也快意智理论——的使命中,两类年夜言语模子(LLM)于特定环境下的体现与人类相似,以至更好。

心智理论对于人类社交互动十分主要,是人类沟通交流以及孕育发生共识的要害。以前的研究注解,像年夜言语模子这种人工智能可以解决繁杂的认知使命,如多选决议计划。不外,研究职员始终不清晰LLM于心智理论使命——被以为是人类独占的威力——中的体现是否也能比肩人类。

于这项新研究中,德国汉堡-埃彭多夫年夜学医学中央的James Strachan以及同事选择了能测试生理理论差别方面的使命,包孕发明过错设法、理解直接语言和辨认掉礼。

研究职员随后比力了1907人与两个热点LLM家族(由美国OpenAI公司开发的GPT模子以及由美国Meta公司开发的LLaMA2模子)完成使命的威力。

他们发明,GPT模子于辨认直接要求、过错设法以及误导体现等方面能到达、有时以至逾越人类平均程度,而LLaMA2的体现则逊在人类程度。于辨认掉礼方面,LLaMA2强在人类但GPT体现欠安。

Strachan以及同事指出,LLaMA2的乐成被证实是由于回覆的成见水平较低而不是由于真的对于掉礼敏感,而GPT看起来的掉利实在是由于对于结论的守旧立场而不是推理过错。

研究职员提示道,LLM于心智理论使命上的体现堪比人类不等在它们具备人类般的威力,也不料味着它们能把握心智理论。但他们也指出,这些成���果是将来研究的主要根蒂根基,并提议进一步研究LLM于生理揣度上的体现会怎样影响个别于人机交互中的认知。

相干论文信息:https://doi.org/10.1038/s41562-024-01882-z

版权声明:凡本网注明“来历:中国科学报、科学网、科学新闻杂志”的所有作品,消息网转载,请于正文上方注明来历以及作者,且不患上对于内容作本色性改动;微信公家号、头条号等新媒体平台,转载请接洽授权。邮箱:shouquan@stimes.cn。/江南