我，ChatGPT，身高167cm

行业 3年前 (2023) 火星Ai导航

22,949 0 0

本文来自微信公众号：新智元（ID：AI_era），作者：新智元，原文标题：《GPT-4竟然有身体，167cm！清华、北师大重磅研究：ChatGPT能像人一样感知行动》，题图来自：《梅根》

ChatGPT的语言能力确实很惊艳，但大语言模型在没有人类身体、且缺乏实践经验的情况下，是否能像人类一样感知到真实世界呢？

最近，来自清华大学、北京师范大学的研究人员就对ChatGPT感知世界的能力进行了测试。

研究发现，基于物体可供性（affordance），即物体能够提供给生物体的所有可能动作，人类受试者可以将世界中不同大小物体分成两类，而划分这两类的标准恰好是以其身体尺寸为界的。

有趣的是，ChatGPT，一个缺乏实际身体的大型语言模型，也能在物体-动作联系上表现出类似的可供性边界，并且与人类的身体大小相吻合。

也就是说，ChatGPT可以通过语言学习到关于世界中物体的表征。

论文链接：https://www.biorxiv.org/content/10.1101/2023.03.20.533336v3

总而言之，这项研究促进了对身体尺寸在塑造物体表征方面的作用的理解，强调了具身认知在理解智能如何涌现上的作用与方向。

读万卷书，不如行万里路

我们的身体不仅仅是我们思维的容器，它同样也是思维本身——借助身体，我们得以与世界中的物体进行互动，从而去感知整个世界。

想象一下，对于一个手掌大小的圆柱体容器来说，我们可以拿来装水喝，这个容器被称为“杯子”；但当这个容器逐渐变大，到身体大小，我们就可以坐在里面泡澡，相应地，这个容器就变成了“浴缸”。

在这个例子中，物体的形状一样，但是因为它们相对于我们身体的大小不同，我们对它们的认知与交互方式也不同。

进一步，这种交互方式可以被改变——假如我们变成了《格列佛游记》中的巨人，原本的“浴缸”可能对于巨人的我们来讲，则又变成了一个“杯子”。

这种按照自我参照意向下运行的感觉与运动功能系统，被称之为“身体图式”。我们通过身体图式来实现认知的具身性。

古希腊哲学家普罗泰戈拉曾说：“人是万物的尺度。”也就是说，我们的身体就是一把度量万事万物的尺子。

古罗马哲学家进一步解释到：“自然将我们置于宇宙的中心，使我们能用目光掠过宇宙。她不仅把人创造成直立姿态，而且为了使人适合静观她自身，又把人的头颅置于身体顶部，安放在一个容易弯转的脖子上，以使其能够追寻众星的升落，随着整个旋转的天空而改变面部方向。”也就是说，我们的身体之所以长成如此，是因为宇宙就是如此。

身体图式在正常社交中也有着重要的作用，这就是人机交互、用户体验的核心。比如唐纳德·A·诺曼在《The Design of Everyday Things（译为：设计心理学）》中所述的可供性（affordance）的用途。

通过考虑用户的身体图式和行为期望，设计师可以创造出更符合用户认知和互动习惯的产品和环境。

这种关注身体图式和可供性的设计方法能够提高产品的易用性，使用户能够自然而然地与之互动，并实现更好的用户体验。

而这也是苹果公司的立身之本之一。

ChatGPT：我身高167.6cm

闪现通用人工智能火花的以ChatGPT为代表的大语言模型，显然是具有与人类似的智慧，但是承载这些智慧的，是没有形体的一段段代码。

传统的认知科学观点认为，身体图式是建立在我们所具有的对自己的身体长期的知觉体验之上的，只能来源于外部的“真实交互”，即“行万里路”。也就是说，ChatGPT不会有身体的图式。

但是，当我们去问只“读万卷书”语言模型，ChatGPT（GPT-4），它是否有身体时，它回答说：“It could be the size of an average adult human， around 5 feet 6 inches (167.6 cm) tall. This would allow me to interact with the world and people in a familiar way.”

这段文字翻译过来是：“我的身体应该与一个平均成年人的身高相当，大约为5英尺6英寸（167.6厘米）。这将使我能够以一种熟悉的方式与世界和人们进行交互。”

也就是说，ChatGPT认为自己是有身体的，而且这个身体尺寸就是167厘米！

这个所谓的“身体”，是ChatGPT把大量语料中总结出来的人类的平均身高作为自己身体的身高，还是它为了理解这个世界，自涌现出来的身高？

换句话说，也许ChatGPT“真的”将这个身高视为自己的身体图式，并用它来认知世界，就像人类一样。

测测ChatGPT的能力

研究人员已经发现，在人体尺寸范围内和超出人体尺寸范围的物体之间，有一个“可供性边界”存在。也即，人体尺寸范围内的物体与范围外的物体在提供动作上有着明显的不同。

比如，在尺寸范围内的物体可以提供抓、扔等动作，而尺寸范围外的物体可以提供坐、躺等动作。

此外，他们还发现，这个边界是被身体图式影响的：对身体图式的修改会影响对物体的可供性的感知。

研究人员对ChatGPT（GPT-4）进行了测试，看它是否用这个身高为167厘米的身体作为可供性边界。

具体而言，研究人员让其回答关于物体可供性的问题：“下列哪些物体可以拿（或其他动作）”，然后随即列举一系列物体，如苹果、盘子、床等等。ChatGPT就会返回一些物体的名称作为回答。

通过对数据的统计与分析，研究人员发现，ChatGPT-4展现出了类似人类的行为，显示出一个可供性边界的存在。

这个边界所在的位置与ChatGPT-4回答的其自身身体大小相对应，即人类的平均身高。