王献华教授关于人工智能的观点总结
王献华教授作为研究古代文明与楔形文字的文科专家,从独特视角探讨了人工智能相关话题,提出诸多新颖观点,具体内容如下:
人工智能相关研究背景与自身参与契机
研究热潮与疑问:人工智能演进是热门话题,让AI真正理解人类语言与智慧成为关键,图灵测试的实现标准也备受关注,众多专家从不同角度研究并提出见解。
自身参与契机:在观察者网“2026答案秀·思想者春晚”讲台上,王献华教授回到人类创造文明的起源——文字发明,对人工智能进行“逆向工程”,提出“Nigiro Challenge”测试方案。他认为自己作为文科生,研究领域对多数听众陌生,在AI研究陌生的情况下,这种“双重陌生”或许能带来新思路,于是从楔形文字起源研究方向提出针对通用人工智能的“终极”测试方案。
楔形文字起源相关背景知识
与文字缘起相关的三种现象
陶筹:公元前8000年在西亚、近东广泛出现,主要功能是计数,如记录羊的数量、粮食收成等。到公元前4000纪变得复杂,出现穿孔、刻痕,还会被放在黏土“信封”里记录交易或财产。
印章:公元前7000纪西亚地区开始使用,盖在容器封泥上确认物品归属或保证交易安全。图案从简单到复杂,出现具体图像、动物、人物。公元前4000纪中期出现滚筒印章,可覆盖更大黏土表面,图案更精美,多由机构人员如寺庙管理者使用,象征权力与信任。
数学:研究难度复杂,只能用后世眼光看待。公元前4000纪末到公元前3000年文字出现时,多种数学计数系统并行,有学者认为有5种,有的认为有6种甚至更多,如“S系统”记录牛羊数量,“ŠE‘谷物系统’”记录容量。
楔形文字的出现:大约在公元前3500年到公元前3000多年,在陶筹、印章及数学系统发展基础上出现。一开始是纯数字的泥板,之后数字旁加上表意符号成“数字 + 表意符号”,如数字“5”加代表“羊”的符号表示五只羊,此时期为乌鲁克四期,还出现了可能是商品标签甚至名片的“标签”。公元前3200 - 3300年,早期楔形文字符号大概有1900个左右,包括象形符号和“矩阵符号”,符号使用转喻原则,但早期发音系统基本未知。
文字形成与发展的关键因素:文字的形成和发展与社会复杂性的增长密切相关。公元前4000纪下半叶,南部美索不达米亚社会复杂,行政管理和社会管理压力增大,人们需要记录生产、货物、劳动力等情况,文字应运而生。人类发明文字能力早已有之,但大规模出现与集体发展有关,书写文字是人类集体智能的结晶方式。
人工智能处理语言的方式及存在问题
词元化
词级词元化:最开始的词元化是“词级”的,以空格或标点分割词语,但存在词汇表规模太大,无法处理生僻词或未登录词的问题。
字符级词元化:后来发展出“字符级”词元化,以字符为基本处理单元,词汇表规模缩小,但生成的序列长度太大,机器难捕捉语义信息。
子词词元化:现在主流是在此基础上发展的“子词”词元化,如BPE、WordPiece、SentencePiece,在词和字符之间取得平衡,常见词保留整体,罕见词分解成子单元。
Transformer架构:在词元化基础上需要强大模型处理词元,Transformer架构基于自注意力机制,专为自然语言处理任务设计。此前常用循环神经网络架构处理词元,但处理长文本效率低,无法并行计算。Transformer可并行处理输入序列,同时捕捉长距离词语相互关系,类似人类阅读文章注意上下文,能更好理解语义,是GPT等大型语言模型生成连贯流畅文本的关键。
存在的问题:上世纪90年代哲学家提出“符号接地问题”,质疑人工智能搞语言模型是否真能理解语言、拥有智能。纯粹的符号系统内部操作能否赋予符号指称和意义存疑,人工智能可能只是在统计符号之间的关系,而非真正理解语言。例如人工智能输出“苹果”,不知其是否知道苹果的属性,还是仅因“苹果”常与“水果”“吃”等词一起出现。因此李飞飞等人提出真正的人工智能应通过“具身交互”学习,通过感知、行动与世界互动解决符号接地问题。
对图灵测试的反思与“Nigiro Challenge”测试方案的提出
对图灵测试的反思:目前没有公认标准检验可能到来的人工智能,图灵测试是1950年艾伦·图灵提出的著名测试,在基于文本的自然语言对话中,若机器行为与人类无异,测试者无法区分,则认为机器具有智能。但现在不少人工智能系统试图或声称已通过图灵测试,该测试本身存在问题。有学者提出图灵测试应叫“Gnirut”测试,认为它像镜子测试提问者水平,提问者水平决定AI回答质量。
“Nigiro Challenge”测试方案
方案含义:考虑到对图灵测试的反思和人工智能的“社会性”,王献华教授提出“Nigiro Challenge”,“Nigiro”是“Origin”(起源)的反写,象征对人类智能的逆向探索。该方案是针对通用人工智能体的“社会性虚拟造字测试”,即想象人工智能体社会能否在与其他智能体社会互动中,一步步发明出自己的文字。
方案意义:若人工智能体做到这一点,或许意味着拥有类似人类的智能。从文字角度,若一群智能机器人发明文字系统,王献华教授个人认为可承认其为人类社会“合格成员”。社会独立发明文字虽未必是人类拥有文明的唯一标志,但确实是人类文明有形的结晶。此方案不仅为测试AI通用智能提供可能方案,还能让我们重新审视人类智能诞生与发展的历史,在向着人工智能发展的同时回望人类智能过往。