朱松纯大模型登上了珠峰但通用人工智能是探月

栏目：科研进展
标签：科研进展 , 天文学科研进展 , 天文科研进展
更新时间： 2024年07月08日
摘要：朱松纯：大模型“登上了珠峰”，但通用人工智能是“探月” 在大模型持续火了一年多之后，人们期待的通用人工智能还未见踪影。在人工智能科学家、北京通用人工智能研究院院长朱松纯看来，大模型的确取得了了不起的成就，但它并不能实现通用人工智能，即便是现在参数规模达到万亿甚至以后规模更大。他说，大模型的成就堪比“登上了珠峰”，但通用人工智能是“探月工程”。 1月28日至29日

朱松纯大模型登上了珠峰但通用人工智能是探月

朱松纯：大模型“登上了珠峰”，但通用人工智能是“探月”

在大模型持续火了一年多之后，人们期待的通用人工智能还未见踪影。在人工智能科学家、北京通用人工智能研究院院长朱松纯看来，大模型的确取得了了不起的成就，但它并不能实现通用人工智能，即便是现在参数规模达到万亿甚至以后规模更大。他说，大模型的成就堪比“登上了珠峰”，但通用人工智能是“探月工程”。 1月28日至29日，“迈向通用人工智能前沿科技成果展”（以下简称成果展）在京举办。成果展现场重点展示了北京通用人工智能研究院（以下简称通研院），近两年在通用人工智能前沿领域实现的技术突破和原创性科研成果。通用智能人——小女孩“通通”（Little Girl）成为展会现场最大亮点。

通用智能人——小女孩“通通”具有“好奇”“整齐”“干净”等价值倾向。通研院供图，下同

像人类儿童一样

学习和成长的“通用智能人”

在成果展现场，“通通”吸引了大量与会者驻足，许多学生与之互动。

学生与“通通”互动。据北京大学智能学院教授宋国杰介绍，作为首个由价值与因果驱动的通用人工智能（AGI）系统原型，“通通”拥有类人价值观，能自主生成任务，具备物理和社会常识，可保障复杂任务高效执行，推理和决策过程透明、可解释。通过“自主学（自主环境探索）”“他人教（与人类多模态交互）”等方式，“通通”可实现技能、知识和价值的持续成长。在互动中，互动者随机改变“通通”的“好奇”“整齐”“干净”等价值倾向，“通通”能够自主完成对环境的探索、收拾房间、擦拭污渍等任务。比如，当互动者把墙上的相框移位，“通通”会根据自己“爱整齐”的价值观，主动摆正相框位置；对于摆在高处的相框，不需要人类的提示，“通通”会自行在房间内找到凳子，进而踩在凳子上完成相框的摆放；当互动者将牛奶洒在桌子上，“通通”会主动识别互动者的意图，根据“爱干净”的价值观主动寻找毛巾擦拭桌子。宋国杰表示，迈向通用人工智能，构建能够理解人类生活的真实世界，并掌握丰富技能的通用智能体非常重要。而打造真正的通用智能体，需要回到人类本身作为通用智能体的原点——“她”可以像人类儿童一样不断地学习和成长，最终具备真正的通用性。而通用智能人“通通”，就是这样一个正在被构建的通用智能体。他进一步介绍说，通用智能体要具备像人一样的物理常识和社会常识，拥有“与生俱来”的本能，在价值驱动下，不仅能完成无限任务，还可以自主定义任务——这是通用智能的关键，也是人类自儿童阶段就已完备的。 “但目前大多人工智能的发展和人类成长发展的侧重方向恰恰相反。”宋国杰表示，这也是通研院强调打造通用智能体要回归到人类本身作为原点的重要原因，为此通研院在顶层设计上提出了原创性的认知架构理论，并自研国产学习和推理框架（通用人工智能操作系统TongOS2.0和编程语言TongPL2.0）作为底层支撑，以确保所打造的通用智能体能够拥有人类价值观。宋国杰认为，未来，“通通”有望率先与教育、康养、智能制造及战略新兴产业结合，并在人类社会和合共生，共创美好。

AGI“一定是一个

非常美的、简单的东西”

自2022年11月以来，以大语言模型为基础的生成式人工智能应用GPT系列产品，因其能够通过学习大量人类语言来完成对话、邮件、视频脚本、文案、翻译和编写代码等原本只能由人类完成的复杂任务，引发广泛关注成为了网络热点，这让人们觉得通用人工智能似乎“远在天边”却又“近在眼前”。许多人不禁要问，我们距离AGI还有多远？大模型是通往AGI之路吗？

朱松纯曾在参与“学习强国”学习平台与中国科学报社联合发起“科学家回信”活动时，给有类似疑问的读者写回信。在信中，他表明立场：实现通用人工智能是人工智能研究的初心也是终极目标，但在现有大模型的基础上继续扩大参数规模“并不能实现通用人工智能”。

朱松纯 “如果我们把实现通用人工智能看作‘探月工程’，大模型现在取得的成就如同登上了珠峰，虽然也是了不起的成就，但并不能实现终极目标。”朱松纯回复道。他同时提到，国际学术界对“通用人工智能将很快实现”的论调也并不认可。例如，美国加州伯克利大学知名学者Stuart Russel就表示，“关于ChatGPT，更多数据和更多算力不能带来真正的智能”；美国纽约大学教授Gary Marcus则认为，“AI研究不应该关注过去内容的保存，而应该探索建立具有价值表达和推理能力的智能”；甚至OpenAI的首席执行官Altman也曾表示，“大模型的研究已经到头了、没有未来，AI研究需要新思路”。朱松纯关于AI研究的新思路，也在近期有所表露。在近日《杨振宁：百年科学之路》纪录片首映式的圆桌讨论中，朱松纯谈到，受到杨振宁先生对“物理之美”追求和信仰的影响，他认为所有的科学都是追求“用最简约的模型来解释纷繁复杂的现象”，通用人工智能亦是如此。 “我认为AGI一定不是一个几万亿参数的大模型能够做出来的一个说不清楚的东西，一定是一个非常美的、简单的东西。”他直言，“现在很多人在谈论的那些AI大模型缺乏可解释性，这些模型是什么都还说不清楚，更不要谈美感。” 朱松纯说，他从小向往物理学，尤其被物理学科的大一统理论梦想所吸引，并一直念念不忘。 “当时在中国科学技术大学读书的时候我就想，智能的各种现象——认知智能、感知智能、具身智能、心智、社会智能，等等，跟物理学中的各种现象（光、电、磁、重力等）类似，在这么多复杂的、说不清楚的现象背后，一定有一个非常简单的、美的数学理论，这是人类智能和人工智能所共有的。”朱松纯说：“30多年过去了，到今天我仍然还相信。”

如何判断AI系统

具备AGI的性能？

在期待通用智能体在人类社会大显身手的同时，如何判断人工智能系统是否具备通用人工智能的特征及性能、如何应对智能体可能带来的安全风险并进行管控与治理等，也是当前各方关注的焦点。行业的一个共识是，传统的人工智能测试已不适用于通用人工智能系统的评级。在本次成果展上，通研院联合北京大学发布了通用人工智能评级标准与测试平台（TongTest)。据了解，该测试平台依据发展心理学和心智理论，参考人类婴幼儿发育的测试标准，基于“能力和价值”双空间，在物理逼真测试平台上评测通用人工智能等级，全面考虑了通用人工智能的关键特征。宋国杰介绍说，具体而言，TongTest定义了通用人工智能三个基本特征，即实现无限任务、自主生成任务、价值驱动且能实现价值对齐。同时，TongTest还会从“视觉、语言、认知、运动、学习”五个能力维度及“初级自身价值、高级自身价值、初级社交价值、高级社交价值、群体价值”价值维度进行评价。值得一提的是，TongTest还拥有完备的测试任务体系，包括近100个专项任务和50多个通用任务。其中，专项任务用于衡量待测模型在能力和价值维度空间上的所处等级，通用任务用于衡量待测模型在人类真实生活场景和各行业场景中的综合评级。人类正迈向通往通用人工智能的新，中国科学家也十分期待迎接“人工智能的中国时刻”。但眼下，作为领先时代的存在，ChatGPT和此前谷歌的AlphaGo相似，引起了全球的竞相跟踪、追赶。对此，朱松纯认为，如果只跟在Deepmind、OpenAI后面跑，“永远不可能做出领先世界的成就”。 “我们要有胆量、气魄与定力，在新的科学花园构造自己的理论——可能我们这一代人也只是做一个转移和铺垫，但是我相信我们终将能够取得像杨振宁先生那样大师级的、领先世界的成就。”朱松纯说，“在通用人工智能领域，中国人有机会作出能够贡献给全人类的成果。”

朱松纯大模型登上了珠峰但通用人工智能是探月

朱松纯大模型登上了珠峰但通用人工智能是探月

猜你喜欢