作者丨饶舒玮
编辑丨岑峰
仿生学,一向被认为是一门“古老又年轻”的学科。古老在于人类从直立行走时期就已经学会从自然界获得灵感,年轻是因为不断在模仿的过程中创造出新的事物。创造力,是人类区别于别的生物的一种本领,也是人类战胜 AI 的一项天生能力。
在这个“AI 取代人类”言论喧嚣尘上的时代,机器人开始进入家庭场景,大模型的出色表现让人们不断惊叹,人们担心人类和机器之间的界限逐渐模糊,焦虑情绪不断蔓延。但在港科大(广州)教授马书根看来,“算力再高也算不出创造力”,对于人工智能 *** 他不担心,他担心的另有其事。
师从日本蛇形机器人之父,深耕机器人领域三十余年,马书根自认为是“保守派”。当这个领域的热钱不断涌向人形机器人和大模型时,马书根表示,社会资本应该往更需要的地方流动,而不是仅局限于智能方向。
具身智能的出现,让硬件的重要性重新被看见。拥有仿生学背景的马书根更加注重机器人在与外界环境互动时的身体表现。尽管仿生是从模仿开始,但是掌握机理,才是关键。在马书根看来,如果没有掌握机理,机器人就只能停留在按照指令完成动作,无法与外界环境实现互动,还远没有达到“具身智能”的程度。但要如何找到机理,如何验证机理的正确性,马书根仍在探索,这是一条尚待开拓的路。
对于机器人领域,马书根有自己坚持的哲学思考。他始终认为,这个产业的发展目标不应该是全球经济产值,而是对人类社会发展的影响,即利用机器解放人类劳动力,为人类摆脱繁重劳动的枷锁,改变多数人因工作重负而情感枯竭的社会现状,让人们的生活重心回归到个体之间的相处上。
在AI科技评论对马书根教授的专访中,我们可以了解到在传统机器人领域对于具身智能的看法,以及仿生学发展对于具身智能的影响和当前面临的行业挑战等。
以下即为AI科技评论与马书根就具身智能这一话题的访谈实录,限于篇幅,AI科技评论进行了不改原意的编辑:
具身智能是身体与外界的交互
AI科技评论:当年您为何选择赴日深造,又是如何确定的研究方向?
马书根:因为在上世界80年代初期,日本在机器人领域处于世界领先地位,所以当时的留学目标就是日本。1985年,我毕业一年后就前往日本东京工业大学进行深造,跟随梅谷阳二和广濑茂男两位教授学习,他们自70年代末便开始研究蛇形机器人。
之所以选择蛇形,主要还是我的兴趣驱使。从科研的角度来说,研究蛇形机器人有两点优势,之一是蛇结构简单,只有像一条绳索似的生物结构;第二是蛇的大脑较小,却能控制全身运动,这对于我们如何在资源有限的情况下实现功能更大化的研究很有启发。
当时的日本经济繁荣,产业界对技术创新的需求迫切,从那时我开始意识到,仅仅依靠兴趣驱动的研究难以在产业界获得广泛的认可和应用。我的导师也多次找我谈话,给我提供了航天机器人这一方向,主要解决零重力环境下机器人减震的问题。
但我还是更偏向研究工业机器人,在我博士期间就开始研究工业机器人的多关节和象鼻机器人。博士毕业后我去了小松制造所开始工作。在小松呆了一年,我认识到工业界不太合适自己,想继续赴美深造。于是我在1992年去了美国,1993年又回到日本成立了自己的实验室,正式开始科研方面的工作。
AI科技评论:作为深耕机器人领域三十多年的学者,您怎么理解具身智能?
马书根:我们可以从一个简单的例子出发理解其概念。比如,一条已经失去生命的鱼,借助一定流速的水流就可以让身体实现“游动”的状态。像这样的身体形态与外界环境产生交互,正是具身智能的一个重要表现。
在我看来,具身智能包含两种类型:一种是内在智能,它负责稳定身体内部的动态平衡;另一种则是从外界环境中获取信息,并根据这些信息调整内部状态以适应外界。
以人类为例,我们的日常技能并不只是通过教导完成,更多时候是身体为了适应环境进行主动学习。为了在不同的地形上稳定行走,我们的身体会自动调整姿势和动作。这种适应性和反应能力,正是具身智能的体现。
在过去,人工智能领域更多地关注计算和数据处理等虚拟层面的能力,现在人们开始思考如何把大脑的智能部分转移到身体上,从而在现实世界进行互动和操作,因此具身智能得以发展。
AI科技评论:仿生学这一学科背景对于您之后研究具身智能有何影响?
马书根:运用仿生学的知识,我们可以通过观测生物的运动方式,运用现有的控制 *** 来实现机器人与环境之间的交互。比如蛇在冰面上、在平地上、在崎岖的地面上,就会出现不一样的运动形态,这正是其内在智能的一种体现。生物体会根据其所处的不同环境演化出不同形状和运动方式。
1994年前后,具身智能这一概念还没出现,仿生学领域已经开始通过研究生物的动态行走来研发机器人,不仅仅是两条腿的生物,还有四条、六条甚至八条腿的都有,像仿昆虫的六条腿,仿蜘蛛的八条腿。像是现在的四足机器人就是动态模型,实际上和我们所研究的一脉相承。
但让机器人走起来还不够,还要实现稳定地行走,并具有承载重物的功能。要想实现稳定,最理想的状态就是和地面有三条腿以上的接触,保持稳定的三角结构。
从仿生学的角度来看,很多研究就是从观察开始的。我们当时为了研究稳定行走这一课题参考了鳖这一生物,关注这类生物的运动机制。虽然研究工作往往从观察开始,但我们不能仅停留在模仿现象的层面,而是应该理解其中的机理和内在的运行逻辑。
现在具身智能的研究也常提到大脑和小脑的类似功能,对此我持保留意见。有实验显示,有些生物即使切断了某些神经但仍然能运动,会跟随跑步机的速率变化改变自己的运动速度,这说明运动控制了并非全由大脑主导。
而人类的一些基本日常活动也并不需要用到小脑。类似漫步行走运动由脊髓等低级中枢所控制,它们驱动我们进行最基础的运动,使得我们能够自然地进行日常活动。但如骑行运动或跳水等复杂技能,就需要小脑协调训练。
“先学后破再创造”
AI科技评论:仿生如何避免单纯的模仿?您在研究仿生机器人时期,有遇到哪些印象深刻的技术挑战?
马书根:在仿生学研究中,每次都会遇到技术挑战。比如在研究蛇的行动时,让蛇按照预期爬上树棍就很难,因为蛇不听指挥。对于蛇的爬行动作,要研究各种爬的 *** 和样式。像是我们想象的蛇上树是转圈往上,但其实蛇是曲线爬行,其中有些平衡机制需要考虑。同时,要想实现机器人完全像蛇一样爬行还很困难,因为蛇关节短且柔软,而机器则很难做到。
所以仿生也不并是完全模仿,要先学后破再创造。最初人类模仿鸟类用手臂上下拍动尝试飞行但失败了,后来靠核心机和固定翼才发明了飞机,之后才有了空气动力学等研究出现。
就仿人机器人这一块来看,“破”这一方面还有待发现。现在的人形机器人以电机为主,关节肌肉等模拟技术还在发展,短期内想要完全代替人类不太可能。
其实,仔细研究人体就会发现,人在完成动作时力学系统配合得很流畅合理。比如我们会发现快走比小跑还累,这是因为两种运动的能量模式不一样。人在走动时单腿摆动,重心有上下变化,向前走时重心会下降再上升。而跑步时不只是重心上下变化,你也会感觉到跟腱被拉伸。人走动速度不固定,有快有慢。速度低时势能和动能有效传递,不需要太多肌肉能量;快速行走时,来源于重心上下变化的势能远远达不到动能的需求,依靠肌肉提供更多的能量。人跑步时,不只重心上下的势能还有跟腱的弹性势能用于和动能有效传递,这样比同速度走动需要较少的肌肉能量。所以感觉小跑比快走要轻松。
AI科技评论:不同于模拟环境,您认为面对复杂多变的现实环境,机器人可以如何应对?
马书根:机器人需要通过传感器获取数据,识别障碍物,再规划动作,这个过程就是一整套的闭环控制。如果在其中某一环节没能够及时反应,就会导致其余环节脱节,可能出现机器人在高速运动时发生碰撞的情况。所以,我们提出了一个理念,即不能完全依赖认知来完成动作,而要通过机构设计实现。
在机构设计上,我们合理利用了欠驱动系统。比如,当机器遇到障碍物时,传统思维是抬起或避开,但我们尝试通过来源于障碍物推力被动改变运动模式来继续前进。这种创新的设计思路让我们在解决问题时有了更多的选择。通过科研上的不断进步,让我们开始尝试通过机构本身的调整来解决问题,从而实现更可靠更高效的移动方式。
例如,现在我们在研发机器人抓手的时候,经常需要面临这么一种情况,即如何在高速运动的时候提高抓取的鲁棒性。按照一般的思路,一般会在机器人抓稳后再用驱动器吸取固定,但这样驱动器数增加并控制会复杂。运用调整机构设计的方式,当遇到电机功率满足“抓”这一动作后,可以让同一电机驱动吸取机构移动,实现安全可靠抓取。同时利用气压驱动也能够完成抓取和吸附动作,如此也能够可靠的完成目标任务。
AI科技评论:在您看来,目前仿生机器人发展到什么水平?未来的突破方向会是什么?
马书根:按满分100分来看的话,目前的仿生水平未达到40分,一些动作像走动、跑动、翻跟斗等,与人的动作还有差距。虽然像波士顿动力等公司的电机技术在近几年有很大的进步,但像往上跳、打跟头、背跃式跳高等高难度动作,要么是所需电机功率太大,要么是机体需要较大弹性,导致这些动作都很难实现。
尤其是在模拟人体肌肉的复杂性和协同性方面,目前的技术仍处于初级阶段。人体在行走、奔跑乃至跳跃时,不仅依赖于四肢的力量,还涉及到腰部、背部等多块肌肉的协同作用,这种全身性的动力链传递机制是现有机器人技术难以完全复制的。
剩下的60分,我认为突破的关键在于基本的驱动器,就如电梯平衡系数一样,运行时所需的能量与自身重量比值越高越好,但目前我认为这一方面并未达标。相反算法方面整体都有了很大的提高,也相对容易实现优化。但基于机理的算法相对不足,需要硬件方面更要努力跟上。
无法算出的创造力
AI科技评论:您认为机器人领域突破发展瓶颈的关键点会是什么?
马书根:我认为是机理,我一直觉得现在的机器人研究始终没有把握真正的机理。即使大模型出现后,这一部分也并没有得到发展。
因为虽然大模型能够帮助处理大量数据,并在感知到决策的过程中展现出了巨大的潜力,但因为其“黑箱”的特性也带来了可靠性的问题。这也在某种程度上限制了工业界对于大模型的使用,特别是高精度高可靠性要求的领域。这些领域的企业需要有很明确的排障方案,而大模型因为难以解释其决策依据往往找不出故障原因。
在算力还没那么强的上个世纪70年代,计算机领域尚可通过日积月累形成一定的机理基础。到了八九十年代,计算机的算力逐步提升,但机理方面还没有大的突破。如今,尽管这个领域有了很多突破,但其实很多都是因为算力的提升才得以解决,并不是因为对机理掌握程度的提高。
此外,尽管机器人技术日新月异,但机器人学科的基础科学知识尚显薄弱。在90年代中期,日本等国就开始探讨这一问题,任何学科都一定要有坚实的基础知识来支撑其发展。无论是机械、电子还是信息科学,都需要在各自领域内深化基础研究,才能推动机器人学科的成熟。
AI科技评论:机理可以通过什么方式探索?未来的机器人发展方向会是什么?
马书根:目前没有一个定论,也没有 *** 可以验证机理的正确性。所谓的机理都还是假设,需要有实际的东西来证明。
以人形机器人为例,尽管它目前非常热门,但我们并不认为人形是机器人发展的唯一方向。机器人的形态应该根据具体应用场景和需求来确定,而不是盲目追求人形。
在功能上,我们更强调机器人的辅助性,它们应该能够辅助人类完成一些危险、繁重或人类不愿意从事的工作。试想一下,当危险系数很高的工程全部可以由机器人自动化完成,人类得以解放享受生活,那才是机器人真正理想的应用场景。而不是像现在的一些宣传概念,机器人取代人类出现在日常的家庭场景中,尤其是在养老和育儿这两大类看护型场景中,这才是人类最需要存在的地方。这类需要人类进行情感关怀的角色绝不能由机器人来承担。
世界上的产值增加了多少,对于人类社会的发展来说并不是最关键的,如何利用自动化解放人类才是需要我们思考的东西。所以我认为目前的社会资本应该往更多需要的地方流动,而不是只局限在一个方向。
AI科技评论:您如何看待具身智能领域现在的发展现状?
马书根:具身智能这个领域现在学习算法方向的年轻人多了,但是这个领域还很需要机器人方向的人才。学习算法无可厚非,软件实力也已经大大提升了,需要有一些新的东西出现。
要想做机器人的研究,不能光靠软实力,必须两条腿走路。算法这方面现在相对来说比较容易解决,硬件背后的机理研究更需要受到重视。特别是在这个时代,人的创造力才是最重要的,这是无论怎样提高算力都没办法从人工智能那里得到的东西。创造力也没办法从书本里的知识里得出,很多时候反而是“玩出来”的。所以,我现在经常和学生说,别只是钻研书本,要多接触社会,要多看看外面的世界。
由市场决定科研价值
AI科技评论:在您看来,您怎么衡量一个研究的科研价值?
马书根:我现在衡量一个研究成果的科研价值时,主要考虑这个成果能不能经过市场经验,实践后能不能看到效果。总结此前与企业合作的经历,我们更希望研发成果不仅只局限在某几家企业应用,还能为更广泛的应用场景提供借鉴。
举例来说,当某钢厂希望我们能设计一套管道检测机器人时,我们更关注这一设备日后的应用和共性需求。比如,检测的内容是什么,这个尺寸是否适用于别的场景,如何确保检测的准确性和效率等。我们更希望这套设备具备通用性,而不是只用于这一个公司。所以在研发的时候,提炼出适用于类似场景的共性技术,为未来的研究和应用提供有价值的参考,如此研发投入才更有意义。
我现在认为,在开始一个研究前,就要从实用性层面来思考,在这个场景里到底需要什么样的形状,什么样的材质,要达到什么样技术水平等。在我看来,科研价值可以分为两种,一种是基础科学, 像是数学、物理等学科知识,在全行业适用;一种是技能的应用,可以发展出什么样的产业,真正可以投入使用,这样科研的价值才得以体现。
AI科技评论:您下一步想要攻克的科研方向是什么?
马书根:我希望研究出一种医疗机器人,可以直接进入人的身体,打通血管,解决血栓等问题,或是直接可以达到病灶,减少药物对人身体的副作用。最后处理完,就可以通过某种方式变成营养增强人体抵抗力。
AI科技评论:能介绍一下您现在的研究项目吗?
马书根:我最近在研究适用于近海领域的水下机器人。这类水下机器人通常使用螺旋桨作为推进器。如果是在深海,这可能没问题,但在近海就比较难实现,因为螺旋桨可能会卷死海洋植物,或者是在靠近海底面观测时卷起杂质影响观测等。
所以我们团队希望通过仿生学的方式,研究什么样的机器人可以在不对生物造成影响的情况下进行作业,这在近海养殖等蓝色经济领域有比较大的需求。
雷峰网(公众号:雷峰网)雷峰网雷峰网
发表评论
2024-09-06 05:31:05回复
2024-09-06 05:35:08回复