随着人工智能技术的飞速发展,具身智能作为其重要的分支,正逐渐成为科技界关注的焦点。雷峰 *** 此推出具身智能十人谈系列文章,旨在深入探讨这一领域的前沿动态、技术挑战和未来趋势,为我们的读者提供深度的行业洞察和思考。

ICRA 2024 大会主席王志东谈具身智能:中国有超越世界的一天丨具身智能十人谈

作为该系列的开篇之作,我们有幸邀请到了ICRA 2024大会主席、机器人学领域的杰出专家王志东教授,分享他对具身智能崛起之路的深刻见解。王教授不仅回顾了机器人学的发展历程,更特别强调了中国在这一领域的快速崛起,以及技术融合如何推动行业的创新和健康发展。

我们希望通过具身智能十人谈系列,搭建一个开放、多元的交流平台,汇聚来自学术界、产业界不同视角的声音,共同推动具身智能领域的进步。同时,我们也非常高兴地预告,具身智能十人谈系列的第二篇文章将带来联想集团CTO芮勇博士的精彩观点。芮博士作为人工智能领域的资深专家,将从企业实践的角度,为我们解读具身智能在产业应用中的机遇与挑战,敬请期待。

作者丨饶舒玮

编辑丨岑峰

ICRA 2024 的举办地点在日本横滨,距大会主席王志东所工作的千叶工业大学大约1小时车程。这短短的距离,凝聚了多年来他在机器人学领域的不懈追求和深厚积累。

面对规模超过七千人的盛会,王志东和他的团队前后花费了两年多的时间来准备。在大会期间,他与同样担任过 ICRA 或者其姊妹会议 IROS 大会主席的老朋友们——包括南方科技大学的孟庆虎教授、张宏教授、香港中文大学的刘云辉教授、香港科技大学(广州)的马书根教授、德国汉堡大学的张建伟教授等人得以相见。一起吃饭时,王志东所谈的之一个感受就是“累坏了”,而朋友们则是恭喜他,因为“你终于上岸了”。

也正因为在组织大会上花费了大量精力,王志东在采访中谦逊地表示自己没能及时关注到日新月异的行业变化。尽管如此,凭借着深耕领域数十年的经验,王志东往往能一眼看出一些热潮之下的本质,并对其始终保持“技术至上”的务实态度。“不要光顾着赶潮流,要真正把技术做扎实做好。”这是王志东对于整个行业向前健康发展的建议。

1989年,王志东来到日本东北大学开始他的硕士学习,1992年是他的博士生涯的开始。同一年,日本“第五代计算机”项目正式宣告失败,日本 AI 行业的辉煌时代正式落幕。从日本早稻田大学加藤一郎教授团队研发出世界上之一个人形机器人,到“五代机”这一持续数年、耗资巨大的项目流产,行业急转直下的境况与决策失误、方向选择不无关系。

而此后数年,日本国内对于深度学习等前沿技术不够开放的态度,更是让其 AI 行业再难有泉涌式的爆发热度。或许正因为是日本 AI 行业浮沉的旁观者,王志东对于方向有更深刻的理解。也许光有技术并不是全部,找准大方向,才是事半功倍的选择。

如今,随着全球人工智能的发展进入一个新的阶段,机器人领域也迎来了新一轮的井喷。

王志东将 ICRA 大会这些年人数增长归因于整个行业的蓬勃发展。机器人行业不断的增长,研究领域的不断扩大,还有人工智能的出现,这方面使得这一领域加入了很多新人。

其中,奋起直追的中国在这一领域已经成为不容忽视的存在。王志东很明显地感受到,近些年,中国在机器人领域和AI领域的影响力肉眼可见地提升了。相较于往年,王志东惊喜地发现在大会上、顶刊里、展会上都能看到越来越多中国面孔的出现。在今年的 ICRA ,中国团队的参会人数更是创了新高。作为同胞,王志东希望能将 ICRA大会办成一个连接中国和世界的桥梁。

谈及我们所关注的具身智能,王志东教授对未来充满了期待。他认为,具身智能是机器人学未来发展的关键方向之一,它涉及到机器人本体设计、控制和系统集成等多个方面。尽管目前人形机器人尚未达到如人类般自由行动的水平,但他相信,随着技术的不断进步,具身智能将为机器人技术带来革命性的突破。

在这个春意盎然的季节,在 ICRA 2024 的大会现场,我们有幸与王志东教授进行了一次深入的对话,探求他对于具身智能、机器人领域和未来技术趋势的思考。

谈具身智能:在时代风口把握方向

AI科技评论:对于现在讨论度很高的具身智能,您怎么看待这股热潮?

王志东:具身智能现在热度很高,但我认为如果机器人本体做得不够好,那么这个瓶颈就在那儿了,即使有智能层面的加成,也还是没办法实现突破性的进展。

对于具身智能,结合这些年的研究趋势,我有两点思考:

之一个是,其实 AI 出来的时候,ChatGPT 也好还是别的也好,它是找到一个 application 作为落点,让大家比较容易知道,其实所谓的系统模型很早就开始做了,是已经做到一定程度了才有了重大进展。

然后这个行业跟风涌进来了几百个公司,但一年之后这些公司百分之八十、九十都不存在了,这个说明什么?说明怎么运用好这个技术才是关键,有哪些东西能真正延续下去,这个才是我们需要思考的大模型的真正意义。

从我参加各种各样的论坛经验来看,发展就是不断寻找道路的过程。现在大家都在思考如何将大语言模型和机器人融合,其中机器人的运动控制是个挑战。我在这次 ICRA 2024 会议里已经听到有一些新的想法在冒头了,估计两三年肯定又有一套新的东西出来了。

第二个就是机器人的控制问题。具身是 embodied,顾名思义,和身体相结合的东西。机器人的体型是高是矮,动作设计都不尽相同,这些都和整体的控制相关。

在方面,其实有很多东西可以做。就像波士顿动力所展示的产品视频一样,看起来可能没什么,但背后有很高的技术含量,至少以国内现有的水平要做到像他们那样,还有很多工作要做。

但就像我经常和日本学生说的那样,因为中国有人口优势,所以只要继续朝着这一方面努力钻研,会有超越世界的一天,对此我比较有信心。

当下需要注意的是,如何把一项东西研究透,这点很重要,然后就是把握好机器人领域的方向性。如果把目标定为“超过 Boston Dynamics ”,那这样的想法只会让你成为另外一个 Boston Dynamics。这个行业最终要往哪个方向走?怎么做得更好?这是需要思考的问题。

AI科技评论:相较于机器人本体,ICRA 2024 大会会更侧重于对机器人智能的研究吗?现在行业的目光都聚焦在哪些方向?

王志东:从会议收录的论文来看,机器人学习与智能这一方向确实是最多人关注的。其中可以提炼出三个 keywords——医疗、机器人的作业和导航。这些方向在如今大热的汽车自动驾驶或者是别的方面都能体现出来。

但是像人形机器人,大家对它的想象中还停留在和机器人对下象棋,可这不是一个目标,这只是一个基准。我的夫人有时候会和我说,你赶紧设计一个能和我爸聊天的机器人,这就是一个助老助残机器人的方向,但这个产业能不能形成,还有很多因素影响,比如系统控制的技术能不能达到设想的水平。

据我对 ICRA 大会的观察,现在大家都在关注,怎么把人工智能领域的新 *** 运用在机器人上,并对其进行改造发展,我觉得这是很大的尝试。有人说这不算创新,我不认为会是这样。所有的行业都是通过把别的领域的东西拿过来,通过改造发展才成为了自己的东西。

我觉得更大的方向不在于怎么提高智能,而是如何把现在人工智能的好模型、好的方向性拿到机器人这个领域里头,如何在实际场景中真正应用起来,把它能做到就像是一个新的方向性,新的产业出来,我个人感觉这是这个行业更大的挑战。这就是我们所讲的具身智能。因为我的研究的方向主要是机器人和人之间的协调。在我看来,在机器人和人之间的协调是很重要的东西。就像讲到蚂蚁,很简单的智能,但可以做很多事。现在人工智能这些系统不断的增加,对我们有很大的帮助。所以现在大家都很努力地想把这些东西拿出来,我觉得这是目前行业更大的一个方向性。

AI科技评论:您怎么看待具身智能跟 AGI 之间的关系,你们机器人领域会谈 AGI 这个事吗?

王志东:通用人工智能的话,我相信它也是分开来看的,并不是说将来全人类全部适用一个通用的大脑,对不对?特别是搞研究的人,也有存在不同的方向性或者不同的特点。我的一些研究人工智能的朋友,他们也不是除了人工智能之外的事都不关注,他们也在不断询问如何实现实际应用。

其次,从机器人厂商出展的情况来看也可以了解到,虽然他们没有必须线下参加的必要,但他们还是来了,为什么呢?因为这是机器人领域的顶会,他们可以借此机会了解到很多领域内的发展趋势。举个例子,小孩走路的老摔或者拿东西老倒,但人长大后现在不倒了。这学习的实质,这其中的逻辑,其实对人工智能是很大的一个方向。对于机器人厂商而言,他们也会不断和这方面接触,所以这方面的融合是肯定存在的。

所以,并不是说研究人工智能和研究机器人完全是分开的两拨人。更何况,机器人内里有很多互相嵌入的东西,没有办法完全独立开来,包括 planning 类的东西。

AI科技评论:learning 等于 intelligence 吗?

王志东:并不是。因为我是研究机器人抓取手这一方面的,我们在研究的时候就发现,对在确定位置上的物体,机器人是可以很好做到抓取的动作,但是如果位置不确定不精准,对于机器人就很难实现这个动作。可人能在物体还没到固定位置的时候,就预判其动线,在有不确定因素的情况下也能实现抓取动作,这是人类很强的一个智能表现,这个动作本身就蕴含了策略的智慧和控制的智慧。

所以智能并不是说一定要通过 AI 或者算出来的才是智能,这些东西也都是智能。从控制上来看,包括走路、拿东西的动作,人的惯用动作都是最省力稳定的,这里面有大学问,是有很多“智能”在里面的。

所以如果说 learning 是 intelligence,这是不对的,但是通过 learning 可以增加 intelligence,可以在 learning 的过程中提高 intelligence 的质量。

人形机器人:一个集成技术试验台

AI科技评论:单就机器人这个领域而言,对于现在人形机器人的研究浪潮,您是怎么看的?

王志东:我认为,要搞好人形机器人比起单纯地做好 vision 或者 ChatGPT 要难得多。因为一个人形机器人 *** 了很多领域的东西,包括 hardware、control 以及 system integration。怎么能把这些东西都做好,这不是个简单事儿。

我也有了解到一些人形机器人产品,比如国内的 Unitree 就做得很不错,但是要说它完全能够达到和人一样自由自在的动态行动,还有一些距离。就机器人公司来说,我个人观点认为,Boston Dynamics 相较于 Unitree,在控制上会做得更精细。

AI科技评论:像宇树他们把那个机器人成本降到九万九的价格,这个在中国的媒体上也引起了比较多的讨论,您怎么看待硬件成本下降这一情况?

王志东:对于机器人这个领域而言,硬件成本下降是非常重要的内容。我个人觉得,降成本会让更多人参与进这个领域,以后更多人使用,就可以做出更多的平台。人工智能为什么能发展?因为大家都把东西放在 GitHub 上去,谁都可以用了,所以大家都可以不断地把这项技术提升。但硬件你不可能免费共享,对吧?如果能把参与门槛降低,到大家都可以用的程度的话,这自然更好。

英伟达的发展也是如此,他们在过去把 GPU 研究出来,然后利用这个从各方面把 application 积累出来。硬件做得好,做得便宜,用的人多了,发展方向自然也就多了,将来肯定会有突破性进展。

我个人认为,宇树这种产品的出现是一个很好的现象。因为国内也有很多厂家在做人形机器人,不同的水平,就意味着不同的状况,每一款人形机器人之间都是有差异的,技术难度也会不一样,未来对于社会的影响也是不一样的。但是可以预测到的是,越多人做,就越有可能实现行业新的突破口,这是向好的趋势。同时,我也觉得在机器人方面,研究范围可以再扩宽一些,不一定要光盯着人形机器人。

AI科技评论:在 ICRA 2024 上,人形机器人的讨论度如何?

王志东:人形机器人是其中一个很重要的方向,但我个人觉得,这个大会讨论度更高的其实是 learning 和人工智能。如何将最新的人工智能技术、最新的 vision 技术和机器人技术进行融合,这个方向的发展是我觉得最关键的,也是大会最多讨论的。

人形机器人并不是能够创造出新产业的一个方向。但是有关人形机器人的研究会影响到整个机器人行业的 system integration 和 intelligent integration 水平。

比如要做一个人形机器人,这个机械臂要怎么设计?像工业机器人的技术怎么适配到这种体型上,同时还要考虑机器人集成控制的能力。

人形机器人相当于一个万能的 *** ,包括优化设计和多任务处理能力,就像是个试验台。你把人形机器人做好了,你要做好别的东西就游刃有余很多。

现在有些观点认为,做好了人形机器人,就可以创造出一个完全新的产业,甚至于可以代替汽车的程度。我个人觉得至少现在还看不出来。但如果是让人形机器人实现物流行业的“最后一公里”,实现精准定位的送货上门,这个场景我觉得有可能实现。可是会不会由此产生一个全新的产业,我保持怀疑态度。

寻找产业落地的出路

AI科技评论:我看这次展会波士顿只派 *** 商过来,但没有实际展出产品,所以有人在讨论是不是波士顿在走下坡路,您是怎么看待的?

王志东:我不这样认为。从开发者的视角来看,其实公司有新的产品,没有必要特意运过来参展,拍个视频在网上展示也是一样的效果。他们现在更大的任务是将技术推广到实际,因为如果没办法投产应用,那么就没办法盈利,结果可能又要面临出售公司的情况。这也是作为一个高科技企业的挑战。

从另一方面来看,这个情况也说明了现在除了参展之外,还有很多方式可以展现产品。所以这次中国很多企业愿意来参展,我非常惊喜。同时需要看见的是,在网上刷屏赚足眼球并不能证明什么,很多东西是要扎扎实实干的。就像 Elon Musk 所宣传的人形机器人目前还没看到真的动作展示,在网上声量却很大,却不一定是真的能做到宣传的效果,说明这个人形机器人其实还是有很多富有挑战性的东西需要解决。

AI科技评论:我还注意到在这次 ICRA 上有很多家庭机器人的研究,您之前也发表过关于深度交互,机器人进入家庭生活这么一个趋势,您感觉今年有一些比较大的 Leap 吗?

王志东:我相信很快就会有。我个人观点现在预估有两个方向能实现快速发展。

之一个是 logistics物流相关的,因为需求太多了。比如 Boston Dynamics 就有在搞这些卡车装载纸箱的自动卸货的系统开发。但是仓储电商的取货过程做得算是比较好了,而装盒这一环节却还没有大的进展。考虑到现在电商对于物流方面的需求,这些支脉的自动化需求量也会非常大。

这个其实是和市场相关的,有 Eco(生态经济)就能够产生价值。所以说为什么 Amazon 很早能够成功?他们在早期就收购了 kiva robot,一个能够载着台子到处跑的机器人,这是革命性的东西,给电商 *** 行业的发展提供了非常重要的支撑。但却没能带动革命了整个产业,现在还需要人工在环节中。所以现在大家都在强调方向性。因为我是搞辅助机器人的,所以我认为辅助机器人协调这一块如果能发展起来的话,会有很大的价值。

第二个就是刚刚讲到的家庭机器人。对于这个东西,大家关注度都很高。大家会开始想在家庭或者各种情况下怎么进行 planning,怎么进行 manipulation?怎么进行 task ?我听到有一个 workshop 大部分都讲这事,所以看得出大家对这些比较热心。但你说明年就会实现重大进展吗?我不敢打包票,但不远的将来肯定会有发展。

AI科技评论:我注意到日本它有一个 moonshot 登月计划,大会上也围绕着这个计划做很多相关的展览,现在日本的机器人行业是什么样的现状?对于中国机器人行业的发展有何建议?

王志东:这个 moonshot program 更大 project 的 leader 就是我们 ICRA 2024 的Advisory Committee Vice Chair——Toshio Fukuda先生。这个 project 集中了日本很多水平比较高的教授研究员的团队。日本的这个登月计划是给出了一个方向,就是要瞄准我们现在还完全不可能实现的目标,希望多年以后在一些领域有突破性的技术。

因为日本这些年在科技上的投资比较少,做出的成果也比较少,像 ASIMO 这样的机器人研发工作也停了,没有什么新的东西出现,所以 professor Toshio Fukuda比较有紧迫感,他希望在今后十年里头,通过集智聚力在几个技术层面的冲刺,能够把日本机器人领域的研究水平拉上去,提高到一定的水准。

据我观察,国内现在很多研究的方向性很好。人形机器人也是一个很好的方向,但我还没搞清楚它背后的技术难题。做好人形机器人这一块是有意义的,但是在什么时机研究这些比较合适,我还不太清楚。如果能通过这些东西,像日本的登月计划一样,把科技水准提升到一个新阶段,那么对今后发展会有很大的帮助。我的建议是,扩宽研究的着眼点,不一定要完全跟着别人做,不要光顾着赶潮流,要真正把技术做扎实做好。

大会上的中国面孔

AI科技评论:这是 ICRA 第二次在日本举办,这次大会的参与情况如何?作为大会的 general chair,希望举办个什么样的大会?

王志东:ICRA 每三年在亚洲、欧洲、美国轮番举办。ICRA2024是第三次在日本举办的ICRA。前几年的会议大概是 4000 人左右的规模。去年在伦敦的时候,注册参会者规模已经达到 5000 多人,而今年的注册线下参会人数比我们预想的还要多,估计有超过 6500 人,增加了百分之二十,加上在线参会人士,这个规模可能会达到7000。

这些年参会人数增长的原因,我猜测有两个,其一是机器人行业不断的增长,包括有从自动驾驶转行的,有传统做人形机器人、工业机器人的,还有人工智能的出现,使得这一领域加入了很多新人。其二是,我们中国包括参展商、参会师生都增加了很多。从数据来看,去年在伦敦办会的时候,中国参会者大概只有 300 人,今年的中国团队来了有 1100 人左右,人数同比涨了3到4倍。

我希望能将 ICRA 办成一座桥梁,起到连接各国和世界的作用,这是我作为大会主席能想象到的最满足的事了。

AI科技评论:此次大会上, 据您观察中国参赛者表现如何?

王志东:在这次 ICRA 2024 上,中国的论文投稿数排行之一,录取数是第二,稍逊于美国。但就凭我的观察来看,美国所投文章里,中国人作为 first author 的占了不小的数量。我很高兴看到中国的研究实力在国际上肉眼可见地提升了。至少在我个人看来,中国已经成为世界第二大的研究团体,排在美国之后、德国之前。不管是论文数量还是研究水平来说,我觉得国内这一领域的研究已经达到很高的水准,未来很有希望。

就展区来看,这次大会布置有一百四十多个位置,其中中国展商就有很多,可见这个产业发展是非常可期的。相比国内举办的世界机器人大会 WRC,虽然来这里参展的中国展商没有那么多,但至少说明还是有相当一部分的企业有进军国外市场的打算。而且他们所展出的产品做得非常好。

AI科技评论:这次您作为 chair 的身份组织会议,和以前作为嘉宾参会,感受有什么不同?

王志东:从我的感受上,之一,要组织这么大规模的会议太辛苦了,我和团队组织了两年多的时间。我不是之一个组织这个 ICRA 的中国人,这个会还有个姊妹会叫IROS,我有好多中国朋友,他们都以前做过 ICRA 或者 IROS 的 general chair。

比如我刚才讲到的孟庆虎老师,他 2021 年就在西安组织 ICRA,还有港大的席宁老师,港科大的李泽湘老师之前也都分别组办过ICRA。那之外还有香港中文大学的刘云辉老师,现在南科大的张宏老师、香港科技大广州的马书根老师,德国汉堡大学的张建伟,他们也都组织过 IROS,都是我的前辈。当时我和这些朋友一起吃饭,我说自己终于有机会组织这类会议,但已经累坏了,他们开玩笑说你终于上岸了。

第二个更大的感受是,我们所在的行业在不断增长,越来越活跃,中国的水平越来越高。以前我们的文章投进去过不了,现在不仅投进去过了,还过了不少。虽然采用率的数字上没有达到和美国比肩的程度,但中国文章的采用率确实在不断上涨。更值一提的是ICRA2024有12个更佳论文奖项,其中3个更佳论文奖的获奖论文是来自中国大陆的。这是以前没有过的。10个技术方向的更佳论文奖中,华中科大的研究团队获得更佳机构与设计论文,浙大的研究团队获得更佳Vision论文,两项技术更佳论文大奖。2个ICRA更佳会议论文奖中,中科院沈自所的研究团队获得更佳大会学生论文奖。希望这些成绩能激励到更多的老师同学们,在今后创造出更多更好的成果展示在世界舞台。

ICRA 2024 获奖信息详见:https://2024.ieee-icra.org/awards-and-finalists/

雷峰网雷峰网(公众号:雷峰网)雷峰网