给机器人装大脑,智元又拉来一位技术大拿

上个月,智元机器人完成了新一轮融资,领投方为腾讯

摘要:

2015年,罗剑岚到伯克利攻读博士,此后便一直探索 Robotics+AI,还曾在Google X、Google DeepMind担任研究科学家。在伯克利人工智能实验室担任博士后期间,其领导开发了世界上首个超人类的真机强化学习系统SERL/HIL-SRL。

凤凰网科技 出品

作者|姜凡

编辑|董雨晴

4月2日,凤凰网科技获悉,罗剑岚博士已在近期加入智元机器人,任首席科学家,根据披露,他将全面领导智元具身智能研究中心。

“已经和智元的团队共同工作了两三个月,智元在工程方面、在执行力等各种能力上,给了我很大信心,我觉得我们是有机会做出全球领先的具身智能系统的”,在今天早间时候的沟通会上,罗剑岚博士对我们表示。

图|罗剑岚博士

2015 年,罗剑岚到伯克利攻读博士,同时开始探索 Robotics+AI,此后其还曾在Google X、Google DeepMind担任研究科学家。但罗剑岚也发现,从2016年Google发布第一篇有关robot learning的论文开始,很长一段时间内能够部署到现实世界的机器人一直是零。

长期以来,其都执着于将强化学习应用于真实机器人操作,解决传统 RL (强化学习)依赖仿真环境、难以适应现实复杂物理交互的问题。

过去十年,罗剑岚也体会了强化学习从AlphaGo时期的高涨热情到逐渐平淡,但其始终认为,机器人的真机 RL 是一个长期命题,一旦克服、将对机器人学习的突破产生范式般的变革。

这十年间,机器人领域的进步总是与其它技术的重大突破相伴而行,“就像 CV 或者NLP 有一些突破,顺着这个逻辑,我们看到现在大模型迭代速度很快,大家也开始拥抱强化学习”,罗剑岚告诉我们,“大模型用大量数据预训练的知识帮助机器人上手,但它可能有百分之七八十的成功率。强化学习负责打磨最后的百分之二三十”。

罗剑岚此前已领导开发了全球首个超人类的机器人真机强化学习系统 SERL,使机器人仅需 20 分钟即可在真实环境中学会精密装配,任务成功率达 100%。在此基础上,他又推出 SERL的升级版 HIL - SERL,引入人类实时纠正,让机器人能完成双臂协调、动态操作等更复杂任务,训练 1 - 2.5 小时即可达 100%成功率。当时执行的任务,包括组装家具、颠勺煎蛋、插入U盘等。

此外,4月2日早间,智元机器人也正式宣布了与Physical Intelligence(Pi)达成合作伙伴关系。据透露,二者将围绕动态环境下的长周期复杂任务,在具身智能领域展开深度技术合作。

在美国,Pi是具身智能领域的明星创业公司,专注于给机器人造大脑(构建通用AI),去年10月估值已升至24亿美元,被行业称为机器人领域的下一个OpenAI。目前,Pi也已成功研发出π0、Hi Robot等具身模型。

罗剑岚的另一项重要工作,就是推进智元和Physical Intelligence(Pi)的深度合作。

在今天官宣合作的信息中,也披露了一些落地进展,目前基于二者的合作,智元机器人可以实现一个通用模型根据不同的指令输入执行多个任务,并适配多种末端执行器,如灵巧手、夹爪,同时可以兼容鱼眼和针孔相机等传感器。

根据表述,目前机器人保持动作柔顺性与位姿稳定性,双手灵巧配合,可以完成具有生物运动特征的围巾佩戴任务,并且还可以通过右手接过左手递过来的围巾执行“围”的螺旋缠绕动作。

上个月,智元机器人完成了新一轮融资,领投方为腾讯,该轮融资有多个产业方及老股东跟投,包括龙旗科技、卧龙电气、华发集团、蓝驰创投等。

当月,爱企查显示,智元机器人关联公司上海智元新创技术有限公司发生了多项工商变更,新增广西腾讯创业投资有限公司、卧龙电驱等为股东。此外,舒远春卸任法定代表人,由邓泰华接任。

凤凰网科技了解到,邓泰华在智元机器人任董事长、CEO。其过去曾担任过华为公司副总裁、计算产品线总裁等职务。

多位投资界人士曾向凤凰网科技表示,十分看重邓泰华的履历,“华为的鲲鹏、昇腾、欧拉,他都重点参与过”。可以说,智元机器人目前集合了多位计算机科学领域的大拿。除此之外,凤凰网科技了解到,智元机器人还在以150亿估值进行新一轮融资接洽。

打开APP阅读更多精彩内容