刚刚,稚晖君旗下创企智元机器人官宣了两个新动向——
一则是关于人事变动。
具身智能领域的国际领军学者罗剑岚博士,已于近日加盟并出任首席科学家。
罗剑岚在该领域已深耕10年,曾担任Google X、Google DeepMind研究科学家,是UC伯克利17万引大佬Sergey Levine团队的核心成员。
他曾参与打造世界上首个超人类的机器人真机强化学习系统SERL/HIL-SERL——首次实现将任务成功率提升到100%,在全球范围内被广泛应用。
接下来他将牵头组建「智元具身智能研究中心」,主导前沿算法研发与工程化落地。
另一则是关于公司新合作。
国际顶尖具身智能公司Physical Intelligence(Pi)正式和智元机器人达成合作伙伴关系,双方将围绕动态环境下的长周期复杂任务,在具身智能领域展开深度技术合作。
以及实属罕见的是,在竞逐AI、机器人以及软硬件的最前沿阵地,中美两家明星公司,竟然联手了。
稚晖君挖来具身智能领域大佬
罗剑岚,出生于1993年,本科毕业于武汉理工大学汽车学院。其后在AI和机器人重镇UC伯克利,拿到了博士学位。
从2015年开始,也是在机器人学习领域初步兴起的阶段,他就投身了机器人研究当中。
过程中,他逐渐将目光放在了将强化学习应用到真实机器人这一细分领域。
在积攒了一波学术经验后,2020年他毅然选择踏入工业界,进入谷歌多个机器人部门任职,包括Google X、DeepMind等。
在此期间,他与机器人学习领域的泰斗Stefan Schaal教授进行了一系列合作,主要学习了更多从底层动力学到上层控制的机器人系统知识。
值得一提的是,Stefan Schaal教授是UC伯克利机器人领域的领军专家,曾多次与李飞飞共同发表论文。
两年时间,当他所参与的项目被孵化为工业机器人创企Intrinsic后,他重新回到了伯克利从事博士后研究,师从 Sergey Levine。
Sergey Levine是UC伯克利电气工程和计算机科学系的副教授,专注于能够使Autonomous Agents通过学习获得复杂行为的算法,特别是能够使任何自主系统学习解决任何任务的通用方法。
Sergey Levine因两件事而声名远播。
一是他是领域内的大神,不仅谷歌学术被引用量为超过12.7万,还是不折不扣的顶会狂魔。
此前的不完全统计中,Sergey Levine 2018年在ML和NLP顶会上共发表22篇论文;ICML 2019,他参与论文数量排名第三;NeurIPS 2019、NeurIPS 2020,他均有12篇论文被接收……
其二,他属于UC伯克利的网红教授,此前推出的深度学习课程Deep Reinforcement Learning(课程代号CS 285)非常受欢迎。
回到罗剑岚,正是在回归学术界的这一时间,他参与产出了“强化学习+真机”这条路线上具有代表性的两篇论文:SERL和HiI SERL。
SERL/HIL-SERL作为世界上首个超人类的机器人真机强化学习系统,首次实现将任务成功率提升到100%, 在全球范围内被广泛应用。
具体而言,在SERL这项研究中,机器人能用20分钟学会装配电路板,成功率达到了100%。
这一结果真实验证了强化学习的有效性,而在这之前,该方法一直受到行业诟病。
至于HIL-SERL,则是基于SERL的升级版。不过与SERL仅依赖人类的示范不同,HIL-SERL还结合了人类的纠正来训练强化学习策略。
实验结果显示,使用强化学习框架HIL-SERL,研究者可以直接在现实世界中训练基于视觉的通用机器人操作策略。
其中,机器人经过1~2.5小时的训练后,就能完成主板、仪表盘以及正时皮带组装等操作任务。
更重要的是,成功率也是100%。
手握上述重要机器人学习技术,罗剑岚博士这次又选择加入智元投身工业落地。
中美明星具身智能公司,罕见联手
与此同时,智元机器人这次也选择了和一家国外同行开展合作。
Physical Intelligence,去年3月官宣亮相的美国明星创业公司,其团队全是一群机器人和AI大佬,联合创始人就有罗剑岚博士后研究期间的导师Sergey Levine。
据了解,这家公司在去年11月完成了4亿美元的A轮融资,融资后估值为20亿美元,主要投资者包括亚马逊创始人贝索斯、OpenAI、Thrive Capital等知名公司或投资机构。
关于智元为什么会选择这家公司合作的原因,可能还要从Physical Intelligence所推出的产品或技术来追踪。
就在今年2月底,这家公司推出了“分层交互式机器人”(Hi Robot)系统,它能够将视觉-语言-行动(VLA)模型,如π0 ,纳入一个分层推理过程。
划重点,分层推理。
面对“如何让机器人能像人类一样执行复杂任务”这个行业难题,Physical Intelligence早已明确给出答案:
让机器人学会以系统 2思维进行思考
合理推测,未来两家可能会在让机器人学会推理方面展开深度合作。
另外,据智元介绍,双方的合作已经初有成效,可以实现一个通用模型根据不同的指令输入执行多个任务。
同时也可以适配多种末端执行器,包括灵巧手、平行夹爪和旋转夹爪,并兼容鱼眼和针孔相机等多种传感器。
官方演示demo如下: