量子位 | 公众号 QbitAI
什么水平,让海外最火AI机器人Figure的CEO都第一时间关注?
国产人形机器人大秀肌肉,最新技能居然是弹琴泡功夫茶……和颠勺?!
手握琴竹,精准轻巧敲击每根琴弦,演奏动听音乐。
熟练泡一壶功夫茶,十几道工序、数个杯壶轻松拿捏。
搞定一份香喷喷的华夫饼,最后还附送一个祖传颠勺。
“闲情逸致”时还能带你练练咏春,这不就是机器人版叶师傅?
注意哦,以上操作都是机器人独立自主完成,原倍速展示。
不仅手超稳,而且各个动作行云流水、一气呵成,像吃了德芙般丝滑。
甚至是泡功夫茶这种繁琐的长序列任务,它脑子也规划得清清楚楚,把十几个不同的步骤,陶瓷、金属、木、茶叶等不同材质、到不同形状的碗、盏、壶、杯,拿捏得死死的。
这需要机器人能像人一样学习、规划和执行,有强大的泛化能力和通用智能。
如上就是今天正式发布的中国人形机器人Astribot S1。
它由初创公司星尘智能(Astribot)开发,而且不玩虚的,8月21日到25日会在北京的世界机器人大会上直接亮相,对公众展示。
今年4月,S1在首次技术展示中,凭借熨叠衣、分拣收拾、颠锅、吸尘到竞技叠杯等几十个对机器人高难度,对人真有用的炫技动作,初登场就引发国内外不小讨论。
美国网友惊呼:中国AGI级别机器人震惊全!行!业!
不到4个月,Astribot S1以整机形态正式发布,这次又为你做了什么?
做家务使工具秀武术十项全能
Astribot S1的技能中,很大一部分是大家最关心的做家务环节。标语就是:
你远行无忧(尽管去浪),我守护家庭温暖。你在家悠然(放着我来),我助你乐享生活。
先做华夫饼,暖。
S1能稳稳抓着汤勺舀出面糊,倒进华夫饼机。
识别出面糊铺满锅底后,它抓住锅柄合上盖子。
这个过程中,机器人的腰部关节很重要。抓住打开的锅柄,需要一个探身的动作。如果机器人的腰不能配合上臂,很难完成这个大幅前伸的动作。
然后“扭开”旋钮给面糊加热。
“抓”叉取饼,不忘展示“翻”手腕颠饼的骚操作。
继续挑战长长长长长工序的泡功夫茶,暖。
它不仅考验机器人的精细操作,更看在环境、任务、物品的复杂度交织时的智能规划。
泡茶一般涉及洗茶、冲泡、倒茶、分茶等多个环节,每个环节要用多种不同工具。
它需要判断出各个环节使用哪些工具,还要抓握一系列完全不同的物品。
它需要实时调整力控。比如从陶瓷杯子中舀出茶叶时,陶瓷光滑易碎,不能用太大力抓握;但是下一个动作马上是拿起金属水壶倒水,机器人就实时调整力控,确保可以拎起水壶倒水。
除此之外,Astribot S1还会使用吸尘器。它怎么知道腰部反弓大腿发力能减少腰酸……怕是常去健身房。
给猫猫喂饭,特暖。
甚至是远程逗猫。
主人只需戴上XR头显,在工位都能陪自家猫主子玩,带薪吸猫!
Astribot S1会通过设备实时远程获取人类手部运动轨迹,然后根据轨迹计算出自身双臂该如何协调,确保自己能在家有效和猫猫互动,同时又不搞乱房间or被误伤。
这需要机器人的运动系统能够快速响应,并能处理复杂的空间关系。
与此同时,Astribot S1还丝滑复刻了更多专家技能。
比如演奏扬琴。
因为琴弦和琴竹带弹性,对精准力控要求极高,机器人必须每次敲击马上准确反馈力觉,并实时调节敲击角度,太轻会触不到琴弦,力太大会出杂音,太慢乱节奏。S1:我太难了……
而上次丢纸飞机,这次上投篮。
这个动作需要机器人全身姿态协同配合,开始时持球弯腰并抬高肘部,然后在腰部逐渐直立时调整手腕,最后腰和手同时发力投出篮球。
还有预告片里,跳海草舞还顺便极限下腰,自由度炸裂。
对比3个月前的首次技术展示,Astribot S1一路开挂。
不仅移动和操作范围变大了,环境和任务也更复杂,精细化程度更高。
这些高难度、长序列、可泛化任务,Astribot S1是如何实现的?
高价值的上半身+可落地的下半身
首先在形态上,Astribot S1采用人形上半身+轮式底盘的路线。
上肢操作正在逐渐成为具身智能的焦点,自然界能用手干活的基本都是智能化水平非常高的哺乳动物,而人类大部分操作都由上肢和手完成,因此上半身的智能决策+操作,就成了解决真实需求、能实际落地应用的核心技术壁垒。而S1在4月刚面世时,就主打一个同规格机器人中“最强操作”。
而代表移动能力的下半身,星尘选择了“可落地”的轮式,稳定性高、能耗低、控制简单,更重要的是人类大部分时间都在平面环境生活工作,比如家庭、办公室、工厂和购物中心等,轮式已经能覆盖很大一部分应用场景。
而头、手、躯干均采用模块化设计,可按不同需求灵活组装或拆卸。
S1身体指标极度仿人,单臂自由度为7,和人类一样。手部有2根机械手指,能完成大多数任务,灵巧手也在研发中。
运动以及单臂负载能力都超过了人类普通男性,定位精度达0.03mm。
多维数据高效采集 突破具身智能瓶颈
如果机器人的智能看AI,那AI就看数据、算法和算力这三大要素。
GPT能产生划时代的突破,离不开数以百亿的训练数据,这些数据在互联网容易获取。而训练机器人,直接可用的数据几乎为零。因此能否获得高质量且足够便宜的数据,成了当下制约机器人发展的瓶颈,和拉开公司竞争的重要手段。
而星尘就在具身智能数据获取上具备独特优势。
一方面,S1能从海量的真实世界视频数据、人体动作捕捉数据中快速学习。另外,S1还能以第一人称视角高效收集视觉、听觉、触觉到力觉等最接近真实世界的多维度、高质量数据。
综合这些高质量数据,星尘就能进行更高效的规模化训练,同时降低了机器人高质量数据的采集成本、数据量级和新任务训练难度,极大提升了泛化性。
当与真实世界持续交互,S1能源源不断产生新的“学习资料”,从而持续学习进化,向通用人工智能迈进。这也是S1能在学习、思考和执行上如此像人的关键。
而在AI算法上,加载大模型,让S1具备在复杂环境中的感知、认知、实时决策能力,及智能理解和多模态交互执行能力,实现物体、任务和环境级别通用操作泛化。
这意味着S1有了“最强大脑”,能更快速适应新环境、新事物,“举一反三”,“一通百通”。
刚柔耦合传动 最强操作还安全
机器人的全能,极大依赖其身体,也就是本体或硬件。
S1的“最强操作”,就来自其独特的刚柔耦合传动机构设计。通过将传感器装入传动过程中,S1能实时监测力的传输。比如削黄瓜时,不是依赖轨迹估算,而是像人一样,精准感知削皮刀压到黄瓜上时力的大小,再精准控制力的输出,这种特殊的传动结构,显著提升操作精度。
值得一提的是,通过刚柔耦合的硬件设计和创新力规划算法,让S1具备极高安全性。通过刚柔耦合硬件设计和创新力规划算法,它能在交互中精确控制力度,在运动中不伤人、不伤物、不伤自己。够安全,才有落地可能。
得益于这套悉心打磨的完备技术方案,Astribot S1的发布总能给人一种“技惊四座”之感。
当下具身智能领域正处于“百花齐放”的时期。不仅新秀林立,各家机器人的形态和技术路线也各有千秋。
Astribot S1的技术路线如何形成?
出自腾讯机器人实验室一号员工之手
回答这一问题,还需从Astribot S1幕后团队看起。
星尘智能(Astribot),成立于2022年12月;名字源自拉丁古谚语 “Ad astra per aspera”,意为“穿越苦旅,以达星辰”,代表了公司对AI机器人技术普及的长期计划与坚定承诺。
创始人兼CEO来杰,具有16年机器人研发经验,是AI和机器人领域的“老兵”。他于2014年加入百度,后担任“小度机器人”团队负责人。
2018年,计算机视觉和机器人领域世界知名专家张正友博士,也是腾讯最高专业职级的杰出科学家,当时正在筹建腾讯RoboticsX机器人实验室,来杰以一号员工的身份加入,之后主导研发了轮腿式机器人Ollie。
星尘智能的另一位创始人戴媛,在UIUC获得学士学位,后在UCLA拿下博士学位,主攻机器人感知。她在Nature Comm和Science Adv等顶刊上发表过30多篇论文,拥有70多项机器人专利。与来杰相同,她也是2018年就加入了刚刚成立的RoboticsX。
也得益于在腾讯RoboticsX机器人实验室的经历,星尘智能非常重视Design for AI的“软硬一体”能力,还搭建了与RoboticsX相似的团队结构,一半人主攻机器人本体,另一半强调用AI算法去做感知和运动控制,以此来探索AI和机器人的强耦合。
团队也大多来自腾讯、谷歌、华为、大疆等企业,和国内外顶尖高校和人工智能研究院。
让数十亿人拥有AI机器人助理
从成立第一天起,星尘智能的愿景就是让数十亿人拥有AI机器人助理。
这样的机器人助理,要能像人一样学习、思考和劳动,与人流畅智能交互,会使用人的工具和设备、帮人完成枯燥、困难或危险的任务,才能不断拓展应用场景边界,引领“AI+机器人”技术革新。
公司很快完成数千万美元的Pre-A轮融资,由经纬创投领投,道彤投资及清辉投资等产业资本跟投,老股东云启资本超额跟投。
从四月技术展示,八月整机发布,星尘同时宣布于2024年内商业化。且通过关键零部件自研,S1具备明显的成本优势和价格竞争力。
总之,方方面面,星尘智能的脚步都很快。
而最快的,恐怕是机器人本身。四月时,创始人兼CEO来杰就放话:
欢迎大家来给S1提需求!
这样它的能力才能从55%、85%成长到99.99%,无限接近人类水平。
前文展示的打咏春拳这个能力,说不定就来自四月网友,如今已经实现了。
那你希望S1能为你做什么?