一个具身智能的通用外接大脑。而且不是端到端,是模块化提供能力。也就是各家机器人可以从中获取自己想要的部分能力。 腾讯强调,Tairos是国内首个以模块化的方式提供大模型、开发工具和数据服务的具身智能软件平台,即插即用的方式向机器人行业开放。 比如有的厂商在感知模块上还有欠缺,那就可以直接使用Tairos上的感知大模型;如果是长线程规划做得不够好,那就可以使用规划大模型。 腾讯RoboticsX实验室成立于2018年,由张正友领导创立,实验室的目标是致力于机器人前沿技术的研究与应用,重点关注在人居环境的实际应用。 张正友目前是腾讯首席科学家、腾讯Robotics X实验室主任、福田实验室主任。他是ACM Fellow和 IEEE Fellow,也是国际上最早将计算机视觉与机器人结合研究的知名科学家,在计算机视觉、语音处理、多媒体技术和机器人领域都颇具影响力。在加入腾讯之前,张正友已经在微软研究院工作20年。 后面技术路线进一步收敛到三大方向:移动、操作和智能决策。这是因为实验室认为最终要服务于人、走进千家万户的任何一类机器人都基本包含这三块能力。 比如在机器狗上研发的多模态感知-规划技术,可以让腾讯Max与宇树Go 2两款不同机器人根据人类语音指令在动态开放环境中自主完成多项交互任务。 人居环境机器人“小五”则融合了四腿轮足设计、大面积触觉皮肤、多指灵巧手以及安全人机物理交互等多项技术。可以在人居环境里行走、搬东西并和人交互。 张正友解释,他并不建议腾讯去聚焦做机器人硬件本体,因为具身智能本身存在更大的目标,比如养老。在这一命题下,触觉传感器、定制皮肤等方面能力能不能继续前进? 另一方面,双足人形是几千万年下在复杂环境中逐渐进化出的形态,但现如今的人居环境已经大不相同,大部分都是平地,那么双足就不再是必须,因为效率很低。 以及现在假如以人形为标准,那么很多想象力就被限制了。比如,如果机器人的交流也像人一样只基于语言,那么它的讲话速度就限制在了每分钟100个字左右,但是如果机器人有一个屏幕可以直接阅读,一分钟可以阅读的文字是300字左右,效率直接提升3倍。 现如今国内涌现出一大批机器人创业公司,腾讯走访过的企业就高达60家,这意味着在硬件领域已经不缺好用可落地的方案,因此腾讯当下可以更加关注软件层面,与硬件厂商一起打磨技术推动落地。 此次发布Tarios也是希望和厂商们深层合作,进一步优化拓展平台能力。腾讯强调,相较于商业化,他们认为这一步动作更应该被称为“产品化”,是将过去积累的能力包装成外部可以直接使用的产品。 比如张正友多次提到,具身智能当下还需要补足对3D世界、动态环境以及物体材料各方面的认知。这不是一句话、一张照片生成3D环境即可,而是需要让机器人在仿真环境里能够真正操作。 以及现在很多方案都是基于大语言模型做规划,但是针对现实世界,很多东西是文本所不能描述的。比如动物没有语言,但是它们都能在3D世界里很好生活下来…… 目前,腾讯已经提出了区别于业界端到端的解决方案——提出层次化学习解决方案, 在SLAP框架下(感知、学习、行动、规划),通过多个层次的不断积累和更新知识,让机器人更加智能,能够与现实世界进行交互,实现真正的具身智能,包括反应式的自主和有意识的自主。 张正友提到,未来具身智能的发展将围绕“IDEAS”框架展开,包括虚实集成世界、技术门槛降低、智能演进、智能体化和感知拓展。这些方向将推动机器人在复杂场景下的应用,例如养老服务等需要安全复杂交互的领域。 对于具身智能的时刻,张正友觉得距离“iPhone时刻”、“大哥大时刻”都还有一段距离,推出Tarios就是希望能推动行业更快进入到“大哥大时刻”。


