中国最受瞩目的具身智能公司 发布首个基础大模型 说要打破行业瓶颈
今年11月,格力电器董事长兼总裁董明珠和新东方董事长俞敏洪在广东珠海格力总部合体直播。直播过程中,董明珠因商品链接问题突然训斥下属在当时引起网络热议,这一举动被外
1月10日消息,近日,银河通用联合北京智源人工智能研究院(BAAI)及北京大学和香港大学研究人员,郑重发布首个 泛化的端到端具身抓取基础大模型 GraspVLA。
据介绍,GraspVLA 的训练包含预训练和后训练两部分。其中完全基于合成大数据,训练数据达到了有史以来最大的数据体量——十亿帧「视觉-语言-动作」对,掌握泛化闭环抓取能力、达成基础模型;预训练后,模型可直接 Sim2Real 在未见过的、千变万化的真实场景和物体上零样本 ,全球首次 展现了七大卓越的泛化能力,满足大多数产品的需求;而针对特别需求,后训练仅需小样本学习即可迁移基础能力到特定场景,维持高泛化性的同时形成符合产品需求的专业技能。
GraspVLA 展示了无需大规模真实数据、仅通过合成数据达到基础模型的预训练过程,和进一步通过小样本微调使基础“通才”快速成长为指定场景“专家”的能力,定义了 VLA 发展的新范式。这一方式打破了世界范围内通用机器人当前发展的两大瓶颈 。
真实数据采集不仅 昂贵,且很难覆盖所有可能的实际应用场景,导致数据量不够无法训练出基础模型、采集成本过大以致无法盈利。即便不计成本地采集,由于人形硬件远未收敛,随着硬件更新,原有的数据效力将大打折扣,造成大规模的浪费。
数据的缺乏直接限制了机器人的泛化性和通用性。大部分机器人只能在特定的环境、特定的物体和特定的条件下完成专用任务,人形机器人无法实现规模商业化。
以 GraspVLA 为代表的银河通用技术路线具有低成本、大数据、高泛化的特点,突破了具身智能的发展瓶颈,将在2025年引领端到端具身走向规模商业化。(崔玉贤)
本文来自 科技报道,更多资讯和深度内容,关注我们。