首页资讯正文

人形机器人运动大模型“龙跃”发布，可根据指令生成跑步、舞蹈等连贯动作

体育正文 2025-05-28 03:20:02 133 0

人形机器人运动大模型“龙跃”发布，可根据指令生成跑步、舞蹈等连贯动作

人形机器人运动大模型“龙跃”发布，可根据指令生成跑步、舞蹈等连贯动作

人形机器人如何像人类一样(yīyàng)自然运动？如何通过语言(yǔyán)指令让机器人理解并执行复杂动作？ 5月29日上(shàng)午，在上海张江科学会堂举办的2025张江具身智能开发者大(dà)会暨2025国际人形(rénxíng)机器人技能大赛上，国家地方共建人形机器人创新(chuàngxīn)中心（以下简称“国地中心”）联合复旦大学未来信息创新学院，正式发布了(le)全球首款生成式人形机器人运动大模型—— “龙跃”（MindLoongGPT）。龙跃大(lóngyuèdà)模型以“自然语言驱动”为核心，构建了从多模态输入到高保真动作生成的完整闭环(bìhuán)，颠覆传统运动控制范式。也就是说(yějiùshìshuō)，用户无需学习专业术语或操作复杂软件，仅需像与人类对话一样发出指令，例如“以优雅(yōuyǎ)的姿势(zīshì)递上一杯咖啡”、“挥手致意”或上传一段参考视频，龙跃大模型即可自动解析语义并生成对应的连贯动作，并支持通过追加指令实时调整(tiáozhěng)细节。这一能力，在教育(jiàoyù)、服务机器人领域具有颠覆性意义。动作(dòngzuò)部署本文图均为国地中心供图当前市场中的动作生成模型往往存在两大痛点：一是依赖(yīlài)高算力硬件，难以低成本部署(bùshǔ)；二是生成结果机械呆板，缺乏可控性。据介绍，龙跃大模型具有四大核心技术优势(yōushì)：一是多模态(mótài)交互、低门槛驱动(qūdòng)。MindLoongGPT支持文本、语音、图像(túxiàng)等多模态输入(shūrù)，用户只需用自然语言驱动，模型即可“一切行动听指挥”。传统方法依赖专业参数调整的桎梏被打破，真正实现“人人可用”。二是拟真度与(yǔ)时序一致性双突破。通过将人体动作(dòngzuò)视为“时序语言(yǔyán)”，MindLoongGPT对动作序列逐帧建模(jiànmó)，精准捕捉动作间的连续性，解决了长序列生成中的僵硬、跳跃问题，生成的跑步、舞蹈等动作不仅流畅自然，更保留真实人体的惯性节奏。三是结构生成(shēngchéng)与细节优化并重。模型采用(cǎiyòng)分阶段生成策略，从全局姿态到局部关节角度均实现毫米级精度控制。四是轻量化设计，赋能广泛场景。在保证性能的前提下，MindLoongGPT模型体积(tǐjī)被压缩至同类型产品的1/3，可在教育机器人、智能穿戴设备等嵌入式平台实时运行(yùnxíng)，为产业落地铺平道路(pūpíngdàolù)。据了解，目前国地中心在张江拥有5000平方米训练场(xùnliànchǎng)，集采集、测试(cèshì)、训练功能于一体，102台数采机器人可支撑(zhīchēng)每天3万条(wàntiáo)机器人数据采集、地面真值测试、人体数据采集、仿生数据采集。MindLoongGPT具有7B的(de)(de)模型参数大小，支持text2motion,、motion2text、motion2motion多任务，生成更丰富的动作。通过MindLoongGPT生成特技(tèjì)动作运动轨迹，借助全身跟踪小模型，从而可以在青龙(qīnglóng)机器人上实现丰富的全身动作。通过“龙跃(lóngyuè)”MindLoongGPT生成特技动作运动轨迹，可以在青龙人形机器人上实现丰富的全身(quánshēn)动作通过“龙跃”MindLoongGPT生成特技动作运动轨迹，可以在青龙人形机器人上实现丰富的(de)全身(quánshēn)动作国地中心5月29日同时宣布，将开放MindLoongGPT的开发者测试版本，并联合(liánhé)张江科学城打造“人形机器人创新应用孵化基地”，为(wèi)合作伙伴提供技术赋能、数据共享与算力支持，首批合作企业包括多家全球500强科技公司与顶尖高校研究院(yánjiūyuàn)，将共同(gòngtóng)探索人形机器人在元宇宙、智能制造等领域的深度融合(rónghé)。 (本文来自澎湃(pēngpài)新闻，更多原创资讯请下载“澎湃新闻”APP)

标签

津水北方 133 0

0

相关推荐

取消回复欢迎你发表评论:

评论列表

暂时没有评论

暂无评论，快抢沙发吧~