无障碍
x

全部频道

北京> 正文

机器狗能陪孩子逛街 京企新成果加速机器人落地

2025-06-02 05:39 北京日报

来源标题:京企新成果加速机器人落地

儿童节到来之际,一段机器狗在超市里陪母子逛街、提包携物、于人流中穿梭自如的视频在社交平台悄然走红。有网友惊叹:“Ta怎么知道谁是妈妈,谁是孩子?”这是北京中关村科学城企业的一项最新技术成果。昨天(1日),银河通用正式推出自主研发的端到端导航大模型——TrackVLA,具备纯视觉环境感知、语言指令驱动、可自主推理等功能,有望加速机器人走进现实。

非科研人员第一次听到“端到端模型”,会觉得陌生。简单理解,它就像动物的大脑,从“看到的图像”和“听到的指令”直接推理出“怎么走”,中间不需要人为拆分多个步骤。

传统机器人通常以“指令理解-环境感知-目标识别-路径规划”模块化形式单独处理分解的子任务,有的甚至还要对工作环境提前构建地图,而TrackVLA把这些能力整合了。

据了解,TrackVLA能让机器人拥有“听-看-懂-走”的闭环运动能力:一双眼睛看世界、一个智能“大脑”做推理,无需提前建图、不依赖遥操控制,实现语言驱动、泛化感知、自主推理、智能交互与运动。它不依赖提前建好的地图,能靠视觉输入理解环境,哪怕是没见过的商场、电梯、游乐区,它都能像人类一样依靠模型内嵌的环境理解知识“现学现走”。

在TrackVLA的支撑下,人只需对机器狗说一句“跟着妈妈”,它就能立即识别“妈妈”对应的目标位置。如果说“换成跟孩子”,它也能瞬间切换对象,并通过语音回复确认。在人流密集的购物中心,面对复杂的场景、多变的环境中多个相似穿着的人,它能准确识别原始目标并长时自主跟随,避免“认错人”。甚至如果目标走出视野,它也不会原地“发呆”,而是通过实时的空间智能和大模型推理能力“分析”出目标的大致位置,并规划轨迹重新找回目标。

银河通用相关负责人表示,TrackVLA成功在一系列陌生场景中完成了验证:例如在超市穿梭于人流和货架之间,准确跟随母子;根据语音指令切换目标,并在儿童玩耍时发出提醒;从电梯进入陌生商场,完成连续跟随任务;在人群密集的服装店中稳定识别并避让他人干扰;在目标消失后迅速分析并重新定位……

据悉,此次发布TrackVLA后,其机器人导航正式迈入端到端模型可商业化落地的阶段。

责任编辑:张思宇(QX0007)作者:孙奇茹

北京千龙新闻网络传播有限责任公司版权所有 未经千龙新闻网书面特别授权,请勿转载或建立镜像,违者依法必究新出网证(京)字013号 增值电信业务经营许可证 2-2-1-2004139 跨地区增值电信业务许可证

信息网络传播视听节目许可证0104056号 互联网新闻信息服务许可证11120180003号 京公网安备 11000002000007号

分享到: 关闭
QQ空间 新浪微博 微信 腾讯微博 QQ好友 百度首页 腾讯朋友 有道云笔记
按回车键在新窗口打开无障碍说明页面,按Ctrl+~键打开导盲模式。