你可能见过那种遥控的机器狗,按一下按钮,它就往前走两步,再按一下就叫两声。那都是老黄历了。现在的机器狗,你跟它说话,它真能听懂,还能跟你聊天。
这玩意儿不再是个单纯的遥控玩具,变成了一个能跟你互动的“小家伙”。这篇文章就来扒一扒,这种机器狗到底是怎么回事,它凭什么能听懂我们说话。

市面上那几条有名的机器狗
一提起机器狗,现在绕不开这么几家公司的产品。
宇树科技 Go2
这应该是目前普通人最容易接触到的一款。价格不到一万块钱,让很多人有了“我也能买一台”的想法。它的样子很讨喜,跑起来跳起来的动作也流畅,后空翻、作揖、握手这些动作都做得出来。很多人觉得它“萌”,就是因为它的动作不死板,有一种活物的感觉。
小米 CyberDog 2
小米这条狗,长得更像一只精悍的杜宾犬,科技感更强。小米没把它当成一个封闭的产品,而是做成了一个开放平台。什么意思呢?就是它提供图形化编程工具,你就算不懂代码,也能通过拖拽模块的方式,自己给它设计新动作。这让它在极客和开发者圈子里很受欢迎。而且它的外壳能换,你可以自己3D打印配件,把它打造成你想要的样子。
波士顿动力 Spot
这家伙是行业里的老大哥。价格就劝退了绝大多数人,七万多美金一台。Spot的样子完全是工业风,谈不上萌,浑身都是力量感。它不是给你当宠物的,是用来干活的。比如去建筑工地勘探,去危险的工厂巡检。它证明了机器狗这种形态,在干正经事上很有用。
它怎么听懂人话的
这才是重点。机器狗能听懂我们说话,不是因为它里面藏了个人,而是靠一套AI系统在工作。它听懂你说话,分几步走。
①先是“听见”
机器狗身上装了好几个麦克风,叫麦克风阵列。这东西能帮它判断声音是从哪个方向来的,就算环境有点吵,也能把你的声音给揪出来。声音进去了,就轮到语音识别(ASR)技术出场。它的工作很简单:把听到的声音,转成一行一行的文字。
②然后是“听懂”
把声音变成文字只是第一步。早期的语音助手,你必须说很标准的命令,比如“执行握手”,说“来握个手”它可能就懵了。这就是自然语言处理(NLP)和现在流行的大语言模型(LLM)的区别。
过去的NLP,主要靠抠关键词。你说“帮我拿桌上的遥-控-器”,它就去抓“拿”“桌子”“遥控器”这几个词。
现在不一样了。宇树Go2这类机器狗身体里装了类似GPT的大模型。这等于给了它一个会思考的大脑。有了这东西,它就能理解口语了。你对它说“小家伙,来,握个手”,它能明白你的意思是想跟它互动,然后执行握手的动作。
而且,它还能理解更复杂的话。比如你对它说:“我今天心情不好,你过来陪我趴一会儿。”它能把这句话拆解成两个任务:移动到你身边,然后执行趴下的动作。它甚至能理解一点情绪。小米的CyberDog 2据说就能识别主人的情绪,你开心的时候它会摇尾巴回应。
③最后是“行动”和“说话”
大脑想明白了要干什么,接下来就是指挥身体去做了。AI系统把“握手”这个指令,翻译成一连串对身上十几个关节电机的控制信号,每个电机转动多少角度,用多大力,都算得清清楚楚。这样,你才能看到一个流畅的握手动作。
如果需要回答你,它还会用语音合成(TTS)技术,把想说的文字变成声音,通过扬声器讲出来。整个“听到-听懂-行动-说话”的流程就跑通了。
除了聊天,它还会干啥
一个能听懂话的机器狗,能力当然不止陪聊。它的“感官”系统也很厉害。
A.眼睛看得清,路认得准
它的“眼睛”是一套组合拳。头顶上那个不停旋转的东西是激光雷达(LiDAR),它向周围发射激光,通过回收时间来画出一张房间的3D地图,哪里有桌子,哪里有墙,清清楚楚。这让它在黑灯瞎火的环境里也能自由活动。
再加上普通的摄像头,它就能给这张3D地图“上色”了,能认出人脸,也能识别具体的东西,比如地上的拖鞋或者水杯。这一整套技术叫SLAM,让它可以在一个陌生环境里自己画地图、自己找路。
B.能自己学新本事
这种机器狗买回家不是一成不变的。厂家会通过网络给它推送更新,也就是OTA升级。就像你的手机系统更新一样,今天它可能还不会跳舞,下个月更新一个固件,它就学会了新舞步。
C.能干的活儿还挺多
有了这些本事,它的应用场景就多了。
- 在家里,它可以帮你拿个快递,提醒你吃药,或者通过语音帮你控制一下空调和电视。
- 在工厂或变电站,它可以代替人去做巡检。因为这些地方要么很危险,要么环境很枯燥。它可以自己走,自己读仪表,还能用红外摄像头看看有没有设备过热。
- 在救援现场,比如地震后的废墟里,人进不去的地方,它可以钻进去,把里面的影像传出来,帮助寻找幸存者。
那我们啥时候才能人手一条
听起来很美好,但想让这东西像手机一样普及,还有几个坎要过。
No.1贵
这是最大的问题。就算宇树把价格打到了一万以内,对一个“宠物”或者“玩具”来说,还是贵。贵的根源在于核心零件,比如那些反应快、力气大的关节电机,还有负责思考的高性能芯片,这些东西成本下不来,整机价格就下不来。
No.2技术上还不够完美
电池就是个大问题。它身上十几个电机都是耗电大户,导致现在这些机器狗,充满电也就能跑两三个钟头,玩一会儿就得找地方充电。
稳定性也是个挑战。在发布会上它能完美后空翻,但到了你家里,可能因为地毯没铺平就摔一跤。要让它在各种复杂的环境里都不出错,还需要大量的技术优化。
No.3隐私和安全
一个能到处走、带着摄像头和麦克风的东西在你家里晃悠,你的家庭影像、对话内容这些隐私数据,它会不会传到服务器上?这些数据安全吗?这都是大家会担心的问题。在没建立起足够的信任和监管之前,很多人恐怕不敢把它请进家门。
说到底,这个能听懂人话的AI机器狗,已经从实验室里走了出来,实实在在地摆在了我们面前。它不再是遥不可及的科幻,而是一个功能越来越强、价格越来越低的科技产品。
它代表了一种趋势:AI正在装进各种各样的躯壳里,来到我们身边,用更直接的方式和我们互动。
现在的问题很简单:你想不想养一条?你觉得它会把我们的生活搞成什么样?
原创文章,作者:七点互动,如若转载,请注明出处:https://www.qidianhudong.com/aiyy/1345.html