宠物之外,陪伴机器人的市场在哪里?大众对于索尼 AIBO 机器人的追捧可以给出很明确的答案。
但是为什么选择在当下入局机器人赛道,哈崎机器人的创始人&CEO 谌振宇是这么回答的,「2019 年,AI 技术在快速地发展,很多行业都已经大量地利用 AI 技术解决机器识别物体的问题。」在 AI 的帮助下,机器人能够正确地理解世界,和人类有更多主动的交互,是他创业的契机。
在他看来,好的陪伴机器人应该是以合适的售价解决用户的需求,而且更主动地承担陪伴的服务。主动提供服务而不是被动等待唤醒,谌振宇认为这也是哈崎机器人相比其他公司的竞争优势。
而从互联网创业转向硬科技创业,谌振宇觉得两者还是有很多相通的,很多互联网的思维在硬科技领域也是适用的,「技术是手段,而不是目标」,「小步快跑」的思路同样也是可以用在硬科技的技术研发上的。
哈崎机器人目前能满足哪些需求,陪伴机器人的核心本质到底是什么?以及陪伴机器人行业的未来发展等,关于这些问题,谌振宇在这次采访中也进行了详细的解读。
1. 情感陪伴的核心是对服务对象的理解,包括了解用户的情况、当下的情绪,以此为依据完成符合用户预期的服务。
2. 机器人是作为一个面向用户的产品,首先它要解决用户的需求,其次是以合适的售价让用户可以接受。
3. MIT 的四足机器人技术开源给出了一个简化模型的完整实现,但是后面的学习曲线仍然异常的陡峭。
4. 互联网思维是站在用户的角度,使用对应的技术或商业模式去满足用户的需求;技术是手段,而不是目标。从 PC 到移动互联网、再到机器人,这种思维是可以一直沿用的。
01
情感机器人不是宠物的替代,
而是补充
Founder Park:养猫、狗是现有的主流情感陪伴方式,为什么会觉得机器人还有机会?
谌振宇:我们认为情感陪伴其实就是满足用户的需求,真正的内核就是陪伴。而按照用户的需求提供服务,应该是有多种方式可以完成的,机器人在这里面可以做很多事情。能够提供情感陪伴的前提是要理解环境与人的情绪。猫、狗作为宠物与其他动物最大的区别是它能懂得人的情绪,在这基础上它能够做出让人类觉得满意的互动,可以帮助释放压力。机器人要实现这样的服务,首先它要能理解环境,要理解周边发生的事情,要理解人的情绪。
其实机器在我们的社会里存在了很久,在生产线上到处都有机器的影子,如果机器要走到我们的日常生活中,重要的一个突破点是要让机器理解这个社会,这就是我们在 2019 年时候看到的机会。AI 技术在快速地发展,很多行业都已经大量地利用 AI 技术解决机器识别物体的问题。在这个情况下,我们认为机器人是有机会去理解这个世界的;在理解世界的情况下,让机器人做出符合人预期的行为。我认为这是机器人能够进入到家庭里的一个重要契机。
Founder Park:情感陪伴的本质是什么?
谌振宇:我认为情感陪伴是一种服务,情感陪伴的核心是对服务对象的理解,包括了解用户的情况、当下的情绪,以此为依据完成符合用户预期的服务。大家认为猫和狗能提供情感陪伴,很多例子是在伤心的时候狗能够安慰人,但其他动物就做不到,说明狗对人类的情绪是有一定的甄别能力的,我认为现在的 AI 技术是可以做到的,其实也不需要特别准确,宠物也不完全知道人的情绪是怎么样的,但大概是能让人满意的。更好的陪伴需要更多的理解,才能够提供完全符合预期的服务;随着环境识别能力的不断提高,机器人能够提供的服务就会越来越精准。
Founder Park:情感陪伴机器人会实现宠物的数字化替代吗?
谌振宇:这个不是我们的出发点。人需要个性化的服务,我们希望机器人能满足每个人的个性化需求。有些人需要的是宠物,而有些人需要的是管家。可以认为这是一个有趣的机器人管家,像宠物有可爱的一面能够让人放松,又能像管家能帮助人做很多事情,诸多功能集成到一个机器人身上,为用户提供个性化的服务。
Founder Park:除了AI,情感陪伴机器人还需要哪些技术条件?
谌振宇:机器人的视听能力随着 AI 的成熟不断完善;机器人的决策依靠软件链的能力,过去已经具备了。这些能力都具备之后,要考虑的就是价格问题,需要什么样的组件才有可能实现用户能够承担得起的产品。
我们当时对这个行业做了一些很深的调研,一台机器人拥有眼睛、耳朵、大脑,其实很像一台手机,再加上运动能力,则依靠关节和运动肢体完成。关节不需要核心的元器件,硬件成本不高;一个手机的 BOM(物料清单)成本加上运动部分的成本,机器人的成本应该也不会太高,如果把这个产品做好了,同时价格也是可以接受的,是有机会进入每一个家庭的。
市场上有需求,技术路线有明确的解决方案,成本也有机会做到很低,这是我们坚决要踏入这个行业的重要原因。
Founder Park:一台好的机器人应该如何定义?
谌振宇:机器人是作为一个产品面向用户的,我觉得首先它要解决用户的需求,其次是以合适的售价解决用户的需求。
从用户需求的角度,我觉得未来的劳动力缺失不只是出现在生产线或者工业线上,家庭中也会有劳动力缺失的问题。年轻人在一线城市承受了很大的压力,如何让大家放松,如何解决生活中的一些压力、琐碎的事情,机器人应该朝这个方向去努力,那么我们要想办法在用户能够接受的价格范围内去完成这样的产品,朝着这样的方向去分析需求和解决问题。
02
哈崎机器人
目前能实现哪些需求?
Founder Park:为什么选择做情感陪伴机器人?
谌振宇:可能也有情结的原因,我深深地受到一些科幻片的影响,比如《星球大战》里 R2-D2、C-3PO、BB-8 这样的机器人给我的印象是非常深的。机器人不只帮助人类解决问题,同时它也能帮助人类解压,比如 C-3PO 就是一个很好玩的人型机器人,它做的基本上是帮助人类释放压力的工作。
2019 年做项目调研的时候,我们看到技术已经成熟,机器人可以做好一些人类不喜欢做的、或者不太想去做的琐碎的事情。如果机器人进入到我们的生活中,它会带来很多的服务,人类就可以更好地投入到创造性的工作中。那个时候就决定我们要做一个机器人,把机器人送入千家万户,让每个家庭都拥有一个能够真正做服务的机器人。
Founder Park:目前哈崎机器人可以做哪些交互动作?
谌振宇:举几个例子。比如它会每天迎接你回家,你可以想象家里有人在期待着你,可能会用不同的方式迎接你。其次是可以陪着你一起运动,可能是陪你跑步,帮背水,跳绳时帮你计数;累了的时候给予鼓励等,增加运动的持续性和趣味性。离开家的时候,可以通过机器人更好地了解家里的情况。
播放
00:00
进入全屏
50
点击按住可拖动视频
交互通过几种方式: 第一个是指令,指令分为语音指令和手势指令,它现在能听懂几十种指令,并且未来可通过 OTA 升级不断增加;它能识别手势的命令,可以通过手势进行沟通,比如让它过来、走开、趴下等等 第二个是反馈表达,现在的机器人具有 16 个自由度,有可动的头、可摇晃的尾巴、丰富的表情、随情绪变化的灯光、可在线学习的多种动作组合等等。 第三个是情绪大脑,机器人在收到指令时,会依据内部决策和自身情绪作出响应,也许会热情地积极互动,也许也会拒绝你;它和用户的关系可以理解为养成模式的,更多的接触和互动,能够增加它对用户的熟悉度和好感度。 机器人对指令、环境、人物的识别是优于宠物的,这是 AI 赋予机器人的能力;我们也会逐步地开发更多的功能,比如在播放音乐的时候它会跳舞,机器人是能够听懂音律的,动作的优美与否是根据产品设计决定的。 Founder Park:哈崎四足机器人的性能、续航、安全性怎么样? 谌振宇:目前我们有两代机器人产品,一代运动速度是 1.5 米每秒,能够实现陪人散步的需求;新的二代机器人有更小的体积和重量,但速度可以达到每小时十多公里,可以陪人一起外出跑步。 还可以做一些高难度的动作,比如空翻,但我们不会把这样的能力向用户释放,因为机器人自重 9 公斤,做这样的动作还是有一定的危险性的,并且在日常生活中没有需要的场景;机器人可以在硬装的路面上运行,摔倒了之后也是可以自己站起来的。 四足机器人充满电可以运行两个小时以上;在家没电了它会自动充电,达到一定电量后会进行主动行为,可能去它喜欢的地方,或找喜欢的人玩。 在户外,机器人是具备一定的识别环境安全性的能力的。比如它能准确识别出公园的路面是安全的,会让自己在安全的环境下去运行。目前机器人是无法在水里运行的,这可能是我们需要去解决的问题;但它能够运行的地方,一定确保自己和周边是安全的。 Founder Park:很多四足机器人走路都很吵,降噪这方面是怎么处理的? 谌振宇:噪音来源于两个方面,一个是电机的运行声音,我们的电机噪音很低;第二个是机器人踏步的方式,这方面我们有很大的突破,比如我们机器人的踏步频率比一般产品低 50%,踏步频率决定了产生噪音的多少,我们在家庭环境内,慢速情况下采用三脚步态,踏步频率更低,运动噪音就小了很多。 Founder Park:情感陪护机器人会考虑做成人形机器人吗? 谌振宇:我们最早考虑过做人形的,但研究之后觉得现在不是合适的时间点。如果是人形机器人,除了进入家庭的安全性和功能性考虑之外,用户一定会希望其对话沟通能力非常强,以目前的技术是有难度且无法满足用户的需求,满意度会随之降低。我们认为在早期,以宠物形态,用可爱一点的 ID 去实现的机器人,用户的预期会对标宠物而不是人,这个时候产品的表现力会更好地带来惊喜。 Founder Park:哈崎机器人的竞争优势是什么? 谌振宇:我们强调主动性,是一个主动提供服务的产品,而不是被动地等待被唤醒的状态;在情感陪伴的这个需求上,主动性是一个非常必要的条件。 要实现主动性,需要收集更多的环境信息,去实现更强的环境计算能力,这是我们区别于其他产品的部分。比如语音,一般产品可能只收集到语音的内容,我们会收集语音的情绪,语意的理解,并且结合周边环境等去分析人物的状态。只有对这个世界的认知越来越多,服务才会越好。比如家里有人过生日,点蜡烛时,它会主动唱生日快乐歌,而不是等到人发出指令才做出这个行为;强调的是让机器人主动服务,这也是我们努力的方向。 Founder Park:还有哪些场景是哈崎未来想实现的吗? 谌振宇:在家里,机器人作为管家把人不愿意做的琐事都打理好;比如整理家里的环境,可能是自己动手,也可能是操作其他的智能家电达到家务的目的。现在很多地方都能看到,机器人的运动控制能力是有保障的,关键点在于它能否准确地识别环境,机器人自主判断这个地方是不是脏了、需不需要清理;未来机器人真正需要具备的能力是对环境计算的能力,随着机器人认知、识别能力的增强,这些事情变得越来越可期了。 我们现在要做的是在不断提高机器人感知能力,让它能够提供更多的服务。因为现在的情况是很多事情都还做不到,由于机器人的感知能力受到很多限制,包括算力的限制,有一些能力是还不具备的,比如家里有煤气泄漏,如果它能感知到是可以处理很多事情的。 03 互联网思维同样 适用于硬科技行业 Founder Park:情感陪伴机器人的发展历程是怎么样的? 谌振宇:1999 年日本索尼推出了 AIBO 机器人,当时并不能算真正的机器人,只是小狗形态的自动化机器,没有太多的算力,但那个时候日本用户对这款产品很有好感;AIBO 在 2006 退出市场,2017 年索尼重新推出了搭载人工智能的 AIBO,获得了日本用户的好评。索尼停止服务期间,用户之间自发地组织了配件的维护,比如当 AIBO 已经完全不能运行了,配件可以拆下来给其他用户使用;2018 年甚至有 200 个用户把 AIBO 集中到一起在寺庙中做了超度,可以看出机器人是完全可以和人建立感情的。 情感陪伴机器人进入家庭仍处于一个发展中的阶段,但我认为 2020 年是一个很好的时间点,运动控制相对成熟了,一些相关的技术在快速地发展,使得机器人和人互动成为了可能,也让我们有信心去完成更好的产品,我相信智能机器人会比自动驾驶更快地进入家庭中。 Founder Park:创业到现在两年的时间,在产品和技术上有什么样的迭代? 谌振宇:今年会发布我们第一款便携产品,这个产品是完全自主的,能够识别声音、手势指令,提供陪伴功能和一部分家庭管理的功能。比如在点蜡烛的时候主动唱生日快乐歌,就像一个努力融入家庭生活的一个新成员。 机器人提供服务所用的技术都是我们自主研发的,过去一年我们主要在攻克如何把机器人小型化,重量控制在 10 公斤以内,使机器人进入家庭成为可能。硬件上的技术突破有很多,比如身手要足够小,关节要能提供大的扭矩同时重量要轻。软件上的技术突破有更多,比如快速实现对人、环境、声音的识别。机器人的信噪比是非常低的,本身噪音很大,在这样的环境下如何识别指令;同时又需要极大的算力,如何把算力的需求降低等都是技术难点。 机器人有了自我决策之后,表达和动作设计都很重要,我们设计了一整套语言系统,包括表达情绪的声音、动态的表情、肢体的语言,还有灯光配合情绪的变化,人能够比较立体地知道机器人处于什么样的状态下;如果人无法判断机器人的状态,双方就不能够很好地互动。 总体来说,软硬件方面都是需要不断地迭代的,人机交互是主要的迭代方向。 Founder Park:2018 年 MIT 开源了四足机器人相关的一些技术,很多公司会基于这个框架进行修改,哈崎如何看待开源这件事? 谌振宇:MIT 的开源项目是为了实现 Mini Cheetah(MIT 的四足机器人)的快速运动,而不是为了实现机器人进入家庭的完整功能。开源对我们来说,最大的意义在于说明这条路是可行的,会给我们很大的信心;开源能够帮大家节省很多时间,但在做一个完整的消费级产品时是远远不够的。比如 MIT 开源的四足运动控制模型简化是为了让其机器人能够跑的更快一些,而每个公司面临的用户需求不同,面临的问题和实现的难度是完全不同的,模型和算法也可能是千差万别。MIT 的开源给出了一个简化模型的完整实现,但是后面的学习曲线仍然异常的陡峭。 我们的实现是基于运动学和动力学的自研算法。机器人的表现基本都是自研的,比如我们有根据视觉做的一个轨迹的规划,让动作更加协调;在决策、识别上是利用 AI 技术做的自研内容;在框架上,比如整体的决策、做动作的平台,也是完全自研的部分。 Founder Park:智能陪伴机器人迭代到一定程度后,会像自动驾驶一样出现分级吗? 谌振宇:最早的机器人就是一个被控制的机器,在控制下能够运动;现在很多机器人是遥控的。 第二个阶段是部分智能机器人,在特定的环境下能够自主运行。 第三个阶段是组合控制的智能机器人,在得到一定的指令后能够执行任务,比如扫地机器人。 第四个阶段是有条件的智能机器人,能够理解人的情绪、识别环境,根据反馈做出决策、调整行为,在人机交互过程中不断地完善机制。这也是哈崎机器人所处的阶段。 第五个阶段是高度智能机器人,能够自主成长,主动地适应各种环境。 Founder Park:情感陪伴机器人的发展思路和特斯拉很像,怎么去看待软件和硬件之间的关系? 谌振宇:传统的汽车都是模块化的,每个模块实现单一的功能,模块之间是不互通的。特斯拉的改变在于所有的决策都要通过控制中心来完成,保证控制中心和各个部分是可控的,通过这样的方式就有了非常大的可升级空间;把所有的数据都上传,通过强化学习去决定在不同的情况下需要做出什么样的反馈。在这方面我们和特斯拉有同样的技术路线,可以说是软件决定硬件。 我们的机器人有一个控制中心,它拥有机器人行为的决定权;当然现在很多时候机器人的行为还是用传统的控制算法在实现,但它看到的信息会上传给控制中心,根据它的历史记录、情境、当前状态去决定它应该采取的行动。让每一个部件标准化,由控制中心去决定每个部件应该采取的行为,这也是我们的思路之一。 Founder Park:从互联网切换到硬科技,有哪些经验是可以沿用的? 谌振宇:我理解的互联网思维是站在用户的角度,使用对应的技术或商业模式去满足用户的需求;技术是手段,而不是目标。从 PC 到移动互联网、再到机器人,这种思维是可以一直沿用的。现在做的硬科技,其实也是根据用户的需求去寻找技术解决方案,这也是我们最后选择机器人实体去做服务的原因。 硬件会有区别于互联网时代的部分,比如硬件的周期性,需要有设计、生产、联调、组装等过程;而不像互联网一个月就可以上线,再不停地更新、迭代。 Founder Park:互联网的流量思维和「小步快跑、快速迭代」的概念适用于硬科技吗? 谌振宇:砸钱买流量是有底层逻辑的,首先这个服务要满足用户的需求,其次投入产出比 ROI 是不是大于 1 的;满足这两个前提再去砸钱,才可能带来正向的结果,这对于互联网和硬科技都适用。 我们内部的软硬件迭代是非常快的,硬件上可能和其他公司会有不同,我们会先根据需要实现的目标而选用成本很高的技术,先把目标达成再想办法提高效率、降低成本,这也是我们能在两年半时间内实现机器人自主与人互动的原因。我觉得我们是在小步快跑的状态,不会限定只能用某种技术、芯片或必须要完成某一功能;如果一开始就设限,出现问题后很难去判断是思维、软件出错了,还是硬件限制了技术的发展。 *以上嘉宾观点不代表 Founder Park 立场,也不构成任何投资建议。 公司:哈崎机器人 领域:机器人、智能硬件、家用机器人 融资状态:超千万美金 Pre A+轮 主要投资人:北极光创投、梅花天使创投、红点投资、顺为资本 官方网站:https://hachibot.com/ 哈崎机器人创始人 & CEO。一名连续成功创业者,2010 年以内部创业者身份加入去哪儿网,开创无线事业部,从零开始带领去哪儿网完成从 PC 端向无线端转型。2016 年 1 月,担任去哪儿网首席执行官。加入去哪儿网之前,振宇是抓虾网的首席技术官和联合创始人。他还曾于 2001 年至 2005 年在百度任职,先后担任工程师和搜索部门的高级经理。