每次出门,总有一种 “忘了点什么东西” 的感觉,最惨的是这种感觉通常还都是对的。作为一名 “遗忘 · 丢三落四 · 找不到东西 · 啥都能忘 · 综合征” 晚期患者,我也尝试过很多种提醒事项的办法:记事本、各种 app、每天厚着脸皮提醒别人提醒我,情况略有改善,但终究无法根治。来自康奈尔大学和斯坦福大学的研究人员最近拿出了他们的解决方案——一只智能激光笔。看到这里养猫一族肯定要跳出来了:“激光笔?那不是拿来逗猫猫狗狗的么?”
没错,这次换成了人,还要在普通激光笔上面加上了 “新功能”:
拍摄、学习人的日常作息习惯,然后利用激光笔来提醒人有可能遗忘的东西。研究人员将这个项目命名为 Watch-Bot,实际的产品形态更像是一个加了三脚架的 Kinect,只不过在 Kinect 上面多了一个绑着激光笔的云台相机,然后在三脚架的下面还隐藏着一台笔记本。看上去元件并不复杂,那么 Watch-Bot 究竟是怎么实现提醒人有可能遗忘的东西呢?首先将这一套东西放置在厨房和办公室里一个星期,期间 Kinect 一直在运作,和电脑一起分析人类在这个视角内的动作。最终,它收集了 458 个正常人类的活动视频,以及 21 个不同的动作和 23 个不同类型的对象,其中有 222 个活动视频中(实验人员故意地)忘做了什么事。试验人员从冰箱里面拿出一盒牛奶,在倒完牛奶之后却忘了把牛奶放回冰箱,Watch-Bot 就会通过 Kinect 确定遗忘的 “动作” 和 “对象”(牛奶),然后从 Kinect 中发送坐标给云台相机,然后云台相机再将激光笔对准目标。最重要的是,Watch-Bot 完成这一切没有很多的人工介入,而是采用了依靠一套完全不需要监管设定的概率深度学习模型。只需要普通的 RGB 视频信号以及 Kinect 提供的动作追踪信号,就能从数据众分析出动作以及他们之间的关系。比如上方提到的倒牛奶这个例子,完整的动作应该是:从冰箱拿出牛奶;倒牛奶;把牛奶放回冰箱;然后离开。
那么,Watch-Bot 怎么知道人究竟是忘了还是没忘呢?
Watch-Bot 用了一个非常系统的 “思考方式”(逻辑),他们将每个动作片段中的动作、对应物体、他们发生的关系同时建模。比如,“把牛奶放回冰箱”通常都是“从冰箱拿出牛奶的” 的后续动作,如果牛奶这个物体在“离开”这个动作之后仍然存在于冰箱之外,那么就是人忘了。Watch-Bot 采用了一个相当巧妙的方法,抛弃了常用的 “建立空间坐标系然后校准云台”,直接利用云台相机的视频信号与 Kinect 捕捉的坐标进行匹配。从提醒人遗忘事情这一用途来看,Watch-Bot 所产生的意义并不大,但正如他们在论文中最后总结的那样:Watch-Bot 易于安装,而且我们的模型可以针对不同的场景进行修改。这项功能,极有可能成为挽救现在智能类产品的因素。
虽然,目前带有 “智能” 两个字的产品极多,但是连个 WiFi、蓝牙算不上 “智能”,而真正的思考能力必须建立在感知能力之上。
或许将来的某一天,每个人的家里都会拥有几套 Watch-Bot 这样的现实捕捉设备,从而将智能服务带进我们的生活。当然,我也想把 Watch-Bot 改装一下来对付我们家的小猫咪。