看看CAPER LABS是怎么和亚马逊对干的

在这个亚马逊看起来所向无敌的时代,任何自称可以打挂贝佐斯但却不是其妻的人,大概都会被当成是疯子。但偏偏我们Hardware Club最近就投资了一家纽约的创业公司Caper Labs,共同投资人包含知名风险资本公司First Round Capital 和Precursor Ventures。这间成立不到两年的创业公司要单挑的不是别的,正是把全世界的实体零售店都吓得哆嗦的亚马逊无人商店Amazon Go。

无人商店创造消费新模式

如大多数读者所知的,Amazon Go采用相机和云计算机器学习系统,消费者只需要扫描手机上APP的条码就可以进入商店,拿取完要采购的商品后只要直接走出商店即可,之后会收到消费清单,费用也直接从与亚马逊帐号连接的信用卡或签帐卡扣除。

以现行系统来说,目前在全美只有八家分店的Amazon Go解决了消费者排队结帐的痛点,比起欧美超市已经行之多年的DIY结帐系统更进一步。以我自己曾经访问过的西雅图和旧金山的几间Amazon Go分店来说,可以看到都市上班族川流不息地刷码进入商店,选购完后怡然自得地走出商店。 Amazon Go诞生至今只花短短两年就成功训练出一种全新的都会消费者行为,也难怪在加拿大皇家银行市场分析部(RBC Capital Markets)的一份报告中,他们预测计划到2021年为止开设三千间分店的Amazon Go,将可以实现一年高达四十五亿美元的营业额。

目前市面上可以看到的Amazon Go店面,多半为1,200平方英尺(约34平米)等级的大小,也就是便利商店的尺寸。加拿大皇家银行市场分析部的分析报告采用了国家便利商店协会(National Association of Convenience Stores)的数据,以1,200平方英尺商店来说,他们认为一般便利商店每平方英尺的年营收是落在低端的850美元左右,换算成一年营收约为一百万美元,而结帐零时差的Amazon Go每平方英尺则可以产生高端的、将近1,300美元营收,一年最高可以达到一百六七十万美元营收,以三千家店来说,要产生四十亿到五十亿美元的营收并不困难。

而就像创立二十四年的亚马逊线上商店先后打趴实体连锁书店和电子商城,Amazon Go的快速崛起也攫取了大量的新闻头条,甚至于印象中依赖传统(懒惰而昂贵的)劳力的实体超市和超商似乎风雨飘摇,随时都会被打挂的感觉。

但印象终究是印象,实际上Amazon Go是不是单骑对打传统超商,必须要回到基本面来看。

举例来说,以我多次Amazon Go采购的经验,从走出店门到收到帐单为止,时间差从五分钟到四十分钟不等,这里面其实凸显了现有Amazon Go的自动结帐系统一个很大的挑战:以云计算机器学习为根基的自动结帐系统,远远还没到理想中的效率。

为什么这么说呢?很简单,如果亚马逊的云计算机器学习系统已经到达最佳效率,那么出帐时间的长短不会有这么大的分布区间,单纯以店里的人流和消费量高低峰来看,一个已经优化完成的、可信赖的自动结帐系统,似乎要能够稳定地在一个很短的时间区间内出帐成功,例如十分钟到十五分钟之类的。

那么为什么Amazon Go现在还会有那么大的出帐时间差异呢?

要分析个中原因,我们首先要了解:一个类神经网络的复杂度,在第一阶上(to the first order)取决于彼此间关联性低的输入变量的数量。以Amazon Go来说,一间店采用了数百台的摄影机,所以最少有数百个彼此大致独立的图片串流输入,但不只如此,一间店随时可能有二十到五十个消费者不等,每个消费者会在不同时点从不同货架上取下不同数量的产品,并且在不同时点改变心意将部分商品放回货架上(而且还不一定是原本的货架),中间夹杂着不同时长度的无行为区间,并在不同时点决定完成购物走出商店。

完成出帐时间不一,直指Amazon Go技术局限

这些采样点和时间点的不定性,代表的是Amazon Go的机器学习系统必须要处理相当高维度而且密度高低变化的输入变量。 亚马逊自然是没有公开其类神经网络的设计,但我们可以想象这个系统结合了大量的次网络以及多层的宏观网络,最后才能顺利完成出帐。

“Amazon Go”的顾客不必再大排长龙等结帐,只要拿起商品走出店外,系统会记录消费内容。

因此Amazon Go这个自动结帐系统出帐时间分布之广,其实并没有什么意外的地方,因为变量的数量不定而且各自附带一个时间轴的变异性。从另一个角度来说,Amazon Go也认定消费者并不在乎帐单何时抵达,只在乎自己有没有被多收钱。尽管一开始迟迟收不到帐单时任何良善公民都会焦虑,但多几次经验后也就习惯了,所以等待不是问题。

但是这个优异的用户经验反映出来的却是Amazon Go现行系统一个很大的问题—— 尽管是由过去三十年来最成功、增长速度最快的科技公司之一所开发,这个系统却有根本的扩张可行性(scalability) 问题。

我们可以用简单的模型来解释Amazon Go的扩张可行性挑战。首先我们假设类神经网络各个输入变量为互相完全独立,如果一家店里有五百种商品,并且随时固定有二十个客人,单一客人结帐平均为三个商品,那么这里面可能的组合数量就是:

20 * C(500,3) = 414,170,000

总共超过四亿种可能组合。

如果一家1300平方英尺的店总共有两百支高清摄影机,每支高清摄影机无压缩视频数据量约为3Gbps,假设客人平均停留十五分钟,平均每五分钟拿取一样商品(数量为一),花十五分钟取完三种商品,那么上面这四亿种组合的判断就必须在:

200 * 3Gbps * (15 * 60) = 540,000 Gb = 67.5TB

也就是将近70TB的图片数据上完成分析。

要了解这样的系统在扩张可行性的困难,我们假设把1300平方英尺商店增加10%面积,并假设商品数、平均客户数和摄影机数量都各增加10%,单客采购数量不变,但停留时间因为商店变大拉长为20分钟,那么上面计算出来的两个数字分别会变成:

22 * C(550,3) = 606,718,200 (增加50%)

220 * 3Gbps * (20 * 60) = 792,000 Gb = 99TB (增加约50%!)

大家可以看到尽管只是把商店增加10%大小,但不管是必须要做出决定的组合数量,或者是需要判断出这些组合数量的数据量,都出现暴增50%的现象,这其实并不是什么魔术,单纯就是增加独立变量必然会对系统造成的指数增长压力。

当然真正的Amazon Go类神经网络系统不会这么阳春,一定会采用大量的数据压缩和网络设计技巧。但尽管如此,底层数据量根本的指数特质是不会改变的,这大概也是为什么现有的Amazon Go将商店尺寸订为在零售据点中最小的一种。

而我们甚至还没谈到经营这样商店需要的成本。事实上一家Amazon Go光是硬件系统成本就超过一百万美元,因此亚马逊光是要构建目标的三千间分店就得花上$3B!而如果考虑到目前云计算出帐仍然有惊人的时间差,我们可以想象后端动用到的机器学习资源也是相当惊人,运营成本不可小觑──我们当然也可以想象恩威迪亚负责亚马逊的业务现在正笑得合不拢嘴。

上述的这一切技术障碍、构建成本和运营成本, 对日进斗金的亚马逊来说可能都不是问题,但却对于其他已经被亚马逊逼到退无可退的实体零售商却是“不可承受之轻”,这也是为什么我们虽然谈过许多自动结帐系统的创业公司却都没有投资的原因,因为它们大多采用类似亚马逊的解决方案,虽然实体零售商客户们大家火烧屁股都恨不得立刻全面自动化,但这类系统构建成本和运营成本都过高,让一切只能停在纸上谈兵。

然后我们遇到了Caper Labs,才谈了十分钟就让我们猛拍额头:“对啊!干嘛像Amazon Go那样搞得那么复杂?”

走与亚马逊不同的路,Caper Labs大幅降低无人商店构建成本

Amazon Go或者类似系统的最大挑战,是在于开放的环境中,客户、商品和时间轴的所有变量互相影响,因此呈现指数增长的复杂度。开发这样的高度复杂系统就跟开发谷歌Alpha Go一样,是所有机器学习工程师的梦想,但根据不同场景实际上到底有没有这样的必要,其实有检讨的空间。

Caper Labs的解决方案就直接反向思考:如果开放空间的各种变量互相影响导致系统过于复杂,与其花一大堆脑筋和运算能力去把数据压缩和降维(dimension reduction),不如一开始就限缩可能的数据变易度和维度。 根据这个简单主动的想法,以及现有美国超市和超商的使用场景,Caper Labs开发出了以购物车为根基的自动结帐系统。

在Caper Labs的思考中,在超市中购物车是美国消费者几乎都会使用的工具,一个消费者推一台购物车,因此只要在该购物车上设备机器视觉系统,关注置入和移出该台购物车的商品,就能够轻松判断该消费者采购的商品。

如果以上面数学运算的例子来看,相较于Amazon Go用一个庞大系统试图判断组合超过四亿组的“哪个客户总共拿取了哪三种商品”,Caper Labs的购物车结帐系统移除了客户的变异数部分,只需解决从五百种商品中截取三种的、总数为两千万种的组合。

更有甚者,Amazon Go的单一客户三种商品,可能会在不同地点取下货架,但又在不同地点放上货架,而且未必是原本的货架,关注单一客户的位置和货架,分析其行为(取和放),都是运算非常沉重的任务。 反观Caper Labs的系统,因为将分析空间限缩在单一购物车内,机器视觉系统只要分析被丢入和移出购物车的商品外观来判断出商品种类和数量就可以,不需要考虑到其他的客户行为的变异性,这也让这样的类神经网络远比Amazon Go的宏观网络小很多,可以直接在购物车的计算硬件上执行。 而在这样的系统下,客户推着购物车走出门就可以立刻收到帐单,不会有五分钟到四十分钟不等的差异,这部分用户经验当然会较Amazon Go好。

当然和Amazon Go的全方位“监视”系统比起来,这样的系统让用户有可能作弊,比方说部分商品不丢入购物车,而是夹在腋下或者放入自己携带的购物袋,又或者故意阻挡摄影机镜头⋯⋯等。但这些“偷窃”行为在传统超市本来就存在,零售产业的术语称为 “缩水”(shrinkage)。取决于不同的零售业差异,零售缩水可能介于1%到3%,对于净利率长年盘旋在低个位数百分比的零售业来说,的确是一个恨不得除之而后快的痛点。

但是就算不能完全消除缩水现象,和毫无关注设备、只能靠结帐柜台肥胖呆滞的时薪人员抓包的传统商场比起来,Caper Labs的购物车系统因为全景关注纪录各个客户的消费行为,显然已经有降低缩水率的功效,如果结合一些低成本的货架库存关注设备,未来可能进一步降低缩水的百分比。

亚马逊无人商店Amazon GO,天花板装有摄影机与传感器。

对于所有被亚马逊逼到墙角的零售商来说更重要的是:这个系统构建成本和Amazon Go比起来少了好几位数 ,不用改装,不用增加宽带布线,也不用伤脑筋集成库存计算机系统和云计算机器视觉系统,只要购买足够数量的Caper Labs购物车,使用其垂直集成的云计算服务,就可以开店运营!

更重要的是,不同于Amazon Go的系统因为扩张可行性的问题,似乎会​​被限制在小型店面,Caper Labs的系统可以顺利扩张到大型商场以及大卖场。

这一切的种种,都让Caper Labs的解决方案在零售企业享有很高的接受度,在纽约试运营的两家超市伙伴截至目前为止都非常满意,迫不及待要增加导入系统的分店数量,而其他还在等着导入测试系统的零售伙伴早已大排长龙。

本文截稿之时,传闻贝佐斯已经和即将离异的妻子完成协议,就算分出一半自己持有的亚马逊公司股票,即将成为全世界最有钱女性的麦肯琦(Mackenzie Bezos)也会让贝佐斯持续拥有公司主导权 ── 毕竟让贝佐斯持续掌舵对她自己的荷包也是好事。但是作为Caper Labs的投资人,我们忍不住幻想贝佐斯现在最应该担心的不是自己长年的伴侣,而是现在窝在布鲁克林一间小办公室的年轻创业公司。