Spotify超强推坑歌单怎么来的?背后准到可怕的“协同过滤”机制大公开

现代人与信息科技的关系已经紧密到分也分不开,但你知道科技本身是怎么运行、对你的影响是好是坏、对未来的工作将掀起什么改变吗?

本文从《Google、脸书、微软专家教你的66堂科技趋势必修课》一书中摘录“Soptify如何推荐歌曲给你?”段落,和你分享Soptify称霸音乐流媒体平台的关键。

每个周一早晨,Spotify会送给听众三十首歌的播放清单,这些歌曲很神奇地符合听众们的喜好。这个播放清单称为“每周探索”(Discover Weekly),也成为热门话题。在2015年6月发行的六个月内,“每周探索”被发送超过十亿七千万次。

你的一举一动都被算法计算着!

Spotify的确有雇佣音乐专家,手动制作播放清单,但是他们没有办法为七百五十万个用户制作这个清单。Spotify是采用算法,每周执行以制作歌单。“每周探索”的算法是先查看两项基本信息:

第一,它会先看用户喜爱到会加入到音乐库或者是播放清单的所有歌曲。这个算法甚至聪明到可以知道,用户是否在播放的前三十秒就已经跳过该首歌曲,这代表用户可能不喜欢这首歌曲。

第二,算法会看其他人所制作的所有播放清单,同时假设每个播放清单都有主题关联,比如用户可能会有“跑步”或者是“披头四即兴演奏”播放清单。

“协同过滤”出你的个人播放清单

当Spotify有这些资料,就利用这两个方式找到用户可能喜欢的歌曲。第一个方法是比较上述的两个人信息料集(dataset),找到符合适户喜好的新歌。例如,有一个用户的播放清单有八首歌曲,而其中的七首有在你的音乐库,他们判断你可能喜欢这类型的歌曲,所以“每周探索”就推荐那首不在你音乐库的歌曲。

这种方式称为“协同过滤”,这也被亚马逊所采用,其根据你与数以百万计的用户的购买记录,推荐建议商品给你。网飞的电影建议、Youtube的视频建议,和脸书的朋友建议都是采用协同过滤。

第二个方法是将用户的播放清单视为个人的“品味文件”(taste profile),根据个人所听过喜欢的歌曲,Spotify会以不同类别(如独立摇滚或者是R&B)和更细微的类别(如室内流行乐与新美国音乐)推荐用户相同类别的音乐。这仍然是根据以往听过的音乐模式,只是不同形式的推荐。

要做就要做出“差异化”,独特之处成消费者买点

然而,雇佣工程师构建这样的推荐引擎是很昂贵的,Spotify的工程师一年薪水几十万美金的,所以为什么Spotify要这么做?

第一点,一个强力的推荐系统是一个卖点,帮助Spotify显得比其他竞争对手突出,如苹果音乐。那是因为有一个庞大的音乐库是不够的,以商业词汇来说,音乐是一个商品——任何歌曲在Spotify或者是苹果音乐,或者是其他类似的地方听起来都是一样的——并且只要有钱的人就可以去购买音乐的授权,创建一个巨大的音乐库。

所以,如果所有的音乐流媒体服务都能够有效率地拥有相同的音乐,Spotify需要有与其他竞争对手不同的地方。而Spotify的推荐系统也确实达到这个目标——被认为比苹果音乐更好。

而且,当有更多的用户,协同过滤的表现会更好,Spotify(已经有了很多用户)持续维持领先。

你越使用,它越懂你!

第二个理由是个性化的推荐使得用户的服务黏着度更高。越常使用Spotify,算法越了解你的品味,也因此更能推荐适合的音乐。所以假如你常常使用Spotify,你的推荐结果将会相当好,也因此您不会想改用苹果音乐,因为苹果音乐一点也不了解你的偏好。

所以这个高“转换成本”(switching cost),减少你想改用其他类似应用程序的可能性。(更一般地来说,任何存放在应用程序的个人资料,例如制作Spotify的播放清单,将会提高转换成本,因为必须在新的应用程序中重新创建资料。)

简而言之,个性化的播放清单对听音乐的人来说相当重要,这也是Spotify厉害的商业策略,难怪越来越多的应用程序提供个性化的推荐内容。