网飞公司|网飞(Netflix)的个性化体验简史( 四 )
不幸的是,年龄和性别数据并没有能够改进预测结果——RMSE没有得到改善。电影偏好很难预测,因为它们是独一无二的,并且每个人的喜好是完全不同的。也就是说知道我的年龄和性别,并不能有效帮助预测的电影的喜好。但是知道一些我喜欢的电影或电视节目会更有帮助。
要想看到这一计算数据在今天的表现,就需要你的Netflix账户上创建一个新的个人资料。网飞公司Netflix会询问你几部喜欢的电影来启动个性化系统。这就是他们在系统里计算所需的数据。
十、2006年: QUACL中的协同过滤QUACL是队列添加确认层。一旦用户在他们的电影列表中添加了一个标题,一个确认层会弹出提示类似的标题。下面是一位用户将日本动漫Eiken加入了他们的电影列表后,协同过滤算法所给出的6个类似的电影:
文章插图
QUACL或队列添加确认层,是个性化推荐的一个重要来源。
随着时间的推移,网飞公司Netflix在向会员推荐类似影片方面会做得越来越好。作为一个营销来源,QUACL占总序列的比例会在几年的时间里从10%提升到20%。QUACL是算法测试中一个很好的测试环境。事实上,网飞公司Netflix在QUACL中开始了它的第一批机器学习测试。
十一、2006年:100万美元的Netflix奖和其他初创公司一样,网飞公司Netflix的资源有限。虽然他们已经证明了Cinematch的价值,但只有几个工程师专注于这个算法。他们的解决方案就是:通过Netflix奖进行外包算法开发。
文章插图
网飞公司Netflix向任何能够将均方根误差提高至少10%的团队提供100万美元。
网飞公司Netflix向任何能够将其Cinematch算法的均方根误差提高到10%的团队提供了100万美元的奖金。个性化团队提供了来自Netflix会员的匿名数据,作为团队的训练数据,还有一个包含会员实际评分的数据集,这样,团队就可以测试他们的算法预测能力。这些团队花费了两年的时间,才赢得了奖金——在下篇会有更详细的解释。
最后一个要求:耐心。
十二、2007年:网飞公司Netflix推出流媒体服务
文章插图
网飞公司Netflix于2007年推出流媒体服务。这是DVD邮寄服务的免费附件。2010年在加拿大推出了首个纯流媒体服务。
在2007年1月,网飞公司Netflix推出了流媒体服务。公司团队第一次掌握了用户观看的电影的实时数据,以前他们仅仅掌握了DVD租赁活动的数据。时间告诉网飞公司Netflix,在预测会员的电影偏好方面,这种隐性数据比通过其五星评级系统收集的显性数据更重要。
在2007年推出流媒体服务时,网飞公司Netflix有近10万张DVD可供选择,因此DVD销售方面的挑战在于帮助会员从其庞大的DVD库中找到“隐藏的珍宝”。然而在使用流媒体服务之后,公司所面临的挑战变成了帮助会员从300部相当平庸的电影中,找出他们认为值得看的几部。
十三、2007年: Netflix奖Netflix奖向任何能够将Netflix的协同过滤算法的预测能力提高10%的团队提供100万美元,预测能力以RMSE(每部电影的预期评分和实际评分之间的差值)来衡量。两年后,“Bellkor’s Pragmatic Chaos”打败了其他的5000个团队,赢得了比赛。
这次比赛带给我们两点启示:
- 并非所有的收视率都是平等的。参赛选手们发现,评分人员为近期电影提供的评分,比以往的评分更具有预测能力。
- 算法越多越好。每年年底,网飞公司Netflix都会向优秀团队支付5万美元的进步奖。在这一年的最后一天,第二名和第三名的团队将他们的算法结合起来,跃升至排行榜首位并且获得了年度进步奖。由此,团队认识到了结合多种算法的重要性。这也是团队名称如此奇怪的原因——在团队合作的时候,他们构思出了“mashup”这个名字。
- 36氪首发|烹饪机器人公司「智谷天厨」获数千万元天使轮融资,羲融善道独家投资
- 飞行器|马斯克的电动飞行器,被瑞典的一家科技初创公司首发
- 阿维塔|在避免患上大公司病上,字节跳动、小米保持高度一致
- WPS|WPS比office更好用?为何有公司禁止用WPS?兼容性太弱,广告太多
- 华为|我国新女首富“诞生”!公司超华为成第二大民企,坐拥身家1700亿
- 苹果|苹果CEO库克证实公司正在开发虚拟现实设备,有望1月上市
- 产品设计|怎样选择好的产品设计公司?
- 苹果公司|这回轮到中国企业将苹果踢“出局”,放弃虚名,公平合作才是王道
- Netflix|B站又搞事情?上线付费短视频,某百万UP主直接当场掉粉过万!
- 五芳斋|一般公司品牌部,组织如何建立
