推荐美图的 Pinterest 如何靠机器学习吸睛?

推荐美图的 Pinterest 如何靠机器学习吸睛? 2016年09月22日08:57 来源:|

   月活跃用户达1亿的Pinterest越来越依赖机器学习,以帮助发现新的互联网洞见。

 世界各地的用户访问Pinterest是为了探索、保存和分享照片及文章。帮助用户找到自己喜欢的内容,用户自然会被留住:Pinterest上30%的互动和25%的Pinterest内购来自于Pinterest推荐的相关内容。为了推荐合适的内容,Pinterest使用了由数据驱动的顶尖技术,还进行了大量试验。

 那么,Pinterest是如何利用机器学习实现的呢?

 Pinterest首席发现科学工程师(leaddiscoveryscienceengineer)MohammadShahangian表示:“我的主要工作是找到解决内容发现问题的方向。我们会对算法做非常小的改变进行试验,每一次尝试都有其改进或不好的地方。”

 独家优势:基于兴趣

 实际上,这和Pinterset的特点不无关系:它的优势之一在于,Pinterset是围绕用户的兴趣而建立的社区,用户会将自己从互联网上找到的、文章和图片按兴趣分类。这意味着Pinterest不用像其他社交网站一样,通过点击模式或在某个页面上花费的时间来猜测用户的兴趣,而是可以直接用算法来衡量其数据库中750亿个条目之间的关系,因为这些条目很可能被归在同一个兴趣之下。

 MohammadShahangian说道:“许多试图通过输入或信号来推导用户兴趣。但在Pinterest,用户明确地给出了自己对什么感兴趣的信号。”

 访问Pinterest的用户们在不断为这个由用户、搜集到的条目以及收藏板所组成的社交图景添砖加瓦。这些数据又可以让Pinterest更精确地为用户主页消息流、搜索结果以及相关内容推荐提供内容。单纯根据用户关注的内容向用户推荐并不理想,而推荐相似内容又很容易重复。

 在MohammadShahangian看来,“如果你收集了一个厨房水槽的条目,我们应该给你推荐更多水槽呢,还是推荐可以让你的厨房焕然一新的条目?”

 在实践中不断测试

 为了作出这些决策,Pinterest的工程师们试验了多种机器学习算法。他们研究了这些算法在相关和不相关条目上的效果,以及它们如何影响真实用户的活跃度。

 MohammadShahangian说道:“我们确实会直接在Pinterest上做试验,但很多时候我们都会先做很多准备工作再试验。”

 当然,如果不进行实际测试,就根本没办法知道某个用户是否会喜欢新的推荐内容。“我没法花钱请人告诉我,某个用户是否会喜欢新的推荐内容,”MohammadShahangian表示。但通过研究算法推荐的内容是否会被真实用户归为某个兴趣下,这就能得到相对靠谱的答案了。

 此前,Pinterest将用户主页的消息流从纯粹的按时间排列关注用户的消息,改成了由算法生成的消息流,这一举措让用户的活跃度提高了五分之一到十分之一,后续算法改进还会带来额外提升。

 Shahangian表示:“在整个改进过程中,Pinterest得到了长足发展。个性化极大地提高了用户活跃度。”

 改进图像搜索功能

 Pinterest还一直在改进图像搜索,以帮助用户更好地找到相似图片。Pinterest的工程师们与加州大学伯克利分校视觉与研究中心的研究人员们合作开发了这一技术。现在它已经能通过深度学习算法来自动识别图片中的物体了。这样,用户就可以点击这些物体来找到Pinterest中的相关条目。

 Pinterest视觉搜索工程师DmitryKislyuk说道:“这不是区分猫狗的分类算法。我们是想实时找到图片间的相似性。”

 他表示,这一视觉搜索工具在发现Pinterest中的家庭装饰品和时尚用品上效果很好。未来Pinterest希望能改进其自动分类功能,以更好地满足其他搜索需求,比如帮助用户找到相似的新食谱。

 在谈到用深度学习来更有效地进行图片分类时,Pinterest视觉搜索工程师AndrewZhai说道:“我觉得我们的模型会变得更语义化,也会变得更好。”

 Pinterest的工程师们在专注于完善物体识别和搜索的同时,还打算开发一款应用,让手机用户可以拍摄现实世界的物体,然后获得Pinterest上的相关条目推荐。

 DmitryKislyuk表示道:“现如今的深度学习、计算机视觉领域令人激动人心。世界变化太快,顶尖技术每两个月就会变一次。”

责任编辑:姚泓泽