什么是推荐算法?新闻推荐算法对新闻媒体意味着什么?
扫描二维码
随时随地手机看文章
作为新闻业在数字环境下“后台前置”的下一个阶段——“把关后移”的主体,平台媒体(plaTIsher)的新闻推送业务大多基于用户的使用惯习,通过算法预测用户感兴趣的信息和话题,再将其推送给用户。逐渐转型为平台媒体的社交媒体在现有的模式下很大程度上主导着新闻内容的聚合与分发,其身份和功能的主要定位是通过对于用户偏好的精确匹配,从海量过剩的信息洪流中将用户最关心、最适合用户接收的信息甄选出来。这种模式目前备受推崇。
美国皮尤研究中心《2016美国社交媒体平台新闻使用报告》显示,62%的美国成年人从社交媒体上获取新闻,Facebook成为最大的新闻入口;今年8月易观发布的《中国移动资讯信息分发市场专题研究报告2016》显示在国内资讯信息分发市场上,算法推送的内容已经超过了50%;路透新闻研究院的调查显示,虽然对于算法推送新闻确实存在算法审查(Algorithmic Censorship)、平台偏向(platform bias)、信息茧房(informaTIon cocoons)以及回音壁(echo chamber)的担心,但人们尤其是年轻人,更加愿意使用和相信根据算法生成和推送的内容。
对传媒业而言,大概没有一个时代比今天更强调技术的作用。
各大资讯平台全面发力算法,希望从这个呼啸而至的智媒时代分一杯羹。无论是4月刚获得10亿美元D轮融资的今日头条,还是上线不到两年就跻身资讯应用前三甲的天天快报,亦或一点资讯、网易号、百家号等等各自圈地的新产品们,都无一不强调自己的技术属性和渠道分发优势,算法面前,内容为王的声音似乎小了许多。
在巨头们争相建设生态的博弈中,优质自媒体、专业媒体成为被争夺的对象,但同样也面临着选择:与平台合作,与算法共谋,还是继续顾全“酒香不怕巷子深”的脸面?从实际情况上看,国内国外在这一点上有颇多相似之处,多数内容生产者、生产机构的选择是在新的生态中寻找自己的舒适区,这意味着不得不接受这套生态系统下的丛林法则。
什么是推荐算法?推荐算法是计算机专业中的一种算法,通过一些数学算法,推测出用户可能喜欢的东西。推荐算法主要分为6种:基于内容推荐、协同过滤推荐、基于规则推荐、基于效用推荐、基于知识推荐和组合推荐,本文选取两种常用的介绍:
1基于内容的推荐算法
原理是与用户喜欢和自己关注过的Item在内容上类似的Item,比如你看了一条关于“成都限购政策出台”的新闻,基于内容的推荐算法发现一条关于“限购后这些新盘价格远低于预期 高新区某盘不到一万”的新闻与你以前观看的新闻在内容上面(共有很多关键词)有很大关联性,就把后者推荐给你。
2协同过滤算法
原理是用户喜欢那些具有相似兴趣的用户喜欢过的新闻,比如你的朋友或你关注的人喜欢体育类的新闻,那么就会推荐给你,这是最简单的基于用户的协同过滤算法(user-based collaboraTIve filtering),还有一种是基于Item的协同过滤算法(item-based collaboraTIve filtering),这两种方法都是将用户的所有数据读入到内存中进行运算的,因此成为Memory-based Collaborative Filtering,另一种则是Model-based collaborative filtering,包括Aspect Model,pLSA,LDA,聚类,SVD,Matrix Factorization等,这种方法训练过程比较长,但是训练完成后,推荐过程比较快。
新闻推荐策略
一般做新闻推荐有三种策略:
1基于内容的推荐
也可以叫做基于用户画像的推荐,意思就是根据用户的历史点击记录,总结出用户的喜好,也就是用户画像,计算每个新闻与用户画像的相似度,将相似度最高的新闻推荐给用户;
2协同过滤推荐
就是找到和用户兴趣相似的群体,然后把这个群体喜欢的推荐给这个用户;
3热门推荐
还有另外一种新闻推荐常用的方法就是热门推荐,这个是设置一个时间窗口,统计在过去一段时间所有新闻的点击量,把点击量最大的新闻推荐给用户;