信息流推荐的用户增长机制
扫描二维码
随时随地手机看文章
编辑整理:王洪达
出品平台:DataFunTalk
导读:本文主要从偏向底层的推荐算法角度来阐述信息流推荐系统升级如何助力用户增长。我们知道,内容信息流实际上已经算是信息流中比较小的概念,其中包含图文信息流、短视频信息流和内容+电商信息流,而对于用户来讲实际上是一个消费时间的产品体验,从而对内容生态产生很大的助力 ( 包括PGC、UGC的短内容生态 ),这就是本文主要的问题——内容信息流。本文旨在解决的问题是:基于推荐算法视角,来解决信息流产品用户增长的问题。其中,主要问题就是如何提升留存率。
01
关于用户增长
头部内容模式:一种比较"重"的模式,该类产品利用精准的内容采买,引入优质的头部内容创作者,利用头部内容的流量聚焦效应,迅速圈定大批用户,并形成内容APP特有的用户心智;但是由于内容头部化,个性化算法在其中发挥的空间和作用较小,产品模式趋于同质化。
下沉/激励模式:该类产品参考了网络游戏模式,从各个环节设计用户里程碑和激励,不断引导新用户一步步完成点击、下刷、完整阅读、分享、关注等目标里程碑,并给予虚拟货币和真实货币的激励,在短时间内可以获取大量下沉用户。
-
生态构建模式:该类产品构建了完善的内容生产和消费生态,旨在通过推荐系统同时刺激生产和消费,实现两端的同时增长。
-
用户状态建模:深度建模用户状态和行为,通过对于大数据集中分析,找到使用户从低阶状态到高阶状态转化的干预因子。也就是如何把新用户转化成低阶用户,然后从低阶用户转化到高阶用户,用户流失后如何召回,类似这样的用户状态转化。 -
个性化分发的升级:将用户行为建模后,在多个场景下将这些干预动作转化为个性化推荐和营销,满足用户的消费需求。
优质内容/时效性:内容的更新频率以及内容的质量是用户增长的关键。
个性化体验:千人千面,推荐的内容符合当下的需求。
多渠道获客:多渠道获客的能力也是增长的一个关键因素。
CPC vs LTV:维持CPC ( 按点击收费 ) 和LTV ( 用户对系统的长期价值 ) 的一个平衡。
算法如何助力增长呢?主要有以下几点:
精细化买量/外投;
提升留存;
衡量推荐这样Action的效用;
消除幸存者偏差。
-
劣质系统:只会推荐一些低俗 ( 只满足低层次需求 )、兴趣受窄、搬运内容 ( 无稀缺性 )、陈旧内容的信息。 -
良性系统:区别于劣质系统,在各个环节都会不断增加信息量 ( 多样性 ),不同层次的用户引入 ( 用户多样性 ),各类高质量内容的引入 ( 内容多样性 ),内容更具时效性 ( 提升媒体属性 ),探索出用户中长尾兴趣:当头部内容过期时从而更合理的承接。 -
问题在哪儿?主要存在以下问题:统计机器学习模型存在缺陷;长期的指标观测体系匮乏以及业务短视;缺乏合理的机制设计和产品视角。
-
衡量用户满意度的指标有很多,但主要集中在三大方面:内容相关性、内容质量和内容时效性,时效性一定程度上代表内容的稀缺性。 -
ctr代表什么:一定需要ctr吗?对内容无认知的用户需要衡量用户对列表页素材的满意度,对内容有认知的用户还需要衡量用户对内容本身的满意度。 -
用户对内容真正的认可是通过点赞、分享、评论这种互动的方式来表现的,目前很多产品注重对互动的引导。
-
提升用户留存、LTV -
通过分发筛选出优质内容、优质生产者:在传统的认知中,喜欢什么就给什么;但是更新后的认知是创造需求和玩法,持续优质内容生产 -
构建内容生态:提高分发时效性;增加对upgc主的激励 ( 曝光、点击、粉丝、分成 );通过准入、扶持打压、激励这种机制维持一个好的生态和增长。只有通过用户和生态两端的同时增长,才能让产品得到一个飞轮效应,良性发展
03
核心增长机制
-
基于表征学习的排序技术,难以表达置信度;神经网络技术很难表达最重要的概念。 -
新内容冷启动技术选型业内有很多的方案:随机保量 ( 短期降效、对生态fairness问题相对友好、构建宝贵的无偏数据集,消偏应用 ) +Bandit类算法 ( 短程收敛性有一定劣势 ) +uncertainty预估 ( 个人推荐 ) -
新用户冷启动的技术选型和新内容还是有很大差别的,其主要是通过强化学习、联邦学习这种人工智能的方式进行分析,而通过统计学,很难分析出人的偏好。
Rank = pRelevance(topic | user)^ cu * pCTR( item | topic)^ ci 一方面用主题到用户的相关性,另一方面用item到主题的统计值或者模型的估分,这里面会有两个置信的概念,一个是用户兴趣的置信度,一个是item本身的置信度;
新item冷启探索:ci低会提高cu,侧重主题到用户的相关性值以及预估稳定性;
新用户冷启/兴趣探索:cu低会提高ci,侧重item到主题的统计值以及预估稳定性;
纯利用:对于老人做老事,ci高,cu也高,推荐的短期效率指标是最高的,但是长期来看,如果只注重这种推荐的短期效率指标,不对新用户和新内容进行探索,那长期就很难发展下去。
-
推荐模型本身的样本就是有偏的,user和item偏同时存在,比如用户没看喜欢的部分没有参与到模型训练中。 -
对应到item,就是selection-bias和fairness问题。比较典型的案例是youtube net,user embedding average pooling本质上,依然是item-embased,后续诸多改进没有本质的解决消偏问题。这样就会导致后续推的东西比较类似,如果第一次推的好就会留下用户,推得不好用户就会很快流失。
-
构建反事实镜像人:利用无偏信息构建相似度量,构建低活user到高活user的匹配 ( Matching / Propensity Score / IPW,Causal Embedding ) -
去除低活、沉默用户的leavecause,推荐高活镜像人的stay causes
① 状态里程碑表示法
状态跃迁效用衡量
找到使用户从低阶到高阶状态转化的干预因子:
· 内容变化:新内容上下架、热点事件的产生和消逝
· 捕捉兴趣的变化
· 分发幸存者偏差问题
推断后的数据统计到内容采买和生产
干预场的设计和页面组织
内容供给指导 ( 2b供应链 )
构建时间线上的的推荐系统来推断个性化排序机制
① 个性化排序机制
-
新用户首次满意消费和活动 ( 内容质量控制 ) -
低活用户浏览深度和ctr ( 内容质量控制 ) -
高活用户要增加新颖性和多样性
-
兴趣覆盖度、兴趣点下的内容质量、时效性、竞争激烈程度 -
内容供给知道(2B供应链->内容采买/生产/激励机制)
up主激励机制:
up主质量体系:关注量曲线、生产效率、生产质量,内容正负反馈
输入就是历史分发数据(曝光量、点击量、关注量、up主质量体系)
计算:
· 曝光量->爆款成功率
· 最大化效用:激励函数->内容质量和生产效率的拟合
输出就是一定时间内up主内容的保量、限量range->在线排序的调控约束机制
未来方向:
-
流量货币化 -
更多经济学、机制设计理论的引入 · 演化博弈论分析 · 竞对分析
今天的分享就到这里,谢谢大家。
特别推荐一个分享架构+算法的优质内容,还没关注的小伙伴,可以长按关注一下:
长按订阅更多精彩▼
如有收获,点个在看,诚挚感谢
免责声明:本文内容由21ic获得授权后发布,版权归原作者所有,本平台仅提供信息存储服务。文章仅代表作者个人观点,不代表本平台立场,如有问题,请联系我们,谢谢!