导读:本文主要从偏向底层的推荐算法角度来阐述信息流推荐系统升级如何助力用户增长。我们知道,内容信息流实际上已经算是信息流中比较小的概念,其中包含图文信息流、短视频信息流和内容+电商信息流,而对于用户来讲实际上是一个消费时间的产品体验,从而对内容生态产生很大的助力 ( 包括PGC、UGC的短内容生态 ),这就是本文主要的问题——内容信息流。本文旨在解决的问题是:基于推荐算法视角,来解决信息流产品用户增长的问题。其中,主要问题就是如何提升留存率。

关于用户增长

做过推荐系统方面工作的同学应该清楚的知道,推荐工程里面主要包含推荐算法和搜索算法。而我们往往关注的是 Stoptime 这样的指标,使用有监督的模型来解决一系列问题,例如点击率、单次时长等。对于留存问题和大盘规模问题在机制上,有很大的不足,比如:推荐新的篇章,从用户方面和生态方面都存在着双边的幸存者偏差问题。

1. 问题分析

首先看下大的背景,目前是移动互联网进入下半场的大趋势,过去粗放式的买量、厂商合作等模式越来越受到掣肘,未来将更加依赖精细化的用户增长策略、产品和用户体验的细致打磨。经典的 AARRR 模式会逐步转向 RARRA 模式,提升产品留存、拉活、分享传播等方式是构建增长的主要战场,对于一个内容型产品来说,个性化算法对于用户留存、拉活起到了决定性的作用。

在信息流产品增长上,有三种比较成功的模式:

因此,个性化的核心问题主要分为两个:

2. 增长要素

什么样的内容会让用户觉得好?我们来看看用户增长的要素:

算法如何助力增长呢?主要有以下几点:

关于推荐算法

推荐系统在国内大概已经有十多年的应用,模型架构和算法都有很大的升级。

1. 推荐系统回顾

首先回顾下推荐系统:

2. 信息流推荐的增长目标

用户满意度的衡量:

信息流推荐的增长目标,主要包括:

核心增长机制

1. 双边冷启动与流转机制概述

在管理上也有这样的一种思想,就是新人做老事、老人做新事,促进事情稳定向前推进,这就是流转机制设计的主要思想。因此,如何对新用户和新内容做双边冷启动就成了核心的问题。从算法来看,这是两个不太相同的问题,但从整体设计思想来讲,两者又比较相近。新内容通过相关性分析可以达到探索、分发、推广的效果。进而新用户如何探索他的兴趣?比如推荐股票,一定会先推荐近期走势最好的股票;推荐科幻片,大概也是这样,推荐评分最高的,这样就可以实现新用户规模本身的增长。对于新内容来讲,通过老用户面对热内容的探索分析,也可以逐步推进内容生态的增长,其实这并不完全是算法的问题信息流推荐,这同样是贯穿从内容运营到产品设计整个体系的一个哲学思想。

对于新和旧的定义是通过置信度对应到多峰兴趣级别,同时对应到 topic 兴趣的级别;对于新和老的准确定义应该是经过某些流量的分发验证,而不是简单通过来的早晚;新内容冷启机制也叫爬坡机制。

这里面带来的技术问题包含:

2. 详细实现

双边冷启动与流转机制的实现,主要包括:

a. 早期以显式标签+统计连续值为主的推荐系统

b. 以表征学习为主的推荐系统,这块主要是思考如何做成 Risk-aware recommendation,目前构建排序模型 uncertainty 的一种方式如下:

c. 超参学习/调控的目标→系统全局 E&E

3. 消偏与因果推断:背景介绍

对于幸存者偏差问题,我们是通过因果推断的方式解决的。推荐系统其实是一个因果推断的问题,通过用户是什么样的人,从而推测用户会喜欢什么样的 item;对于推荐的 causal effect,用户会不会喜欢?效用有多大?会不会成为高价值客户?如果推荐后,用户会有 hot moment,我们可以判定,推荐效果是好的。

为什么会存在幸存者偏差呢?

4. 消除幸存者偏差:Casual Inference 推荐框架

假设:

在因果推断的推荐框架中,假设用户变成低活、沉默的原因主要是用户对之前推荐的内容不满意。

方法:

经过实践探索后发现,causal inference 框架将成为用户增长方向的理论基石,对于消偏、效用衡量、归因和生态公平性问题都有解法;同时,causal inference 也为经典推荐算法难题提供解法,如 selection-bias、低活用户画像和推荐可解释性等问题。

5. 面向增长的用户画像

① 状态里程碑表示法

经典用户画像,主要要服务于运营的可解释性、推荐或广告系统的模型预估;通常建模成向量:高维离散、低维稠密以及多峰 embedding。由于信息流产品具备连续型消费的特点 ( 同主题下的消费,upgc 关注、直播 ),用户消费行为可以在连续的时间上进行切分,因此状态表示法是对向量表示法的有力补充,状态表示法主要包含活跃度、置信度,多峰兴趣的置信度、活跃度;这样将难度较大的”促留存”问题拆分为”目标达成”问题,通过策略不断使得用户完成高阶里程碑,将”促留存”的抓手聚焦在用户状态跃迁速度的提升上。

② 全生命周期因果推断

全生命周期的因果推断:

在构建面向增长的用户画像时,需要采用全生命周期因果推断:

根据 causes 的 actions:

6. 效用理论应用

① 个性化排序机制

对于效用的普遍认知是:

个性化排序机制通过 multi-task learning、强化学习和 causal effect 的方式信息流推荐,来进行分状态差异化的对用户进行跃迁效用最大化地排序推荐,无论是新用户、低活还是各个细分状态的用户,都会让用户在平台中觉得不是兴趣收窄的,承担着各自的职责。这些内容在阿里都有落地并取得了很大的收益。

② 生态效用技术

效用理论应用是一个比较开放的课题,对于电商、短内容的生态是不一样的。

供给归因:

up 主激励机制:

未来方向:

以上就是针对面向用户增长的信息流分发机制的分享,特别是短内容领域利用推荐算法推动用户增长的思考,分享比较偏技术,是在阿里多年积累所沉淀下来的东西,没有太多强调推荐算法模型的部分,更多是以整体的算法架构和算法机制设计角度考量生态和用户增长,里面很多问题也是特别难、特别开放的,欢迎大家一起交流探讨。

原创 天师 阿里巴巴 高级算法专家

本文转载自:DataFunTalk(ID:datafuntalk)

原文链接:信息流推荐的用户增长机制

免责声明:本文系转载自其它媒体,版权归原作者所有;本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,旨在传递信息,不代表本站的观点、立场和对其真实性负责。如需转载,请联系原作者。内容会稍有编辑,如果来源标注有误或侵犯了您的合法权益等其他原因不想在本站发布,来信即删。投稿等其它问题请联系本站

文章来源:https://www.infoq.cn/article/xxXzSSe28M6KlpvB36xY