《广告算法》学习笔记

定向广告实战

Posted by Ann on June 12, 2019

前两章学习笔记中我们讲了定向广告常用的定向方式(依据上下文,用户资料,用户行为)等,并简介了类似于定向广告的电影推荐中的部分特点,本篇笔记将介绍定向广告的常用框架。

定向广告框架

定向广告推荐流程:

graph LR;    A(选定合适广告)-.->B[对广告排序] B -.-> 选取前K个广告进行推荐

选定合适的广告

  • 推荐系统方式(线下运算,不占用线上资源,可以生成多个结果集合)
  • 利用用户属性选定
  • 利用用户标签选定

广告排序

对广告的排序常依据点击率预测与广告竞价等方式进行排序,与搜索广告不同的是,用户没有指定query,因此排序的方式也不尽相同,如何统一排序方式是定向广告中的一个难点。

定向广告的平衡之道

用户疲劳

针对疲劳的问题,广告系统主要是做好兴趣点选择的工作。在拿到用户的反馈数据之后,将历史行为和反馈数据进行结合,选择具有较少产生疲劳可能性的兴趣。这一步也可以用模型来做,即建立一个拟合兴趣点点击率的模型,把跟疲劳相关的特征都代入模型,不过,这样做的话,后续会有比较多的优化的工作。

商品多样性

是完全依照广告排序预测的排序推荐还是适当增加样品的多样性呢?

如果多样性太差,ctr会随着明显的降低。如果多样性提升到一定程度,ctr就不会跟多样性有显著的关联了。所以,多样性的问题,首先要保证“召回率”,然后再根据候选集进行进一步的选择,也就是先保证一个多样性的底线。

Exploration and Exploitation(搜寻&探索)

E&E是遗传算法中

“搜寻”的时候,我们经常会发现,有些“新”广告和一些“冷”广告。“新”指的是新加入的广告,这些广告还没来得及有展出的机会;“冷”指的是加入了一段时间,但是由于各种原因没有多少展出机会。为了让更多的这种“沉睡”的“好”广告能够展现出来,有些时候就需要大胆的扩大“搜寻”的范围,大胆的将一些“新”的和“冷”的广告纳入到候选集里,当然,也不能是毫无章法的乱加一气。这里面最重要的就是:如何找到“好”的?

可以选择的做法是,找到一些广告的静态特征,例如:标题、属性、类别,等等,跟“热”的广告进行聚类,或者把特征代入模型,算出一个大概的分数。甚至可以把流量当中一定百分比的pv用作“搜寻”,然后快速反馈到系统当中,迅速定位和捕捉“表现好”的广告,而对于那些给了“机会”却表现不好的广告,则减分或者不纳入候选集。