《广告算法》学习笔记

前两章学习笔记中我们讲了定向广告常用的定向方式（依据上下文，用户资料，用户行为）等，并简介了类似于定向广告的电影推荐中的部分特点，本篇笔记将介绍定向广告的常用框架。

定向广告框架

定向广告推荐流程：

graph LR; 　　 A(选定合适广告)-.->B[对广告排序] B -.-> 选取前K个广告进行推荐

选定合适的广告

推荐系统方式（线下运算，不占用线上资源，可以生成多个结果集合）
利用用户属性选定
利用用户标签选定

广告排序

对广告的排序常依据点击率预测与广告竞价等方式进行排序，与搜索广告不同的是，用户没有指定query，因此排序的方式也不尽相同，如何统一排序方式是定向广告中的一个难点。

定向广告的平衡之道

用户疲劳

针对疲劳的问题，广告系统主要是做好兴趣点选择的工作。在拿到用户的反馈数据之后，将历史行为和反馈数据进行结合，选择具有较少产生疲劳可能性的兴趣。这一步也可以用模型来做，即建立一个拟合兴趣点点击率的模型，把跟疲劳相关的特征都代入模型，不过，这样做的话，后续会有比较多的优化的工作。

商品多样性

是完全依照广告排序预测的排序推荐还是适当增加样品的多样性呢？

如果多样性太差，ctr会随着明显的降低。如果多样性提升到一定程度，ctr就不会跟多样性有显著的关联了。所以，多样性的问题，首先要保证“召回率”，然后再根据候选集进行进一步的选择，也就是先保证一个多样性的底线。

Exploration and Exploitation（搜寻&探索）

E&E是遗传算法中

“搜寻”的时候，我们经常会发现，有些“新”广告和一些“冷”广告。“新”指的是新加入的广告，这些广告还没来得及有展出的机会；“冷”指的是加入了一段时间，但是由于各种原因没有多少展出机会。为了让更多的这种“沉睡”的“好”广告能够展现出来，有些时候就需要大胆的扩大“搜寻”的范围，大胆的将一些“新”的和“冷”的广告纳入到候选集里，当然，也不能是毫无章法的乱加一气。这里面最重要的就是：如何找到“好”的？

可以选择的做法是，找到一些广告的静态特征，例如：标题、属性、类别，等等，跟“热”的广告进行聚类，或者把特征代入模型，算出一个大概的分数。甚至可以把流量当中一定百分比的pv用作“搜寻”，然后快速反馈到系统当中，迅速定位和捕捉“表现好”的广告，而对于那些给了“机会”却表现不好的广告，则减分或者不纳入候选集。

《广告算法》学习笔记

定向广告实战