《广告算法》学习笔记

简介篇

Posted by Ann on May 6, 2019

最近老板发来一本广告算法入门短书,先看一遍记个笔记,留到以后学习补充~ 希望能成长成一个独当一面的人鸭~

广告简介

1.定义

广告是由已确定的出资人通过各种媒介进行的有关产品(商品、服务和观点)的、有偿的、有组织的、综合的、劝服性的非人员的信息传播活动。

2.互联网广告类型

  • 条幅广告
  • 邮件广告
  • 富媒体广告
  • 视频广告
  • 文字链广告
  • 社交广告 微信广告

3.广告计费模式

  1. CPM(Cost per Mille)
    CPM即指按照千次展现计费,广告系统只负责展示,不做预估,适合大广告。
  2. CPT(Cost per Time)
    按照单位时间计费的方式,广告系统只负责展示,不做预估,适合大广告。
  3. CPS(Cost per Sale)
    按照成交计费,所以广告系统对于ROI指标要进行预估。CPS下,广告系统完全站在了广告主这一边。ROI指投资回报率。

  4. CPC(Cost per Click)最常用
    CPC最早产生于搜索广告,目前是应用最广的计费方式。顾名思义,就是按照千次点击计费。
    一方面,广告平台需要预估用户点击率;另一方面,广告商可以通过竞价的形式是自己的广告排名更前。

4.广告位拍卖方式

纳什均衡

在竞拍过程中,如果存在一点,博弈各方如果改变竞价策略就会导致利益损失。这一点,就被称为纳什均衡点。
本地无嫉妒均衡(locally envy-free equilibria),又称对称纳什均衡。本地无嫉妒均衡是指,排在第k位的广告主,如果增大出价排到第k-1位,不会增加其收益。

广义一阶价格(GFP)

这里的一阶价格是指广告主本身的出价。广告的排序方式采取按照竞价降序排列,然后选取排序较高的前几个广告用于展现。在广义一阶价格模式的扣费方法是,如果广告发生点击了,便会按照广告主的竞拍出价,进行扣费。

  • GFP不存在纳什均衡点
  • GFP对广告平台不友好,排名第k的广告商可以将竞价降至k-1位价格高一点点的价格。
  • 不合理

广义二阶价格(GSP)

对应第i位的广告,如果发生点击,那么广义二阶价格扣费是,收取第i位广告主,第i+1位广告竞价加上一个货币最小值

  • 存在纳什均衡点,且不唯一
  • 不是一个鼓励相容的机制
  • 相对合理,且实现简单,常用

VCG机制

VCG(Vickrey-Clarke-Groves)机制是一种目标为最大化社会价值的竞价机制,若当前排名位i的广告被点击,需要付费在i以后广告的损失值。
即:loss = (xi-xi+1)+…+(xm-xm+1)

  • VCG是一个激励相容的机制,在VCG机制下,按照真实估价出价是最有选择。
  • VCG机制最大化社会价值,对广告主来说是一个很好的机制。
  • VCG存在纳什均衡,且均衡点唯一。
  • 复杂,难以向广告商解释,工业界不常用

参考链接 点这里

5.广告算法部分技术

定义:互联网广告算法的核心问题,是根据用户(User)、环境(Context)、广告(Ad)的全部有效信息,找到最合适的投放策略和模型,兼顾浏览者、广告主、广告平台的最大利益,并不断调整。

优化目标

  • 对于广告商来说,优化目标是收益与访问量的比值:
  • 对于用户来说,优化目标是点击量与展现量的比值:
  • 对于广告平台来说,优化目标是点击带来的总价值:

其他技术

  • 广告搜索引擎
  • 存储和实时计算
  • 推荐技术
  • 广告率预测
  • 广告主工具

系统架构

典型的广告投放系统,大概包括如下几个主要的组成部分:

模块 功能 在线/离线
前端引擎 接收请求,判断合法性,传入后端,返回结果 online
检索引擎 关键字搜索,倒排返回 online
实时点击率预估 计算二维的联合分数 online
广告主操作消息更新服务 广告主在线更改竞价信息等 online
用户行为数据收集和更新系统 收集用户行为,将其转化为结构化数据  
特征提取和行为分析 对上层收集到的数据进行提取分析 offline
反作弊系统 发现和处理作弊信息,包括异常的访问、无效的点击等等 on/off
广告主后台 广告主管理自己所有的投放活动 on/off
存储系统 存放数据,常以键值对的形式 on/off
计算系统 各种数据挖掘任务 offline

个人感觉主要包含两条主线的功能模块

  1. 面向广告商的平台-> 实时更改竞价及投放管理
  2. 面向用户的平台-> 在线:前端->检索->实时点击率预估及排名计算->反作弊
    离线:行为收集->特征提取及分析->建模分析