从上一期的分享开始,我们来讨论计算广告相关的一些高级话题。作为机器学习在计算广告的应用,这些话题往往偏冷,但在现实中又有很大的实用价值。我们首先聊了归因模型,介绍了几种经验方法和一些基于模型的归因方法,这种模型在计算广告业中举足轻重,不过也常常被人忽视。

今天,我们来看另外一个重要的话题,那就是如何帮助广告商扩大受众群,我们也把这种技术称为受众扩展(Audience Expansion)技术。

什么是受众

广告商在投放广告时有一个最根本的需求,就是希望通过广告平台接触到更多有可能被转化的受众群。所以,对于绝大多数的广告平台而言,满足广告商的这个需求就成为了一个非常重要的功能。

为了让广告商来选择受众,不少广告平台提供两种最基本的功能。

第一种方式是搜索广告的模式,也就是广告商可以选择通过某个关键词或者一系列关键词来接触到希望投放的受众。这里面其实有一个假设,那就是受众的兴趣或者意图是和关键词联系在一起的,而如果投放的广告内容和受众的兴趣以及意图相符,那么对于广告商来说,就可以假设这种情况下受众的转化率是最高的。

第二种就是通过某种选择受众群的方式来让广告商自由地选择广告投放的对象。这里,最基本的方式是通过受众的“人口”(Demographic)信息来进行投放。典型的人口信息包括年龄、性别和地域。

不管是采用关键词还是人口信息来进行受众选择,这些方法看似简单直观,但其实也给广告商带来了不小的挑战。

首先,我们来看关于搜索关键词的难点。作为一个广告商,你怎么知道所有的跟你产品或者服务相关的关键词呢?理论上说,可能会有无穷无尽的关键词可供投放。但是关键词的投放数量也和成本有着密切的关系。所以,从现实的角度来讲,肯定是无法投放所有的关键词的。

其次,利用人口信息来选择受众,那如何来找到比较合适的人口信息呢?这里面就有很大的挑战了。广告商可以利用一些研究结果来找到对应的人口信息从而增强广告投放的效果。然而针对很多中小广告商来说,花费很大的精力和时间去研究这些不同的人口信息和广告效果之间的关系显然是不可能的。

除了我们刚才所说的这两种广告商选择受众的方式以外,现在也有不少的广告平台并不需要广告商进行“显式”的受众选择。这些服务其实就是看到了这种选择带给广告商的复杂性,与其让广告商来选择,还不如让广告平台来优化。于是,有很多广告平台提供的就是“傻瓜式”的广告服务,广告商仅需要设置预算信息,对于人群的投放则完全由广告平台来负责。

受众扩展

了解了受众的选择以后,一个很现实的问题就摆在了广告平台商的面前,如何帮助广告商来扩展已经选择了的受众群体,从而能够实现受众转化的最大化呢?

来自LinkedIn的几位作者就探讨了在社交媒体广告中受众扩展的这个问题[1]。在LinkedIn平台上,广告商,也就是雇主,可以针对不同的群体限制条件,也就是我们所说的受众,来投放广告,以吸引潜在的雇员和候选人。广告商在投放广告的时候,可以按照雇员的职业技能(比如是否会Java,是否会机器学习等)以及一些其他的信息(例如来自哪个公司、地理位置)来选择投放的受众。这和我们之前介绍的场景一样,很明显,即便是广告商精心选择一个看似比较有效的受众,在这种情况下,其实依然有很多种其他选择的可能性。

在这篇文章里,作者们介绍了这么几种受众扩展的思路。

第一种思路是和某一个广告推广计划(Campaign)无关的。这里主要是通过一种“类似”算法而找到类似的公司、类似的技能等等。这种扩展的好处是可以对任何广告推广进行扩展而无需积累数据。

第二种思路是广告推广相关的扩展。这里其实还是利用了“类似”算法,但是在扩展的时候是根据广告商对当前这个广告推广所选择的条件来进行选择,这样的选择自然就会和当前的广告推广更加相关。

在实际操作中,LinkedIn采用了这两种思路结合的方法。先利用于推广无关的扩展方法来获取最初的一些扩展用户,尽管这部分用户可能质量不高。然后,当广告推广已经运行了一段时间以后,再针对这个广告推广的选择进行扩展,就可以找到更加高质量的扩展用户群体。

我们看到这些扩展方法都依赖于“类似”算法,这里我简单说一下这个算法的核心思想。

总体来说,这个算法是针对某一个实体(可以是公司、人名、地域、技能等),通过搜索的方法来返回最相关的K个其他实体。作者们把这个问题看成了一个监督学习的问题。其核心就是利用了一个对数几率模型,对相似的正例和负例进行学习。

那么,哪些实体是正例,哪些是负例呢?作者们把用户频繁选择放在一起投放的实体当做了正例,而把其他的实体当做负例。对于特性来说,这里广泛采用了文本特性,包括文本的词包表达、以及N元语法(N-gram)组成的特性。同时,这里还利用了图相关度来推算,比如两个公司在社交关系上的相关程度。然后,两个实体之间的余弦相关度也作为一种特性被包含在了模型中。

在线上实验的结果中,所有受众扩展的效果都比不用扩展有显著的提升。特别是在混合扩展的模式下,展示机会、点击率和总的收益都提升了10%以上。这个实验结果可以用来说明受众扩展的重要性。

总结

今天我为你介绍了在线计算广告的另外一个高级话题:受众扩展。

一起来回顾下要点:第一,广告商可以通过关键词或者人口信息等方式来选择受众,不过受众选择也并不容易,有很大的挑战性;第二,我们介绍了和推广计划有关的与无关的两种受众扩展思路,以及将两种思路结合的方法,并简单介绍了两种思路都依赖的“类似”算法。

最后,给你留一个思考题,在什么情况下受众扩展可能会出现问题,如何来衡量这些问题?

欢迎你给我留言,和我一起讨论。

参考文献

  1. Haishan Liu, David Pardoe, Kun Liu, Manoj Thakur, Frank Cao, and Chongzhe Li. Audience Expansion for Online Social Network Advertising. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD '16). ACM, New York, NY, USA, 165-174, 2016.

评论