Deep Interest Network: 阿里深度兴趣网络
摘要
深度兴趣网络(DIN,Deep Interest Network):
该方法由阿里妈妈的精准定向检索及基础算法团队提出, 针对电子商务领域(e-commerce industry), 充分利用/挖掘用户历史行为数据中的信息来提高CTR预估的性能.
- contributions/key words:
1 | -diversity |
- old methods:
1 | 常见的算法, 比如 Wide&Deep, DeepFM等, 通常流程是: |
- DIN:
1
2Diversity:用户在浏览电商网站的过程中显示出的兴趣是十分多样性的.
Local activation: 由于用户兴趣的多样性, 只有部分历史数据会影响到当次推荐的物品是否被点击, 而不是所有的历史记录.
- Features:
1
2只有用户行为特征是multi-hot, 即多值离散.
没有人工组合特征, 会在dnn中自己学习.
- Architecture:
1
2Activation Unit实现Attention机制, 对Local Activation建模.
Pooling(weighted sum)对Diversity建模, 直接sum体现不出差异多样性, 加权可以.
1
2
3
4
5
6
7
8
9其中:
Vi表示behavior id的嵌入向量, 比如good_id, shop_id等;
Vu是所有behavior ids的加权和, 表示的是用户兴趣;
Va是候选广告的嵌入向量;
wi是候选广告影响着每个behavior id的权重, 也就是Local Activation;
wi通过Activation Unit计算得出, 这一块用函数去拟合, 表示为g(Vi,Va).
在实际实现中, 权重用激活函数Dice的输出来表示, 输入是Vi和Va.
优点:针对不同的候选广告, 用户的兴趣向量是不同的, 而不像单纯的sum pooling兴趣永远是不变的.
- DICE: data adaptive activation function:
类似relu + BN 的组合:
1 | 优点: |
- GAUC: 计算了用户级别的AUC, 在将其按展示次数进行加权, 消除了用户偏差对模型评价的影响, 更准确地描述了模型对于每个用户的表现效果
1 | AUC意义: AUC值越大, 当前的分类算法越有可能将正样本排在负样本前面, 即能够更好的分类. |
- mini-batch aware Regularization (MBA):
1 | 场景: |
原理:
- 效果:
1 | 利用候选的广告, 反向激活历史兴趣, 不同的历史兴趣爱好对于当前候选广告的权重不同, 做到了local activation. |
1 | 以上面年轻妈妈为例, 选取9个类别各100条商品, 作为candidate ad输入模型, 得到每件商品的embedding vector以及预测得分. |
- summary:
1
2
3
4
5
6
71.用户有多个兴趣爱好, 即访问了多个good_id, shop_id.为了降低维度并使得商品店铺间的算术运算有意义, 我们先对其进行Embedding嵌入.
那么我们如何对用户多种多样的兴趣建模?
--使用Pooling对Embedding Vector求和或者求平均.同时这也解决了不同用户输入长度不同的问题, 得到了一个固定长度的向量.这个向量就是用户表示, 是用户兴趣的代表.
2.但是, 直接求sum或average(相当于平均权重, 没有侧重)损失了很多信息.
--所以稍加改进, 针对不同的behavior赋予不同的权重, 这个权重是由用户历史behavior和当前候选广告共同决定的.这就是Attention机制, 实现了Local Activation.
3.DIN使用activation unit来捕获local activation的特征, 使用weighted sum pooling来实现diversity结构.
4.在模型学习优化上, DIN提出了Dice激活函数、MBA(自适应正则化) , 显著的提升了模型性能与收敛速度.
- Reference:
1
2
3
4
5
6Github: https://github.com/running-Bad-AI/DeepInterestNetwork
Deep Interest Network for Click-Through Rate Prediction
Learning piece-wise linear models from large scale data for ad click prediction
https://www.leiphone.com/news/201707/t0AT4sIgyWS2QWVU.html
https://www.leiphone.com/news/201706/pDfOAoMYp8mqNKEC.html
盖坤的分享视频 http://www.itdks.com/dakalive/detail/3166