Skip to content

Instantly share code, notes, and snippets.

@magigo
Created February 4, 2015 08:54
Show Gist options
  • Save magigo/48433d62cfb8db2193d6 to your computer and use it in GitHub Desktop.
Save magigo/48433d62cfb8db2193d6 to your computer and use it in GitHub Desktop.
1. 对用户历史行为打标签
按兴趣强烈程度
交易,购物前的行为,搜索广告的点击,普通广告的点击,搜索点击,搜索,分享,页面浏览,广告浏览
每一种行为通过tagger打一个标签,计算标签强度(简单来家同一个标签出现的次数)
tagger是一个ML的问题。强度越强的数量越少
2. session log
以用户ID为Key,完成作弊和行为标注(用整周数为周期,28天还是56天,根据广告决定窗口的长度)
用户行为累积,两种方式
滑窗简单回溯一定的天数,衰减累加(交低空间复杂度)
标签要有一个阈值,阈值越松CTR就越低(是一个递减的曲线,有拐点),标签也未必一定是正向作用,阈值不能太大,或太小
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment