magigo/探索与利用.md

Created February 5, 2015 07:14

Star (0) You must be signed in to star a gist
Fork (0) You must be signed in to fork a gist

Select an option

Learn more about clone URLs
Clone this repository at <script src="https://gist.github.com/magigo/a9e4ec75e3c55dbc87eb.js"></script>
Save magigo/a9e4ec75e3c55dbc87eb to your computer and use it in GitHub Desktop.

Download ZIP

Raw

探索与利用.md

长尾的(a,u,c)组合
Multi-arm Bandit问题

有限个arms，代表每一个a，每一个有有限的确定收益

目的是在每个时刻t，我们必须从arms中选择一个，最终目标是优化整体收益

挑战海量空间需要被探索，每个arm期望收益是动态变化的
思路 UCB算法 beta-UCB

LinUCB,特征空间内的UCB

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment