常用统计模型 指数族分布(高斯分布,multinomial,最大熵),最大似然估计可通过充分统计量链接到数据。跟参数维度有关,跟数据量无关。 map阶段,收集充分统计量,reduce更新模型 在mapper中仅仅生成比较紧凑的统计量,其大小正比于模型参数量,与数据量无关 指数族混合分布(高斯混合模型,隐马尔科夫,PLSI),ML估计通过EM算法迭代。 梯度分布(原始的方法)