【推荐系统】章1 基本介绍#

标签（空格分隔）：推荐系统

推荐系统评测#

在进行推荐之前，先从数据获得方法入手。数据的获得方法主要有

不同的实验方法可能会对应着不同的衡量指标，简单的介绍如下：

用户满意度
这个指标相对来说是一个主观的指标，可以通过用户调查，或者是对用户客观行为进行分析（比如：点击率、停留时间等）
预测准确率
- 评分预测
  评分预测类主要是让用户对商品进行打分，比如1-5级的打分。其主要的计算指标是均方根误差RMSE或者平均绝对误差MAE
TopN推荐
topN推荐，即给用户推荐一个其可能感兴趣的item列表，也是我们主要要讨论的。其主要的评价指标即PR（precision recall）
覆盖率
覆盖率主要是刻画了推荐系统对**长尾物品**的发掘能力。我们希望推荐系统不止推荐出一些热门的，这样只能覆盖很少的一部分items。
- 最简单的计算方法：推荐系统推荐出来的物品占所有物品的比重。但是没有考虑到分布情况
- 统计推荐列表中不同物品的出现次数的分布
  信息熵 $H=-\sum p_i\log p_i$
  基尼系数 $G=\frac{1}{n-1}\sum (2j-n-1)p(i_j)$
多样性
即希望推荐给用户的东西类型是多样的，比如对于电影，用户可能喜欢看爱情类、科幻类，那么推荐系统在进行推荐的时候，只推荐爱情类的效果显然不如既有爱情类又有科幻类的效果好。
新颖性
惊喜度
信任度
。。。