Programming Collective Intelligence读书笔记一
这章主要讲了什么是Collective Intelligence,机器学习。开始举了一个DVD租赁公司基于以前客户租赁电影的历史记录来推荐电影,并悬赏1百万美金作为第一个能够提高推荐系统准确率10%的人,另一个是Google通过其他网页以一个网页的链接数来作为一个相关度的标准,这让Google的搜索结果比其他竞争对手好许多倍,并以此到2004年就占有搜索市场的85%。这两个例子都在说明从大量的不同的人群中搜集信息并利用复杂的算法可以创造出更多的商业价值。其实这方面的例子很多,例如从亚马逊买书的推荐系统:

?
?
机器学习在大量的模式面前的泛化能力是不同的,如果一个模式不同于以前所看到的,那么这个算法很容易被误解。由于当前的数据量不够,不能涵盖各种将来的情况,所以机器学习的方法很容易出现过度泛化,从而出现不准确性。
?