Hadoop应用:You might also know
?
You might also know,也就是潜在好友推荐,据我所知是LinkedIn最早推出的,现在已经是一个非常常见的应用了,在qq,微博,微信里面都有类似的功能。虽说这个功能的原理非常简单,但是能第一个想到,还是非常令人钦佩。就像Google赖以发家的PageRank算法,思路都不难,贵在能够首先想到并付诸实施。?算法的大概思路如下:假设 ?andy 认识 vincent, vincent 又认识 bob, 那么 andy 认识 bob 的几率就非常大,如果 andy 还有第二个,第三个朋友也认识 bob, 那么 andy 认识 bob 的几率就更大了。简单的说,就是朋友的朋友(qq,微信,微信中的好友),很有可能就是你认识的人。?假设微信要统计所有用户的潜在好友,具体算法如下: foreach user in weixin 遍历所有的微信用户 foreach friend in "user's friend list" 遍历当前用户的好友列表 foreach friend2 in "friend's friend list" 遍历当前朋友的朋友列表 { 如果friend2不在user的好友列表中,对(user, friend2)计数加1,最后计数越大,说明 friend2最有可能是user的朋友 if(friend2 not in "user's friend list") count(user, friend2) ++; }??