首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 其他教程 > 其他相关 >

培训记要

2013-01-21 
培训记录#############################培训一################################移动搜多技术-抓取遇到的

培训记录
#############################培训一###############################
#移动搜多技术-抓取
遇到的问题
1,ua适配
2,ip适配
3,页面布局不同。
4,翻页多,link_depth大
5,session化
6,url复杂。
7,站点稳定性差
8,客观数据少;sobar、访问量


问题:根据ua和header的特性,获得极其的配置,判断其是否是山寨机。


idea:写一篇关于手机类(网站)的爬虫的论文


移动互联网用户的搜索更加具有目的性,在变现方面非常有优势。


#关于日志处理
请求日志比较重要。
定时整理,现在是直接存储到hadoop。
现在做一个数据仓库来呈现页面时的数据报表等。


掌百:原来的百度浏览器。
百度在前几年的app方面布局有问题,比如掌百的不连续性。
同时app市场非常复杂,如:2011年山寨机的rom中app是3-4元/个,竞争复杂




#管理方面
目标,责任人,时间点是关键的三点。




#pm数据积累
尤其是成品的报表,在更换了PM后可能需要从新再来;以及不同pm之间、项目之间的数据共享。




#根据用户信息,推荐累的迭代过程
1,cookie里定期更新,有有效期。
2,谷歌的安卓客户端可以每几分钟定位


#############################培训二###############################
1,先用文字描述问题,才能做清楚。
2,不要个人英雄主义,打好配合
3,善于分解、量化

热点排行