培訓記錄

#############################培訓一###############################
#移動搜多技術-抓取
遇到的問題
1,ua適配
2,ip適配
3,頁面佈局不同。
4,翻頁多,link_depth大
5,session化
6,url複雜。
7,站點穩定性差
8,客觀數據少;sobar、訪問量


問題:根據ua和header的特性,獲得極其的配置,判斷其是否是山寨機。


idea:寫一篇關於手機類(網站)的爬蟲的論文


移動互聯網用戶的搜索更加具有目的性,在變現方面非常有優勢。


#關於日誌處理
請求日誌比較重要。
定時整理,現在是直接存儲到hadoop。
現在做一個數據倉庫來呈現頁面時的數據報表等。


掌百:原來的百度瀏覽器。
百度在前幾年的app方面佈局有問題,比如掌百的不連續性。
同時app市場非常複雜,如:2011年山寨機的rom中app是3-4元/個,競爭複雜




#管理方面
目標,責任人,時間點是關鍵的三點。




#pm數據積累
尤其是成品的報表,在更換了PM後可能需要從新再來;以及不同pm之間、項目之間的數據共享。




#根據用戶信息,推薦累的迭代過程
1,cookie裏定期更新,有有效期。
2,谷歌的安卓客戶端可以每幾分鐘定位


#############################培訓二###############################
1,先用文字描述問題,才能做清楚。
2,不要個人英雄主義,打好配合
3,善於分解、量化
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章