1.多語言異構組成web客戶端程序,解決辦法
java本地調用: Runtime.getExec http://www.jspcn.net/htmlnews/110493381406213.html
php_java調用 :http://blog.csdn.net/aaliwen/article/details/5993703
perl調java:http://www.builder.com.cn/2007/0310/380843.shtml2.爬蟲參考
Hadoop 一脈相承的另外兩個開源項目 Nutch 和 Lucene ( 三者的創始人都是 Doug Cutting )
nutch(搜索引擎 and 全文檢索) 與 lucence 區別
3.設計
爬蟲:多線程框架
總體:多模塊定好接口齊頭並進
抓取層,操作層,規則層
關於規則:http://dev.yesky.com/478/2034478.shtml
開發人員在程序中使用規則引擎基本遵循以下5個典型的步驟:創建規則引擎對象;向引擎中加載規則集或更換規則集;向引擎提交需要被規則集處理的數據對象集合;命令引擎執行;導出引擎執行結果,從引擎中撤出處理過的數據。使用了規則引擎之後,許多涉及業務邏輯的程序代碼基本被這五個典型步驟所取代。
drools示例:http://www.ibm.com/developerworks/cn/java/j-drools/。
不錯的資料和總結:
http://www.open-china.net/blog/11367.html
使用規則引擎的效果舉例——信用卡申請示例:
http://mmscau.iteye.com/blog/482532
爲基於spring的軟件添加輕量級 規則引擎 ——http://webservices.ctocio.com.cn/tips/485/6151485.shtml
現實中的規則引擎:http://www.iteye.com/topic/100339 原文:http://www.infoq.com/articles/Rule-Engines
GitHub的研發之道:http://news.csdn.net/a/20110821/303368.html 。