原创 機器學習中的算法(2)-支持向量機(SVM)基礎

原文地址:http://www.cnblogs.com/LeftNotEasy/archive/2011/05/02/basic-of-svm.html 版權聲明:     本文由LeftNotEasy發佈於http://leftn

原创 linux下nutch的增量抓去腳本

先收下了。 <span style="font-family:Microsoft YaHei;font-size:14px;"># runbot script. to run the Nutch bot for crawling and

原创 如何完全卸載vmware★虛擬機

原文地址:http://jingyan.baidu.com/article/aa6a2c1435355f0d4d19c460.html 大多數人遇到vmware卸載不了問題比如自帶和360卸載不了,在網上找過好多資料都沒必要

原创 nutch1.2插件開發

參考了不少nutch插件開發的文章都不完整,經過多次調試研究才成功,下面將注意要點列出希望能對nutch應用開發愛好者提供幫助。   nutch開發環境搭建請參考 http://peigang.iteye.com/blog/1464

原创 從WikiPedia挖掘數據

原文地址:http://www.cnblogs.com/rosting/archive/2011/08/26/2155187.html 維基百科(Wikipedia)作爲一個自由、免費、內容開放的百科全書協作計劃,包含人類

原创 mysql分佈式的主從配置

1、安裝mysql hadoop@master:~$ sudo apt-get install mysql-server 安裝過後,設置密碼爲root。 2、確保集羣中的機器可以相互遠程登錄mysql hadoop@master:~

原创 java操作blob

原文地址:http://eric-gcm.iteye.com/blog/937860package com.allan; import java.s

原创 Oracle學習

1、最近由於項目需要,又開始學習Oracle,本以爲他和其他數據沒什麼區別,但一開始慘痛的經歷告訴我,還是要認真對待他的。。 錯誤1:登陸https://localhost:1158/em 之後,看到數據庫實例都是關閉的.啓動不了. 辦法

原创 pdsh配置及應用

1、下載和安裝 可以在官網http://sourceforge.net/projects/pdsh/下載。 wget http://nchc.dl.sourceforge.net/project/pdsh/pdsh/pdsh-2.26/p

原创 C++通過DLL調用C#代碼

本文將介紹C++中通過DLL來調用C#代碼。 首先建立C#的“類庫”工程CShapeDLL。 然後輸入如下代碼: //C++通過DLL調用C#代碼 //http://blog.csdn.net/morewindows/artic

原创 hive的基本配置

1、下載hive-0.7.1.tar.gz,只需按在一個節點上就好。 http://archive.apache.org/dist/hive/hive-0.7.1/hive-0.7.1.tar.gz tar zxvf hive-0.7.

原创 iOS SDK:iOS調試技巧

感謝原創 在程序中,無論是你想弄清楚爲什麼數組中有3個對象而不是5個,或者爲什麼一個新的玩家開始之後,遊戲在倒退——調試在這些處理過程中是比較重要的一部分。通過本文的學習,我們將知道在程序中,可以使用的大多數重要調試功能,並如何利

原创 mysql基本命令總結

平時用mysql很多,但是很多命令還得去網上查,特來總結下吧。 1、mysql安裝。 windows下就不說了,ubuntu下面,通過這個命令來安裝。 sudo apt-get install mysql-server安裝過程需要設置密

原创 java讀寫xml文件

java源代碼import java.io.File; import java.io.FileInputStream; import java.io

原创 2014年趨勢科技夏令營面試

一面: 自我介紹。 1.namenode datanode 關係,簡單介紹下Hadoop,jobtracker tasktracker. 2.hdfs存儲機制。 3.突發關鍵詞計算。項目。數據獲取。 4.攻防比賽中舉個例子,做過的題。 5