原创 剛剛寫了一些關於找工作的事情,突然間有BUG。

 忘了把它寫到WORD上,於是全沒了。。。 說一下自已在找工作中,發現自已的不足吧。英語不夠自信,還不是很有信心去外企。沒有參加一個像ACM這樣的大賽,並且拿獎。然後就是沒能去好公司實習,真正學習一個領域的深入理解。等等這些。。。需要在今

原创 FP-tree的hadoop實現

FP 樹是關聯規則算法的一種,主要是用於分析數據項之間的關聯性,將關聯性大的數據項找出來,具體的一些概念見書《數據挖掘概念與技術》上介紹的頻繁項集,支持度等。 算法執行過程: 1.          掃描數據,計算一項集

原创 網易面試歸來

       今天上午去網易參加了網易的招聘會,我應聘的是互聯網後端開發。應聘這個職位是因爲自已在半年以前開始認真的學習了hadoop這個開源的分佈式項目,但是自已的經驗仍然是我的短板,加上最近實驗室有些事情要做,關係到畢業的問題,所以

原创 mapreduce的總結

mapreduce的一些問題 圖算法的mapreduce實現。 mapreduce程序的測試與驗證性。 關係代數中的join的mapreduce實現。 hive的方便性和效率優化問題。 海量數據存儲和計算的優化問題。 ps:開

原创 花了幾天時間,把hadoop的基本平臺在機器上運行起來了。

 開學回學校後,把hbase,hive這二個平臺在自已機器上運行起來了。在配置期間,有幾個錯誤一直困擾我幾天,最終在網友的幫助和自已的努力下,終於解決了問題。可以運行是值得高興的。接下來要研究研究內部的實現以及一些實際項目的開發。

原创 Hadoop 0.21.0的新功能

Hadoop 0.21.0 的新功能 Hadoop 發佈了最新版本,這版與之前的版本,在功能上有較大的改進,增加了一些新的功能。主要如下: http://www.cloudera.com/blog/2010/08/what%

原创 內存內存,資源資源!!

      今天把一個遺留了很久的問題,給找出來了,可能還有些地方還存在這樣的問題,就是在用C寫代碼時,忘記了DELETE操作,導致程序運行一陣子就卡住了,很莫名的,之前有意識到,可都沒有時間好好看看代碼,主要是代碼太多,不知道是哪個點,

原创 專注+博學

   經過一段時間的思考與學習,發現自已不是不夠專注和博學,因此在以後的學習過程中,需要加強這方面的學習。這陣子對服務器的構架挺感興趣的,有空需要好好的研究一下吧。   GOOGLE退出中國大陸了,用起來沒有以前那麼好用了,有點懷念。

原创 豆瓣裏可以很好的交流書籍。

   早在去年就註冊了豆瓣,但是一直都沒怎麼去用它,之前也有過深入思考關於讀書話題,在沒讀研之前,我還沒有意識到自已的知識,但是讀研後,我就一直充實自已的知識,自然就會去上網看別人分享的經驗,有人曾說過,無論是專家,還是科學家,他們都是善

原创 client讀寫hdfs的源碼分析總結

    週末花了一天的時間仔細了重溫了一下client對HDFS文件的讀寫過程,總結如下:    每次讀寫都是以一個數據塊的形式來進行的,並且包括數據內容和數據的校驗值。另外,到 namenode 上獲取相應的信息都是用 RPC 來通信

原创 科技人生

國慶這幾天,閒來無事時就看看電視,無意中發現了CCTV10的科技人生頻道,那裏播出了許多科學家的人生道路。比如王淦昌,楊振寧等等。同時還有一些普通百姓的科技夢想,讓我倍受啓發,他們那種精神值得每一位現代青年學習。如今的年輕人都很少有那種精

原创 市政排水系統的擁塞問題

           前天的深夜,廣州突然來了一場暴雨,結果好多地方都成了水災,我親眼目睹了我們學校被淹的樣子,可以說損失還是挺重的,幾棟教學樓,宿舍都漲滿了水,嚴重影響了教學,同時很多電腦,服務器都進水了,地下停車場也都全是水。也就是

原创 虎年新春快樂,有所進步。

    春節過完,已經回校了,開始新的一年奮鬥,調整心態和激情,抓住技術知識點,不斷的前行。我思故我在,加油吧。未來是美好!

原创 web搜索之簡單介紹

    今天晚上,大學同學叫我幫他看一下代碼,於是他把公司的搜索引擎的代碼發給我,有十幾M大小,我解壓後導入IDE,快速瀏覽了一下,原來也不過如此,由於代碼版本過於太早,而且有些類還丟失,故無法運行起來,以便查看一下它的效率和性能方面。

原创 五一白雲山之遊玩

          這次五一國家規定放假三天,初中同學郭XX從深圳趕來廣州玩,這是他第一次來廣州,於是我想起了白雲山,而且我來廣州都一直沒有去白雲山玩,於是決定這次五一去白雲山,早上9點開始從學校出發,大概半個多小時到了白雲山,門票是每人