華科圖書館項目總結

仔細想想,華科圖書館的這次項目,還是職業生涯的處女秀。然而這次項目,卻不是那麼順利,經歷了很多不快。

首先,可以發現給學校做項目是多麼的麻煩,錢不多事還不少。

其次,這次着實被需求坑了一把。以前只是在課堂上了解了一下,這次親身體會了。甲方動不動就改需求,是多麼蛋疼的一件事。而且每次只提一點需求,所以昨天做好的東西,今天要改;明天又說今天哪裏做的不好,又得繼續改。如此反覆,搞得人累不說,也很降低工作效率。

最後,每天從早上九點做到晚上十點左右,做的很累。而且,經常沒有雙休,真的很鬱悶。


不管怎麼樣,還是在這個項目上花了兩個多月的時間,雖然做的東西不夠深入,但還是把做過的東西暫且記下來再說。

1.前端

前端這塊,因爲要做大量報表,本來準備自己做頁面,後來使用報表軟件FineReport時發現它自帶了一個大數據決策系統。不過這個東西也很坑就是了,還得花錢。所以最後,前端這塊主要就是用那個軟件做報表。主要分爲三步,使用sql語句查詢數據庫得到數據集,設置參數面板,製作報表。這裏稍微熟悉了sql語句的使用,包括group by,in,substring和impala自帶的一些函數等。


2.後端

後端這塊,主要是做算法。這裏我只負責了一個算法,決策樹分類算法ID3。先從網上下的代碼,使用之後發現這個算法只適合枚舉類型,如果屬性有數值型的並不合適。後來病急亂投醫,從網上下了一個weka軟件,導入輸入數據,就可以得到決策樹,然後寫出分類規則。根據決策樹寫分類規則的代碼在另一篇博文中有寫,並沒有技術含量,這裏就不贅述了。然後,爲了寫畢業論文,我又自己裝linux,搭hadoop,運行mahout單機版和分佈式版,玩的也是不亦樂乎。最後說說我畢業論文中用到的算法,主要是基於用戶的協同過濾算法和基於物品的協同過濾算法,以後有機會再貼上來。這也是在實際項目中第一次與算法打交道。通過這次學習,我深刻地認識到,算法的本質就是數學啊。所以,學好數學還是很重要滴。


3.其它

本人新手,不喜勿噴。通過這次項目,還零零總總地學習了一些其它的東西。比如,第一次裝linux,linux命令的熟悉,第一次搭僞分佈式hadoop平臺,mapreduce的入門與熟悉,還有java的熟悉,eclipse的熟悉,等等。


總之,這次項目也學到了一點點東西。雖然不夠深入,但也值得在此做個總結,以備後面繼續學習,在大數據和機器學習方面繼續深造。另外,項目中有些代碼上傳到github主頁上去了。以後有機會,再把我的github主頁貼上來。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章