原创 從文章中檢索出關系型數據信息算法

我承認我超級喜歡胡思亂想... 今天我又有了新的想法,是關於從文章中提取出關係型信息的算法,我不知道現在是否已經存在了類似的算法,目前我還沒有想到這種算法的用途,但是我覺得這很困難,但是又可行,所以我就決定還是把它記下來吧。 文章呢,沒出

原创 mysql數據庫計算各種單位的兩個時間點的差值

mysql數據庫有一個很牛逼的自帶函數用來計算兩個時間點的時間差,他就是 timestampdiff(unit, datetime_expr1, datetime_expr2) 第一個參數(unit)就是你想要算出來的單位,我總結了一下有

原创 月亮與六便士

爲了讓靈魂安息,一個人每天都要做兩件他所厭惡的事情。說這句話的人是睿智的,我也一直在努力踐行着這條格言。因爲我每天都按時起牀,按時睡覺。--第二章

原创 多表關聯如何建立索引

我是用的三張表進行關聯的,一大兩小。下面看一下三張表的具體結構。   三張圖對應三張表,然後下面是我寫的查詢sql select a.*, b.*, c.* from statjiankong_etl a left join i

原创 存儲和計算的分別雲化設想

我的想法是這樣衍生來的... 雲的概念我這裏就不細說了,大致的意思就是可以自由分配固定的資源。比如說你有好幾百臺服務器,每臺服務器資源相對來說比較大,你的服務不需要這麼大的資源,一臺服務器的資源,對你來說都是“殺雞用了牛刀”,那麼雲計算就

原创 關於maven的pom.xml報錯

一、pom.xml報錯   類似:Missing artifact org.springframework:spring-jdbc:jar:3.2.4.RELEASE 這樣的錯誤,提示某個jar包沒有了。   這個問題之前碰見好幾次了,每

原创 eclipse打jar包報錯

想攻一攻hive的UDF,終於找到了依賴包,就用eclipse寫了個簡單的UDF,想打個jar包傳到hadoop環境上,結果這jar包就是打不上。 我根據報錯信息上網上找了好多博客,最終在一位前輩的指導下搞定了,下面我總結一下這種報錯可

原创 hive外表的.txt文件‘自動補全’問題

    hive的表按性質來分,目前我知道的就是管理表和外部表。  建表語句中主要用關鍵字來區分,EXTENAL表示的就是外部表,MANAGED表示的就是管理表。區別就是,hive認爲外部表並非完全擁有這份數據,所以刪除該表並不會刪除掉這

原创 kettle的元數據

首先解釋一下元數據,元在中國漢語中有‘基本’之意,所以元數據也可以說成是kettle的基本描述數據。拿人來舉例子,一個人出生年月,年齡性別,地區職業,生活閱歷等等,這些都可以稱爲一個人的元數據,那麼kett

原创 開博第一篇

我越來越真切地覺得,人類急需要重構,無論是身體還是靈魂...