原创 hive 高級結構

•array類型訪問: A[n] •map類型訪問: M[key] •struct類型訪問: S.x • array 類型訪問 : A[n] 語法: A[n] 操作類型: A爲array類型,n爲int類型 說明:返回

原创 java 複製

 java.util.list.addAll()方法同樣是淺複製

原创 excel 小節

===== excel固定表頭 “窗口”=>“凍結窗格” ===== if =IF(AND(B2<>"",C2<>""),C2/B2,"0%") =IF(B2<60,"不及格",IF(B2<70,"及格",IF(B2<85,"良好","優

原创 maven 的粗瞭解

在setting.xml中,設置默認的repository目錄。 <localRepository> E:/eclipseMyLib/repository</localRepository> eclipse中:

原创 hive 語法錯誤 小節

FAILED: Error in semantic analysis: DISTINCT on different columns not supported with skew in data. 對於2個count( distinct

原创 hive 客戶端結果亂碼

當我用本地機子通過vpn連接外網集羣,然後在本地通過hive cli運行hive sql時,發現很多字段出現null。當時以爲自己的sql有問題,一直找原因,最後無意間發現在本地客戶端很多字段顯示亂碼,當時就連到外網的hive cli運

原创 關聯規則學習

主要的指標包括:支持度support,置信度confidence,提升度lift。對於一個二項規則例如“A→B”,支持度是指A與B同時出現的概率,即P(A B);置信度是B關於A的條件概率,即P(B | A);提升度是B的概率的提升,即P