原创 Scala Json與map互轉

Map2Json import com.alibaba.fastjson.{JSONArray, JSONObject} val map = mutable.HashMap("1"->1,"2"->2,"3"-

原创 Sum 函數 Axis 詳解

編程過程中經常需要對數組進行處理,而sum又是經常需要用到的函數,sum函數傳參時會用到axis參數,低維度還好,高維度經常容易混淆,本文基於TF,對數組sum時axis進行詳解,即對哪個位置加,加完形狀變什麼樣。 Tip: tf只是用來

原创 Shell 檢查HDfS文件

平常腳本運行需要檢查對應hdfs路徑相關信息,總結一下: Tip: 假設要檢查的路徑爲check_path 1.獲取路徑文件大小並轉化爲規定單位 Byte,K,M,G bytes獲取文件大小,單位爲字節;base爲轉換單位的基準,我這裏取

原创 Scala 獲取時間,時間戳,時間差

經常遇到處理時間與獲取當前時間,記錄一下:   1.獲取時間 1)獲取當前時間 dateFormat規定好想要的數據格式 常用的對應如下: 格式 yyyy MM dd HH mm ss 對應 年 月 日 小時 分鐘 秒   編程中常用的:

原创 Scala 序列化 反序列化 Object

網上的序列化object教程都是基於Java寫的,沒有Scala版本,只能自己動手改造一下= = 1.要序列化類,首先寫一個基礎類供我們操作: 非常基礎,只有姓名和年齡兩個變量的基礎類 class Student() extends j

原创 Shell 常用分割字符串

經常需要用shell對字符串或者路徑解析,mark兩種自己常用的分割方法: 1.awk 示例: echo $name|awk -F '_' '{print $1}' Tip: -F後面跟要使用的分隔符 $1類似於取分割後的第一個內容,輸

原创 Hive 分區表創建,增加,刪除

Hive分區表   1.從HDFS加載數據 A.建表時加載 hive -e "create table if not exists tableName str1 string, str2 string, str3 string ) pa

原创 SparkStreaming x Kafka 0.8 / 0.10 消費指南

Streaming x Kafka 實時統計數據時需要用到Spark Sreaming x kafka,spark版本就不多贅述了,kafka版本現在主要分0.8.x.x和0.10.x.x,但是調用相同API消費時發現兩者有區別,這裏做一

原创 Hbase 建立分區表 By Scala

問題描述: Hbase在大規模數據數據集情況下拉取數據時,若rowkey密集集中在一臺節點,則在批量拉取數據時容易出現數據拉取速度很慢或者出現timeout,如果資源允許的情況下,可以將rowkey根據自己的規則手動split到多個分區中

原创 Shell 加減乘除

Shell 加減乘除 Expr echo 加 `expr 9 + 3` echo 減 `expr 9 - 3` echo 乘 `expr 9 \* 3` echo 除 `expr 9 / 3` 加 12 減 6 乘 27 除 3 b

原创 Java Map Merge方法

Merge 先鋪下源碼: Merge意爲合併,這裏主要是針對Map多個key-value對進行處理,如果key存在,則執行value的merge方法,這裏merge方法是自己定義的,如果key不存在,則會根據默認值將key-value對p

原创 樸素貝葉斯-分類及Sklearn庫實現(2)機器學習實戰

    上一篇文章我們簡單介紹了樸素貝葉斯的前提條件以及實現過程,並介紹了幾個流行的樸素貝葉斯分類法,實現了最基本的文本分類,這篇文章將繼續介紹樸素貝葉斯分類,這次主要通過垃圾郵件過濾的程序實現,深化貝葉斯分類的過程,並通過sklearn

原创 Idea Git 恢復reset --hard與刪除的內容

開發環境:Idea 版本控制:Git 場景: git reset --hard 後修改內容丟失 ,且修改內容未 git add 與 git commit 開發時因爲cd錯工程目錄 誤reset -hard重置了另一個工程,裏面開發了很多代

原创 Git 本地分支關聯遠程分支

本地分支關聯到遠程分支,遠程分支不存在: 在本地新建了分支 branch_A ,修改功能,想要在遠程關聯origin/branch_A,但遠程未創建origin/branch_A. git add . git commit -m "更新

原创 Shell If Else語句 數學運算 與 邏輯運算

數學運算   等於 = -eq 不等於 != -ne 大於 > -gt 大於等於 >= -ge 小於 < -lt 小於等於 <= -le   Tip : 只能使用最後一列的方法   邏輯運算 與 或 非 && || ! -a -o ! T