kettle-轉換

1:列轉行
2:列轉行
3:去除重複記錄
      步驟名稱:保持唯一性
      增加計數器到輸出?:當勾選了此項,並在計數器字段後給予了名稱,則將會在該字段下顯示去掉的重複行數。
      字段名稱:用來去重的字段,可選多個字段,表示多個字段都相同時表示重複。
      該功能類似與sql中的distinct關鍵字。

4:增加序列
      一個序列是在某個起始值和增量的基礎之上,經常改變的整數值。可以使用數據庫定義好的序列,也可以使用kettle決定的序列。
      kettle序列在同一個轉換中是唯一使用的,每一次轉換運行的時候,序列的值又會重新循環一次,從開始值開始。
      使用數據庫序列:
   連接名稱:選擇數據庫存在的連接名稱。
      序列名稱:數據庫序列的名稱。
      使用計數器來計算序列:如果想用kettle生成的序列,使用此項。
      計數器名稱(可選):如果一個轉換中多個步驟生成同樣的值名稱,這個選項允許你指定計數器名稱,避免按照先後順序通過多個步驟。
      起始值:序列的起始值。
      增量:序列的步長。
      最大值:序列的最大值。

5:字段選擇
      字段選擇中包含有三個頁籤:選擇和修改,移除,元數據
      選擇和修改:用於獲取字段名稱,並可以對名稱進行修改,還可以修改其長度和精度。
      移除:移除字段後該字段將不會被預覽查看到。
      元數據:可以修改字段名稱,以及數據類型,長度,精度,格式等信息。但是,當在選擇和修改中將某一字段的名稱修改,要想
                     在元數據中繼續修改則選擇修改前的原字段名稱,會提示找不到該字段,需要選擇在選擇修改頁籤中已經修改成的名稱。

6:字符串替換
      將某個字段的某些字符替換成我們給定的字符。
      首先選擇輸入流字段,
      “輸出流字段”自己命名(就是用來保存處理後的結果的字段,可以和輸入流字段保持一致),可以選擇正則表達式,
      “搜索”就是你希望被替換的字符,字符串,可以是一個正則表達式,
      “使用…替換”就是你期望用什麼值替換被替換的部分,
      “設置爲空串”就是將你被選擇的部分用空替換
      “使用字段值替換”你可以使用現有的某個字段的值替換你期望被替換的部分,後面兩個根據自己的需要進行選擇。
 案例:
     1:轉換/輸入/生成記錄-------自定義字段,類型,對應的值,生成記錄可以按照指定的生成記錄數生成值。
     2:轉換/轉換/字符串轉換-----各種定義
 總:a:輸入流字段----要被替換的字段的名稱
        b: 輸出流字段----替換後的新字段的名稱
        c:  搜索-----------表示要被替換的字符或字符串
        d: 使用…替換----被替換的字符或字符串要被替換爲
        e: 輸出流字段爲空-----此時替換將在原字段做改變
        f: 搜索爲空------------每個字符前後都會視爲空,爲空的位置都會插入被替換字符或字符串
        g: 使用…替換爲空-----搜索字符將會置空
        h: 熟悉kettle中的正則表達式
A:kettle中的正則表達式
     1:正則表達式僅用字符或者字符串表示-----包含該字符或者字符串的字符串都會被查詢出來
     2:正則表達式中含有句點符號--------------句點符號可以匹配所有字符,包括空格和非字符符號 
例如:t.n----匹配tan,ton,tmojn,tn
     3:正則表達式中包含方括號----------------只有包含中括號中的字符才能被匹配,方括號只允許匹配單個字符 
例如t[asdf]n----匹配tan,tsn,tdn
     4: 使用圓括號加/的方式匹配單個或多個字符-----例如:t(a/s/d/f/oo)n----此時toon就會被匹配上
     5:表示匹配次數的符號,這些符號用於確定僅靠該符號左邊的符號出現的次數
     *表示0次或多次
     +表示1次或多次
     ?表示0次或1次
     {n}表示恰好n次
     {n,m}表示n次到m次
     6:正則表達式中的連字符“-”表示一個範圍
     7:”^“表示否的意思,表示不匹配該字符

7:將字段值設置爲常量
      字段:獲取字段名稱
      值替換:用常量值代替原值,此時無論原值有多少行,該行的所有值都會被一個值所替換。
      轉換掩碼:用於設置日期類型的格式。
      設爲空串:若設爲空串則該列值全顯示爲空。

8:拆分字段
      需要拆分的字段:選擇需要拆分的字段
      分隔符:拆分字段間的結束符號
      新的字段:看看能拆分的最大數,依據最大數量來定需要設置的新字段的數量,也可往大的設置,截取不到將輸出NULL,也可以往
      小的設置,這樣的話值部分截取不到。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章