HBase踩坑筆記 - 使用 MR 集成Hbase 報錯 IllegalArgumentException: No columns to insert ⭐️⭐️⭐️⭐️

原創

2020-06-22 09:51

錯誤描述

今天在使用 MapReduce 將 Person 表中的 name 字段的數據寫入到 Person_mr 表中報錯
代碼如下 :
Mapper

package com.wangt.habse.mr01;

import org.apache.hadoop.hbase.Cell;
import org.apache.hadoop.hbase.CellUtil;
import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.client.Result;
import org.apache.hadoop.hbase.io.ImmutableBytesWritable;
import org.apache.hadoop.hbase.mapreduce.TableMapper;
import org.apache.hadoop.hbase.util.Bytes;

import java.io.IOException;

/**
 * 從 Person 表中讀取數據 寫到 Person_mr 表中
 *
 * @author 王天賜
 * @create 2019-08-02 20:08
 */
public class PersonMapper extends TableMapper<ImmutableBytesWritable, Put> {
    //  輸出類型是 ImmutableBytesWritable(序列化的Byte 數組) 和  Put

    /**
     * 從 Hbase 的 Person 表中讀取數據
     *
     * @param key     rowkey
     * @param value   從 Hbase 表中讀取數據的 Result 對象
     * @param context
     * @throws IOException
     * @throws InterruptedException
     */
    @Override
    protected void map(ImmutableBytesWritable key, Result value, Context context)
            throws IOException, InterruptedException {

        // 構建 Put 對象
        // 注意 : 這個key是序列化的 rowkey
        Put put = new Put(key.get());
        System.out.println(Bytes.toString(key.get()));
        // 遍歷數組
        Cell[] cells = value.rawCells();
        for (Cell cell : cells) {
            // 獲取 HBase 的列
           String qualifier = Bytes.toString(CellUtil.cloneQualifier(cell));
           //  列族
           String family =  Bytes.toString(CellUtil.cloneFamily(cell));
           switch (qualifier) {
                // 判斷字段 是否是 name
                // 如果是 name 列 ,則將 name列的數據 添加到 Put 對象中 注意 一個 map 只讀一條數據
                case "name":
                    put.add(cell);
                    break;
           }
        }
            context.write(key, put);
        }
    }

Reducer

package com.wangt.habse.mr01;

import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.client.Result;
import org.apache.hadoop.hbase.io.ImmutableBytesWritable;
import org.apache.hadoop.hbase.mapreduce.TableReducer;
import org.apache.hadoop.io.NullWritable;

import java.io.IOException;

/**
 * 將數據寫入到 Person_mr 表中
 *
 * @author 王天賜
 * @create 2019-08-02 20:12
 */
public class PersonReducer extends TableReducer<ImmutableBytesWritable, Put, ImmutableBytesWritable> {

    @Override
    protected void reduce(ImmutableBytesWritable key, Iterable<Put> values, Context context) throws IOException, InterruptedException {

        // 將 put 直接輸出即可
        // put 中封裝了 存入新表的數據
        for (Put value : values) {
            context.write(key, value);
        }
    }
}

然後就報錯
Error: java.lang.IllegalArgumentException: No columns to insert
一開我以爲是沒讀到數據 ,但是我看了下打印的日誌

發現讀到數據了 , 又檢查下代碼 ,怎麼想都想不明白明明讀入數據了 , 但是還是不明白爲什麼會報這種錯誤 .,然後我根據報錯位置查了下這個報錯觸發的原因

當滿足 Put.isEmpty 爲 true 的時候則會拋出異常 ,然後我看了下 put 爲空的條件

找到 familyMap

可以看到這裏存儲的是 Cell 對象 ,
如下圖 , 可以看到我們使用 put 添加的數據最終都添加到 familyMap

familymap的k是列族 , KeyValue 是 Cell的子類 KeyValue 的集合

那麼接下來分析我們的代碼 , 這裏已經可以確定報錯的大致原因 :

Map 階段是從 Person 中讀取數據 Person 表中有兩個列分別是 name 和 age 我現在需要把 Person 表中的Name列的數據輸出到 Person_mr 表中, 報錯,出現讀取的某一個 Cell 或者某幾個不存在 name 字段
猜測 : 可能是某一條數據中沒有 name 字段

然後我仔細檢查了下之前的數據 , 然後果然發現問題

可以看到 : 最後一條數據沒有 name 列 ,在讀取的時候是讀取不到的 ,又因爲一個 put 只添加了一條 name 列的數據, 所以出現問題

所以只需要在輸出到 Reduce 時檢查下 put 是否爲空即可

 if(!put.isEmpty()){
            // 輸出
            context.write(key, put);
        }

補充 :

如果你遇到和我相同的問題 , 建議不要上來直接拿我的解決辦法 , 可以參考我的思路找到自己的問題所在, 這樣才能解決問題

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

HBase踩坑筆記 - 使用 MR 集成Hbase 報錯 IllegalArgumentException: No columns to insert ⭐️⭐️⭐️⭐️

錯誤描述

補充 :

如果你遇到和我相同的問題 , 建議不要上來直接拿我的解決辦法 , 可以參考我的思路找到自己的問題所在, 這樣才能解決問題

HBase 學習筆記 - HBase1.3.1 常用API總結 ⭐️⭐️⭐️

leetcode - 27. 移除元素

CS 學習筆記 - 關於頁式虛擬存儲器的地址映射的一些理解

SpringBoot學習筆記(1) - 使用IDEA構建自己的第一個SpringBoot項目並編寫SpringBoot的HelloWrold

Go語言學習筆記(1) - Golang 變量的基本使用與基本類型

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

HBase踩坑筆記 - 使用 MR 集成Hbase 報錯 IllegalArgumentException: No columns to insert ⭐️⭐️⭐️⭐️

錯誤描述

補充 :

如果 你遇到和 我相同的問題 , 建議不要上來直接拿我的解決辦法 , 可以參考我的思路找到自己的問題所在, 這樣才能解決問題

如果你遇到和我相同的問題 , 建議不要上來直接拿我的解決辦法 , 可以參考我的思路找到自己的問題所在, 這樣才能解決問題