hive ORC 文件存儲格式


   ORC file format,它的全名是Optimized Row Columnar (ORC)  file format。使用ORC文件格式提升Hive讀、寫與處理數據的性能。

    存儲方式爲數據按行分塊,每塊按照列存儲

     壓縮快 快速列存取

     效率比rcfile高,是rcfile的改良版本


    具體可以參考官網:

     https://cwiki.apache.org/confluence/display/Hive/LanguageManual+ORC

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章