ORC file format,它的全名是Optimized Row Columnar (ORC) file format。使用ORC文件格式提升Hive讀、寫與處理數據的性能。
存儲方式爲數據按行分塊,每塊按照列存儲
壓縮快 快速列存取
效率比rcfile高,是rcfile的改良版本
具體可以參考官網:
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+ORC
ORC file format,它的全名是Optimized Row Columnar (ORC) file format。使用ORC文件格式提升Hive讀、寫與處理數據的性能。
存儲方式爲數據按行分塊,每塊按照列存儲
壓縮快 快速列存取
效率比rcfile高,是rcfile的改良版本
具體可以參考官網:
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+ORC