3.hadoop中的序列化

序列化的三種主要途徑
作爲一種序列化格式:一個對象序列化以後,它的編碼可以被存儲到磁盤上,供以後反序列化使用
作爲一種通信數據格式:序列化結果可以從一個正在運行的虛擬機,通過網絡被傳遞到另一個虛擬機上
作爲一種拷貝、克隆機制:將對象序列化到內存的緩衝區中,然後通過反序列化,可以得到一個對已存對象進行深拷貝的新對象

序列化機制
java
實現Serializable接口,立即獲得java提供的序列化功能
好處和優點:
不適合大規模數據之處:
hadoop
java的序列化機制雖然強大,卻不符合下面的這些要求

Hadoop Writable機制
該機制緊湊、快速(但不容易擴展到java以外的語言)
包含三個重要的接口WritableComparable、RawComparator、WritableComparator

Hadoop序列化框架
Hadoop提供了一個簡單的序列化框架API。用於集成各種序列化實現,該框架由Serialization實現




發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章