序列化的三種主要途徑
作爲一種序列化格式:一個對象序列化以後,它的編碼可以被存儲到磁盤上,供以後反序列化使用
作爲一種通信數據格式:序列化結果可以從一個正在運行的虛擬機,通過網絡被傳遞到另一個虛擬機上
作爲一種拷貝、克隆機制:將對象序列化到內存的緩衝區中,然後通過反序列化,可以得到一個對已存對象進行深拷貝的新對象
序列化機制
java:
實現Serializable接口,立即獲得java提供的序列化功能
好處和優點:
不適合大規模數據之處:
hadoop:
java的序列化機制雖然強大,卻不符合下面的這些要求
Hadoop Writable機制
該機制緊湊、快速(但不容易擴展到java以外的語言)
包含三個重要的接口WritableComparable、RawComparator、WritableComparator
Hadoop序列化框架
Hadoop提供了一個簡單的序列化框架API。用於集成各種序列化實現,該框架由Serialization實現