序列化和反序列化
gitee地址:https://gitee.com/kylin1991_admin/serializer-framework
1、概念
- 個人理解,序列化和反序列化就是一種壓縮和解壓的過程。壓縮和解壓講究一個速度和大小
2、translate
- 禁止序列化
3、破壞translate
java 和file 、javaXML 都可以通過重寫私有readObject和writeObject進行破壞translate修飾
其他框架默認不會,例如XStram、FastJson、Protobuf等默認不會序列化translate修飾的
4、手寫serialize框架
a、設計ISerializer接口
public interface ISerializer {
<T> byte[] serialize(T obj);
<T> T deserialize(byte[] data, Class<T> clazz);
}
b、子類JavaSerializer
public class JavaSerializer implements ISerializer {
@Override
public <T> byte[] serialize(T obj) {
ByteArrayOutputStream byteArrayOutputStream = new ByteArrayOutputStream();
try {
ObjectOutputStream objectOutputStream = new ObjectOutputStream(byteArrayOutputStream);
objectOutputStream.writeObject(obj);
return byteArrayOutputStream.toByteArray();
} catch (IOException e) {
e.printStackTrace();
}
return new byte[0];
}
@Override
public <T> T deserialize(byte[] data, Class<T> clazz) {
ByteArrayInputStream byteArrayInputStream = new ByteArrayInputStream(data);
try {
ObjectInputStream objectInputStream = new ObjectInputStream(byteArrayInputStream);
return (T)objectInputStream.readObject();
} catch (IOException e) {
e.printStackTrace();
} catch (ClassNotFoundException e) {
e.printStackTrace();
}
return null;
}
}
c、子類JavaXMLSerializer
public class JavaXMLSerializer implements ISerializer {
// 使用java的,必須要進行 get set 方法。同時需要再類中註解 @XmlRootElement
@Override
public <T> byte[] serialize(T obj) {
StringWriter sw = new StringWriter();
try {
JAXBContext context = JAXBContext.newInstance(obj.getClass());
Marshaller marshaller = context.createMarshaller();
marshaller.setProperty(Marshaller.JAXB_FORMATTED_OUTPUT,
Boolean.TRUE);
marshaller.marshal(obj, sw);
} catch (Exception e) {
e.printStackTrace();
}
return sw.toString().getBytes();
}
@Override
public <T> T deserialize(byte[] data, Class<T> clazz) {
Object xmlObject = null;
try {
JAXBContext context = JAXBContext.newInstance(clazz);
// 進行將Xml轉成對象的核心接口
Unmarshaller unmarshaller = context.createUnmarshaller();
StringReader sr = new StringReader(new String(data));
xmlObject = unmarshaller.unmarshal(sr);
} catch (Exception e) {
e.printStackTrace();
}
return (T) xmlObject;
}
}
d、子類FastJsonSerializer
public class FastJsonSerializer implements ISerializer {
/*
<!-- https://mvnrepository.com/artifact/com.alibaba/fastjson -->
<dependency>
<groupId>com.alibaba</groupId>
<artifactId>fastjson</artifactId>
<version>1.2.68</version>
</dependency>
不能序列化translate修飾的字段
*/
@Override
public <T> byte[] serialize(T obj) {
return JSONObject.toJSONBytes(obj);
}
@Override
public <T> T deserialize(byte[] data, Class<T> clazz) {
return JSONObject.parseObject(new String(data), clazz);
}
}
e、子類XtreamSerializer
public class XtreamSerializer implements ISerializer {
private static final XStream xStream = new XStream();
/*
需要引入jar包
<!-- https://mvnrepository.com/artifact/com.thoughtworks.xstream/xstream -->
<dependency>
<groupId>com.thoughtworks.xstream</groupId>
<artifactId>xstream</artifactId>
<version>1.4.11.1</version>
</dependency>
不能序列化translate修飾的字段
*/
@Override
public <T> byte[] serialize(T obj) {
return xStream.toXML(obj).getBytes();
}
@Override
public <T> T deserialize(byte[] data, Class<T> clazz) {
return (T) xStream.fromXML(new String(data));
}
}
f、子類ProtostuffSerializer
public class ProtostuffSerializer implements ISerializer {
private static LinkedBuffer buffer = LinkedBuffer.allocate(LinkedBuffer.DEFAULT_BUFFER_SIZE);
private static Map<Class<?>, Schema<?>> schemaCache = new ConcurrentHashMap<>();
/*
<!-- https://mvnrepository.com/artifact/io.protostuff/protostuff-core -->
<dependency>
<groupId>io.protostuff</groupId>
<artifactId>protostuff-core</artifactId>
<version>1.7.0</version>
</dependency>
<!-- https://mvnrepository.com/artifact/io.protostuff/protostuff-runtime -->
<dependency>
<groupId>io.protostuff</groupId>
<artifactId>protostuff-runtime</artifactId>
<version>1.7.0</version>
</dependency>
如果是用的protobuf的話會有點小麻煩,所以後面出來的protostuff(是一個基於protobuf實現的序列化方法)
貌似有自己的語言 自己的編譯環境。。需要配置?
可以配置protoc 用protoc來進行序列化和反序列化
不能序列化translate修飾的字段
*/
@Override
public <T> byte[] serialize(T obj) {
if (obj == null) {
throw new NullPointerException();
}
Class<T> clazz = (Class<T>) obj.getClass();
Schema<T> schema = getSchema(clazz);
byte[] data;
try {
data = ProtostuffIOUtil.toByteArray(obj, schema, buffer);
} finally {
buffer.clear();
}
return data;
}
@Override
public <T> T deserialize(byte[] data, Class<T> clazz) {
Schema<T> schema = getSchema(clazz);
T obj = schema.newMessage();
ProtostuffIOUtil.mergeFrom(data, obj, schema);
return obj;
}
/**
* 保證schema單例
* @param clazz
* @param <T>
* @return
*/
private static <T> Schema<T> getSchema(Class<T> clazz) {
Schema<T> schema = (Schema<T>) schemaCache.get(clazz);
if (schema == null) {
//這個schema通過RuntimeSchema進行懶創建並緩存
//所以可以一直調用RuntimeSchema.getSchema(),這個方法是線程安全的
schema = RuntimeSchema.getSchema(clazz);
if (schema != null) {
schemaCache.put(clazz, schema);
}
}
return schema;
}
/*
<!-- https://mvnrepository.com/artifact/com.google.protobuf/protobuf-java -->
<dependency>
<groupId>com.google.protobuf</groupId>
<artifactId>protobuf-java</artifactId>
<version>3.11.4</version>
</dependency>
*/
}
5、序列化框架介紹
XML 序列化框架介紹
XML 序列化的好處在於可讀性好,方便閱讀和調試。但是序列化以後的字節碼文件比較大, 而且效率不高,適用於對性能不高,而且QPS較低的企業級內部系統之間的數據交換的場景, 同時XML又具有語言無關性,所以還可以用於異構系統之間的數據交換和協議。比如我們熟 知的Webservice,就是採用XML格式對數據進行序列化的。XML序列化/反序列化的實現方 式有很多,熟知的方式有XStream和Java自帶的XML序列化和反序列化兩種
JSON 序列化框架
JSON(JavaScript Object Notation)是一種輕量級的數據交換格式,相對於XML來說,JSON 的字節流更小,而且可讀性也非常好。現在JSON數據格式在企業運用是最普遍的 JSON序列化常用的開源工具有很多
- Jackson (https://github.com/FasterXML/jackson)
- 阿里開源的FastJson (https://github.com/alibaba/fastjon)
- Google的GSON (https://github.com/google/gson) 這幾種 json 序列化工具中,Jackson 與 fastjson 要比 GSON 的性能要好,但是 Jackson、 GSON的穩定性要比Fastjson好。而fastjson的優勢在於提供的api非常容易使用
Hessian 序列化框架
Hessian是一個支持跨語言傳輸的二進制序列化協議,相對於Java默認的序列化機制來說, Hessian具有更好的性能和易用性,而且支持多種不同的語言
實際上 Dubbo 採用的就是 Hessian 序列化來實現,只不過 Dubbo 對 Hessian 進行了重構, 性能更高
Avro 序列化
Avro是一個數據序列化系統,設計用於支持大批量數據交換的應用。它的主要特點有:支持 二進制序列化方式,可以便捷,快速地處理大量數據;動態語言友好,Avro提供的機制使動 態語言可以方便地處理Avro數據。
kyro 序列化框架
Kryo是一種非常成熟的序列化實現,已經在Hive、Storm)中使用得比較廣泛,不過它不能 跨語言. 目前 dubbo 已經在 2.6 版本支持 kyro 的序列化機制。它的性能要優於之前的 hessian2
Protobuf 序列化框架
Protobuf是Google的一種數據交換格式,它獨立於語言、獨立於平臺。Google提供了多種 語言來實現,比如Java、C、Go、Python,每一種實現都包含了相應語言的編譯器和庫文件, Protobuf是一個純粹的表示層協議,可以和各種傳輸層協議一起使用。 Protobuf使用比較廣泛,主要是空間開銷小和性能比較好,非常適合用於公司內部對性能要 求高的 RPC 調用。 另外由於解析性能比較高,序列化以後數據量相對較少,所以也可以應 用在對象的持久化場景中 但是要使用Protobuf會相對來說麻煩些,因爲他有自己的語法,有自己的編譯器,如果需要 用到的話必須要去投入成本在這個技術的學習中
protobuf有個缺點就是要傳輸的每一個類的結構都要生成對應的proto文件,如果某個類發 生修改,還得重新生成該類對應的proto文件
https://github.com/eishay/jvm-serializers/wiki
除了以上,再看看如下的知識是否理解了?
1、什麼是序列化,Java是如何實現序列化的
- 針對對象的狀態進行保存,至於對象的方法,序列化不關心
2、如果一個子類實現了序列化,父類沒有實現,那麼父類中的成員變量能否被序列化?
3、你有了解過哪些序列化技術?以及他們之間的差異性?
4、transient是幹嘛的?
5、有什麼方法能夠繞過transient的機制。這個實現機制的原理是什麼?
6、serializable的安全性如何保證?7.有沒有了解過protobuf,它的序列化實現原理是什麼?
7、serialVersionUID的 作 用 是 什 麼 ? 如 果 我 不 設 置serialVersionUID,有沒有問題?