Avro JSON 序列化

原創

2020-02-22 22:36

摘要

Schema究竟是什麼，Avro和JSON的關係，Avro的序列化與反序列化，對象容器文件。

Schema究竟是什麼？

從Apache Avro簡介中並不能確切的理解schema究竟是什麼。通過閱讀官方文檔，總結如下：

schema是一種metadata（元數據，是用於描述數據的數據），用於描述avro數據；

schema通過JSON定義，下面是一個record類型的schema：

{
    "type": "record",
    "name": "test",
    "fields" : [
        {"name": "a", "type": "long"},
        {"name": "b", "type": "string"}
    ]
}

解析avro數據（來自對象容器文件或序列化數據）時，必須根據數據的schema進行分析；

通常，schema和其描述的數據一起存放，例如：在avro支持的對象容器文件(Object Container File)中就在頭部包含了文件中存儲的數據的schema；在RPC應用中，通信雙方也必須確保擁有對方所發送數據的schema。

Avro與JSON的類型映射

Avro數據的序列化和反序列化

Avro指定兩種序列化方法：

二進制：更小、更快，用於大部分應用中；
JSON：易讀，常用於調試和基於web的應用中；

序列化原則：深度優先、從左到右。

序列化之後的數據，可以通過反序列化而得到原數據(首先獲取schema是必須的)。

對象容器文件(Object Container File)

對象容器文件是avro定義的一種文件格式。包含如下內容：

Four bytes, ASCII 'O', 'b', 'j', followed by 1.
file metadata, including the schema.
The 16-byte, randomly-generated sync marker for this file.
one or more file data blocks.

注意：

文件中存儲的所有數據必須對應於頭部的schema(avro.schema)；
所有數據必須採用二進制序列化；
存儲的數據可以壓縮(deflate)，也可以不壓縮(null)；

JSON與Avro可以互轉嗎？

可以！參考序列化和反序列化。

相關鏈接

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Java 自動識別文本文件字符編碼工具類

Java 自動識別文本文件字符編碼工具類測試用例2/** * @author Mr.superbeyone * @project cs-sys

2020-07-06 14:34:03

回望2015年看過的書，2016需要看的經典書

回望2015年看過的書，2016需要看的經典書 2015年，對我來說，是特別重要的一年，很多很多的事在這一年中發生了，連我自己也沒有想到，額，偏題了，那我今天就來扒扒2015年到底看了哪些書籍，與2016需要看的書籍。 201

2020-06-30 08:10:45

用於Firefox的Google工具欄Beta 2發佈

　　Google 一貫的目標的是成爲最好的搜索引擎，爲滿足用戶的需求可謂是不遺餘力，Google Toolbar的推出便是其方便用戶信息搜索的舉措之一。下載安裝Toolbar後，它會與IE瀏覽器工具欄緊密集成，用戶可以直接在工具條中輸入關

2020-06-26 09:15:50

在VS後臺接收GridView中綁定的數據

將一個數據庫表中的數據取出並通過gridview顯示出來，然後將某一列的數據插入到另一張數據庫表中（此例的兩個數據庫分別爲exam,test_table） //數據庫連接字符串 public static string SQLC

2020-06-25 22:20:31

數據庫操作類SQLHelper

有關C#連接SQL server 的一些數據庫操作函數數據庫操作類SQLHelper: using System; using System.Data; using System.Configuration; using System

2020-06-25 22:20:21

除了上帝就是我我是穆里尼奧

"我不是從瓶子裏蹦出來的，不過我是一個特殊的人。"這是穆里尼奧的一句名言，他確實有些特殊。　　忍耐　　穆里尼奧的父親是葡萄牙前著名門將弗萊克斯-穆里尼奧，老穆期待着兒子能夠遺傳自己的足球天賦，但情況和他的想象

2020-06-25 04:51:21

ELK不能查詢日誌報錯：index read-only

1.Kibana不能進行日誌查詢，其表現爲不能查當前日誌，但可以查到前幾天的日誌； 2.kibana能查看以前的日誌，說明kibana和elasticsearch應該運行正常。可能是filebeat或者logstash出了問題，無法將日誌

凭果子认树

2020-06-24 14:51:24

burpsuite得證書導到手機上安裝後依然無法訪問網絡原因

burpsuite導入CA證書並安裝到手機上，網上教程一大片，不再贅述。留下安裝後依然無法訪問網絡原因：burpsuite 默認用得127.0.0.1：8080，並不會認本地局域網ip得地址進行轉發。而手機上配置得是電腦上得局域網

百物易用是苏生

2020-06-24 13:24:50

python requests模塊給發送參data默認就會urllib.parse.quote_plus進行編碼，無需自己手動處理

爬取網站數據時，用到了國外的手機號登錄。自以爲是的，對+1xxx形式的參數進行了urllib.parse.quote_plus，然後總是不成功，最後使用burpsuite抓包比對。發現多了個%25 一查，知道了是對%進行了urlenc

百物易用是苏生

2020-06-24 13:24:50

多平臺寫作，空閒時同步！

一隻奇怪的碼農等待你的發現主戰場公衆號:百物易用是蘇生副戰場微博: 百物易用是蘇生O https://weibo.com/u/2532819964 短視頻抖音：百物易用是蘇生技術博客 csdn: 百物易用是蘇生 https://

百物易用是苏生

2020-06-24 13:24:39

Captive Portal - 連接WiFi自動彈出認證頁面

摘要解釋Captive Portal是什麼、爲什麼連上WiFi後會自動彈出認證頁面。同時，說明主流操作系統的支持情況。 Captive Portal 中文通常譯作“強制主頁”或“強制登錄門戶”。是一個登錄Web頁面，通常由網絡運

2020-06-20 20:03:03

虛擬主機 VPS 雲服務器的區別

一直困惑虛擬主機、VPS、雲服務器（雲主機）這幾個概念，下面是蒐集的資料，作爲參考。 Plan A 服務器是真實存在的物理設備。無論是性能還是安全方面都是最強大的。 VPS是虛擬服務器的意思，它的功能與服務器一模一樣。但不同的是它是虛擬

2020-06-20 19:05:13

關於ABI OABI EABI

什麼是EABI Embedded application binary interface, 即嵌入式應用二進制接口，是描述可連接目標代碼，庫目標代碼，可執行文件影像，如何連接，執行和調試，以及目標代碼生成過程，和c, c++語言接口

2020-06-20 19:05:02

BinaryToys - 詭異的桌面電子生物

站長曾經寫過一篇關於桌面電子寵物的文章，共享了自己收集的16款桌面電子寵物，這些小寵物都非常有趣，網友們也非常喜歡。今天，站長推薦的是一款類似的玩物

2020-06-20 05:31:11

直接將知識下載到大腦將成爲可能

教育專家預測，電影《黑客帝國》（The Matrix）描述的下載知識到大腦裏直接學習的情節30年內將會實現。英國獨立學校委員會（Independent Schools Council, ISC）首席執行官克里斯&#183；帕裏（Chris

2020-06-20 05:31:11

24小時熱門文章

最新文章

最新評論文章