【Note】文件壓縮


BY《程序是怎樣跑起來的》

1. 文件及其保存

(1)何爲文件?
文件是字節數據的集合。
(2)文件如何保存?
以字節爲單位存儲。

從物理上對磁盤進行讀寫時以扇區(512字節)爲單位。
另一方面,程序在邏輯上以字節爲單位對文件內容進行讀寫。

2. RLE算法

(1)Run Length Encoding,行程長度編碼算法,把文件內容用“數據*重複次數”的形式表示的壓縮方法。常被用於壓縮傳真的圖像。
(2)缺點:不適合非相同數據經常連續出現的圖像、文件。
(3)優點:壓縮機制簡單,程序易編寫。

3. 哈夫曼算法

(1)以莫爾斯(Samuel F.B. Morse)編碼爲基礎
(2)哈夫曼算法:爲各壓縮對象文件分別構造最佳的編碼體系,並以該編碼體系爲基礎進行壓縮。
(3)優點:大幅提升壓縮比率

4. 圖像文件數據形式

Windows的標準圖像數據形式爲BMP,我完全未壓縮的,是使用Windows自帶的畫筆來做成的一種圖像數據形式。由於顯示器、打印機輸出的bit(點)是可直接映射的,故便有了BMP=bitmap這一名稱。

壓縮過的:
JPEG(Joint Photographic Experts Group)是數碼相機等常用的一種圖像數據形式。
TIFF(Tag Image File Format)是一種通過在文件頭中包含“標籤”就能夠顯示出數據性質的圖像數據形式。
GIF(Graphics Interchange Format)是由美國CompuServe開發的一種數據格式,該格式要求色數不超過256色。

(1)可逆壓縮:能還原到壓縮前狀態的壓縮。
(2)非可逆壓縮:無法還原到壓縮前狀態的壓縮。
注意:文本文件不能進行非可逆壓縮,會損失信息量。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章