通過文件頭標識判斷圖片格式

最近在做東西的時候遇到了點問題,在加載圖片的時候,加載失敗,後綴都是jpg格式,但換個圖片就可以了,爲此,懷疑圖片格式有問題,遂拖到UE裏面查看它的16進制,果然,兩個圖片的文件頭根本就不一樣,這不是欺負人嘛,害我白白浪費了半天的時間,差點要重新編譯內核。

然後到網上找了一些資料,查看不同格式圖片的文件頭是怎樣的。下面轉帖是不同圖片的文件頭標誌:

 

 

圖片的格式很多,一個圖片文件的後綴名並不能說明這個圖片的真正格式什麼,那麼如何獲取圖片的格式呢?我想到了幾個簡單但有效的方法,那就是讀取圖片文件的文件頭標識。我們知道各種格式的圖片的文件頭標識識不同的,因此我們可以通過判斷文件頭的標識來識別圖片格式。
     我對各種格式的圖片文件頭標識進行了分析,不僅查找資料,也用十六進制編輯器察看過圖片的文件頭,以下是我收集、分析的結果,供大家參考。

1.JPEG/JPG
- 文件頭標識 (2 bytes): $ff, $d8 (SOI) (JPEG 文件標識)
- 文件結束標識 (2 bytes): $ff, $d9 (EOI)

2.TGA
- 未壓縮的前5字節   00 00 02 00 00
- RLE壓縮的前5字節   00 00 10 00 00

3.PNG
- 文件頭標識 (8 bytes)   89 50 4E 47 0D 0A 1A 0A

4.GIF
- 文件頭標識 (6 bytes)   47 49 46 38 39(37) 61
                        G  I  F  8  9 (7)  a

5.BMP
- 文件頭標識 (2 bytes)   42 4D
                        B   M

6.PCX
- 文件頭標識 (1 bytes)   0A

7.TIFF
- 文件頭標識 (2 bytes)   4D 4D 或 49 49

8.ICO
- 文件頭標識 (8 bytes)   00 00 01 00 01 00 20 20

9.CUR
- 文件頭標識 (8 bytes)   00 00 02 00 01 00 20 20

10.IFF
- 文件頭標識 (4 bytes)   46 4F 52 4D
                        F  O  R  M

11.ANI
- 文件頭標識 (4 bytes)   52 49 46 46
                        R  I  F  F

     根據這些文件頭標識的收集,我可以寫一個識別圖像格式的模塊了。但是在寫這個模塊之前可以對收集到的文件頭標識進行優化,使得程序中字符串比對次數儘量的少。
1.JPEG我們知需要比對文件頭的$ff, $d8這兩個字符,而不用讀取最後的兩個結束標識了。
2.TGA,ICO,CUR只需比對第三個與第五個字符即可。
3.PNG比對[89][50]這兩個字符。
4.GIF比對[47][49][46]與第五個字符。

廢話不多說了,利用內存流來判斷文件的格式,其實判斷文件的前幾個字節就可以簡單的判斷這個文件是什麼類型的文件,例如

jpg文件 是 FFD8 (從低位到高位就要反過來 D8FF 下面都是一樣)

BMP文件 是 424D ---4D42

其他的我就不一一列舉了,想知道跟多文件類型分別是用什麼字符作爲文件的開頭的話,下載個C32asm或者UE等這類16進制編輯器就可以看到了。

發佈了9 篇原創文章 · 獲贊 3 · 訪問量 4萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章