二进制文件与文本文件区别与联系?

任何文件的存储在物理上是二进制的,所以文本文件与二进制文件的区别并不是物理上的,而是逻辑上的。这两者只是在编码层次上有差异。

简单来说,文本文件是基于字符编码的文件,常见的编码有 ASCII、UNICODE、UTF-8 编码。二进制文件是基于值编码的文件,你可以根据具体应用,指定某个值是什么意思(这样一个过程,可以看作是自定义编码)。

从上面可以看出文本文件基本上是定长编码的,每个字符的编码长度是固定的,ASCII 码是 8 个比特的编码,UNICODE 占 16 个比特。而二进制文件可看成是变长编码的,多少个比特代表一个值,完全由你决定。就 BMP 文件而言,其头部是固定长度的文件头信息,前 2 字节用来记录文件为 BMP 格式,接下来的 8 个字节用来记录文件长度,再接下来的 4 个字节用来记录 BMP 文件头的长度。可以看出,其编码是基于值的(不定长的,2、4、8 字节长的值都有),所以 BMP 是二进制文件。

总结:基于字符编码的文件我们称之为文本文件,基于值编码的文件我们称之为二进制文件。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章