漫画:什么是base64编码

 

 

 

 

Base64和ASCII的区别

ASCII码的范围是0-127,其中0-31和127这33个字符属于控制字符,剩下的32-126这95个字符属于可打印字符,包含了数字、大小写字母和常用符号等。他们与十进制的对应关系如下:

 

这里面的某些字节在某些传输渠道中不支持, 比如邮件传输SMTP协议就不支持上面ASCII码中的控制字符, 只能传输可打印的ASCII字符。另外当byte值>127时,就超出了ASCII的表示范围,Base64的创建就是为了解决此问题。

base64是一种编码算法,Base64内的64是指64个字符【可打印字符】, 分别是 A-Z, a-z, 0-9, +, /它们与十进制的对应关系如下:

 

Base64采用6bit字符表达了原本的8bit字符,它可以将原本ACSII码的控制字符以及ASCII码之外的byte数字都转换成可打印的64位字符。

 

Base64编码原理

  • 1)将所有字符转化为ASCII码;
  • 2)将ASCII码转化为8位二进制;
  • 3)将二进制3个归成一组(不足3个在后边补0)共24位,再拆分成4组,每组6位;
  • 4)统一在6位二进制前补两个0凑足8位;
  • 5)将补0后的二进制转为十进制;
  • 6)从Base64编码表获取十进制对应的Base64编码;例如编码Man:

 

字节数不为3的倍数时的处理过程

如果要编码的字节数不能被3整除,最后会多出1个或2个字节,那么可以使用下面的方法进行处理:先使用0字节值在末尾补足,使其能够被3整除,然后再进行base64的编码。在编码后的base64文本后加上一个或两个'='号,代表补足的字节数。也就是说,当最后剩余一个八位字节(一个byte)时,最后一个6位的base64字节块有四位是0值,最后附加上两个等号;如果最后剩余两个八位字节(2个byte)时,最后一个6位的base字节块有两位是0值,最后附加一个等号。 参考下表:

 

'A'base64编码结果:'QQ =='

'BC'base64编码结果:QKM=

 

 

 

 

喜欢的关注我吧!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章