Base64原理廖雪峰.docx
- 文档编号:6216802
- 上传时间:2023-01-04
- 格式:DOCX
- 页数:18
- 大小:122.06KB
Base64原理廖雪峰.docx
《Base64原理廖雪峰.docx》由会员分享,可在线阅读,更多相关《Base64原理廖雪峰.docx(18页珍藏版)》请在冰豆网上搜索。
Base64原理廖雪峰
base64
阅读:
87704
Base64是一种用64个字符来表示任意二进制数据的方法。
用记事本打开exe、jpg、pdf这些文件时,我们都会看到一大堆乱码,因为二进制文件包含很多无法显示和打印的字符,所以,如果要让记事本这样的文本处理软件能处理二进制数据,就需要一个二进制到字符串的转换方法。
Base64是一种最常见的二进制编码方法。
Base64的原理很简单,首先,准备一个包含64个字符的数组:
['A','B','C',...'a','b','c',...'0','1',...'+','/']
然后,对二进制数据进行处理,每3个字节一组,一共是3x8=24bit,划为4组,每组正好6个bit:
这样我们得到4个数字作为索引,然后查表,获得相应的4个字符,就是编码后的字符串。
所以,Base64编码会把3字节的二进制数据编码为4字节的文本数据,长度增加33%,好处是编码后的文本数据可以在邮件正文、网页等直接显示。
如果要编码的二进制数据不是3的倍数,最后会剩下1个或2个字节怎么办?
Base64用\x00字节在末尾补足后,再在编码的末尾加上1个或2个=号,表示补了多少字节,解码的时候,会自动去掉。
Python内置的base64可以直接进行base64的编解码:
>>>importbase64
>>>base64.b64encode('binary\x00string')
'YmluYXJ5AHN0cmluZw=='
>>>base64.b64decode('YmluYXJ5AHN0cmluZw==')
'binary\x00string'
由于标准的Base64编码后可能出现字符+和/,在URL中就不能直接作为参数,所以又有一种"urlsafe"的base64编码,其实就是把字符+和/分别变成-和_:
>>>base64.b64encode('i\xb7\x1d\xfb\xef\xff')
'abcd++//'
>>>base64.urlsafe_b64encode('i\xb7\x1d\xfb\xef\xff')
'abcd--__'
>>>base64.urlsafe_b64decode('abcd--__')
'i\xb7\x1d\xfb\xef\xff'
还可以自己定义64个字符的排列顺序,这样就可以自定义Base64编码,不过,通常情况下完全没有必要。
Base64是一种通过查表的编码方法,不能用于加密,即使使用自定义的编码表也不行。
Base64适用于小段内容的编码,比如数字证书签名、Cookie的内容等。
由于=字符也可能出现在Base64编码中,但=用在URL、Cookie里面会造成歧义,所以,很多Base64编码后会把=去掉:
#标准Base64:
'abcd'->'YWJjZA=='
#自动去掉=:
'abcd'->'YWJjZA'
去掉=后怎么解码呢?
因为Base64是把3个字节变为4个字节,所以,Base64编码的长度永远是4的倍数,因此,需要加上=把Base64字符串的长度变为4的倍数,就可以正常解码了。
请写一个能处理去掉=的base64解码函数:
>>>base64.b64decode('YWJjZA==')
'abcd'
>>>base64.b64decode('YWJjZA')
Traceback(mostrecentcalllast):
...
TypeError:
Incorrectpadding
>>>safe_b64decode('YWJjZA')
'abcd'
小结
Base64是一种任意二进制到文本字符串的编码方法,常用于在URL、Cookie、网页中传输少量二进制数据。
Base64算法及C++实现
标签:
算法c++bufferclassencodingoutput
2012-06-0711:
50 5907人阅读 评论(0) 收藏 举报
分类:
Algorithm(22)
版权声明:
本文为博主原创文章,未经博主允许不得转载。
Base64用途
1.用于对SOHO级路由器(网关设备)管理员帐户密码的加密
2.流媒体网站对于播放的流媒体文件的路径的加密
3.迅雷等下载软件对下载链接地址的加密
Base64算法
Base64编码要求把3个8位字节(3*8=24)转化为4个6位的字节(4*6=24),之后在6位的前面补两个0,形成8位一个字节的形式。
Base64类
函数:
unsignedintCreateMatchingEncodingBuffer (unsignedintp_InputByteCount,char**p_ppEncodingBuffer);
创建匹配于编码的缓存空间。
参数:
1输入字节数,2进行编码需要的缓存空间;返回值:
缓存空间大小。
unsignedintCreateMatchingDecodingBuffer (char*p_pInputBufferString,char**p_ppDecodingBuffer);
创建匹配于解码的缓存空间。
参数:
1解码对象缓存,2进行解码需要的缓存空间;返回值:
缓存空间大小。
voidEncodeBuffer (char*p_pInputBuffer,unsignedintp_InputBufferLength,char*p_pOutputBufferString);
进行编码。
参数:
1明文,2明文长度,3密文输出。
unsignedint DecodeBuffer (char*p_pInputBufferString,char*p_pOutputBuffer);
进行解码。
参数:
1密文,2明文;返回值:
明文长度
C++实现:
[cpp] viewplain copy
1./************************************************
2.* *
3.* CBase64.h *
4.* Base 64 de- and encoding class *
5.* *
6.* ============================================ *
7.* *
8.* This class was written on 28.05.2003 *
9.* by Jan Raddatz [jan-raddatz@web.de] *
10.* *
11.* ============================================ *
12.* *
13.* Copyright (c) by Jan Raddatz *
14.* This class was published @ *
15.* 28.05.2003 *
16.* *
17.************************************************/
18.
19.#pragma once
20.
21.#include
22.#include
23.#include
24.#include
25.const static unsigned int MAX_LINE_LENGTH = 76;
26.
27.const static char BASE64_ALPHABET [64] =
28.{
29. 'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', // 0 - 9
30. 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', // 10 - 19
31. 'U', 'V', 'W', 'X', 'Y', 'Z', 'a', 'b', 'c', 'd', // 20 - 29
32. 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', // 30 - 39
33. 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', // 40 - 49
34. 'y', 'z', '0', '1', '2', '3', '4', '5', '6', '7', // 50 - 59
35. '8', '9', '+', '/' // 60 - 63
36.};
37.
38.const static char BASE64_DEALPHABET [128] =
39.{
40. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 0 - 9
41. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 10 - 19
42. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 20 - 29
43. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 30 - 39
44. 0, 0, 0, 62, 0, 0, 0, 63, 52, 53, // 40 - 49
45. 54, 55, 56, 57, 58, 59, 60, 61, 0, 0, // 50 - 59
46. 0, 61, 0, 0, 0, 0, 1, 2, 3, 4, // 60 - 69
47. 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, // 70 - 79
48. 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, // 80 - 89
49. 25, 0, 0, 0, 0, 0, 0, 26, 27, 28, // 90 - 99
50. 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, // 100 - 109
51. 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, // 110 - 119
52. 49, 50, 51, 0, 0, 0, 0, 0 // 120 - 127
53.};
54.
55.enum
56.{
57. UNABLE_TO_OPEN_INPUT_FILE,
58. UNABLE_TO_OPEN_OUTPUT_FILE,
59. UNABLE_TO_CREATE_OUTPUTBUFFER
60.};
61.
62.class CBase64
63.{
64.public:
65. CBase64 ();
66.
67. unsigned int CalculateRecquiredEncodeOutputBufferSize (unsigned int p_InputByteCount);
68. unsigned int CalculateRecquiredDecodeOutputBufferSize (char* p_pInputBufferString);
69.
70. void EncodeByteTriple (char* p_pInputBuffer, unsigned int InputCharacters, char* p_pOutputBuffer);
71. unsigned int DecodeByteQuartet (char* p_pInputBuffer, char* p_pOutputBuffer);
72.
73. void EncodeBuffer (char* p_pInputBuffer, unsigned int p_InputBufferLength, char*p_pOutputBufferString);
74. unsigned int DecodeBuffer (char* p_pInputBufferString, char* p_pOutputBuffer);
75.
76. unsigned int CreateMatchingEncodingBuffer (unsigned int p_InputByteCount, char** p_ppEncodingBuffer);
77. unsigned int CreateMatchingDecodingBuffer (char* p_pInputBufferString, char** p_ppDecodingBuffer);
78.
79. unsigned int EncodeFile (char* p_pSourceFileName, char* p_pEncodedFileName);
80. unsigned int DecodeFile (char* p_pSourceFileName, char* p_pDecodedFileName);
81.};
[cpp] viewplain copy
1./************************************************
2.* *
3.* CBase64.cpp *
4.* Base 64 de- and encoding class *
5.* *
6.* ============================================ *
7.* *
8.* This class was written on 28.05.2003 *
9.* by Jan Raddatz [jan-raddatz@web.de] *
10.* *
11.* ============================================ *
12.* *
13.* Copyright (c) by Jan Raddatz *
14.* This class was published @ *
15.* 28.05.2003 *
16.* *
17.************************************************/
18.#include "stdafx.h"
19.#include "CBase64.h"
20.
21.
22.CBase64:
:
CBase64 ()
23.{
24.}
25.
26.unsigned int CBase64:
:
CalculateRecquiredEncodeOutputBufferSize (unsigned int p_InputByteCount)
27.{
28. div_t result = div (p_InputByteCount, 3);
29.
30. unsigned int RecquiredBytes = 0;
31. if (result.rem == 0)
32. {
33. // Number of encoded characters
34. RecquiredBytes = result.quot * 4;
35.
36. // CRLF -> "\r\n" each 76 characters
37. result = div (RecquiredBytes, 76);
38. RecquiredBytes += result.quot * 2;
39.
40. // Terminating null for the Encoded String
41. RecquiredBytes += 1;
42.
43. return RecquiredBytes;
44. }
45. else
46. {
47. // Number of encoded characters
48. RecquiredBytes = result.quot * 4 + 4;
49.
50. // CRLF -> "\r\n" each 76 characters
51. result = div (RecquiredBytes, 76);
52. RecquiredBytes += result.quot * 2;
53.
54. // Terminating null for the Encoded String
55. RecquiredBytes += 1;
56.
57. return RecquiredBytes;
58. }
59.}
60.
61.unsigned int CBase64:
:
CalculateRecquiredDecodeOutputBufferSize (char* p_pInputBufferString)
62.{
63. unsigned int BufferLength = strlen (p_pInputBufferString);
64.
65. div_t result = div (BufferLength, 4);
66.
67. if (p_pInputBufferString [BufferLength - 1] !
= '=')
68. {
69. return result.quot * 3;
70. }
71. else
72. {
73. if (p_pInputBufferString [BufferLength - 2] == '=')
74. {
75. return result.quot * 3 - 2;
76. }
77. else
78. {
79. return result.quot * 3 - 1;
80. }
81. }
82.}
83.
84.void CBase64:
:
EncodeByteTriple (char* p_pInputBuffer, unsigned int InputCharacters, char* p_pOutputBuffer)
85.{
86. unsigned int mask = 0xfc000000;
87. unsigned int buffer = 0;
88.
89.
90. char* temp = (char*) &buffer;
91. temp [3] = p_pInputBuffer [0];
92. if (InputCharacters > 1)
93. temp [2] = p_pInputBuffer [1];
94. if (InputCharacters > 2)
95. temp [1] = p_pInputBuffer [2];
96.
97. switch (InputCharacters)
98. {
99. case 3:
100. {
101. p_pOutputBuffer [0] = BASE64_ALPHABET [(buffer & mask) >> 26];
102. buffer = buffer << 6;
103. p_pOutputBuffer [1] = BASE64_ALPHABET [(buffer & mask) >> 26];
104. buffer = buffer << 6;
105. p_pOutputBuffer [2] = BASE64_ALPHABET [(buffer & mask) >> 26];
106. buffer = buffer << 6;
107. p_pOutputBuffer [3] = BASE64_ALPHABET [(buffer & mask) >> 26];
108. break;
109. }
110. case 2:
111
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Base64 原理 雪峰