字符编码
Python主要识别文件内容,而不是关心拓展名—>解释器 例:cmd中输入 python xxx.txt也能运行 显示文本内容
字符—>(机器翻译)—>二进制
字符如何对应特定数字的标准,这个标准就是字符编码。
ASCII
GBK
Unicode
UTF-8(Unicode Transforma Format)
- 对于英文字符来说,1bytes
- 中文字符,3bytes
- 对于其他偏僻字符,更多的bytes存储
>>
>
b
=
bytes
(
'城市学院'
,
encoding
=
'utf-8'
)
>>
>
b
b
'\xe5\x9f\x8e\xe5\xb8\x82\xe5\xad\xa6\xe9\x99\xa2'
>>
>
b1
=
'城市学院'
.
encode
(
'utf-8'
)
>>
>
b1
b
'\xe5\x9f\x8e\xe5\xb8\x82\xe5\xad\xa6\xe9\x99\xa2'
>>
>
b
.
decode
(
'utf-8'
)
'城市学院'
>>
>
b
.
decode
(
'gbk'
)
'鍩庡競瀛﹂櫌'
>>
>
b1
.
decode
(
'utf-8'
)
'城市学院'
>>
>
b1
.
decode
(
'gbk'
)
'鍩庡競瀛﹂櫌'
>>
>