Python 数据类型--str&bytes - 军军小站|张军博客

一、字符串(str)

1.1 字符串的定义

字符串就是一串字符，是编程语言中表示文本的数据类型
在 Python 中可以使用一对双引号 " 或者一对单引号 ' 定义一个字符串
可以使用索引获取一个字符串中指定位置的字符，索引计数从 0 开始
也可以使用 for 循环遍历字符串中每一个字符

            
               1
            
            
              #
            
            
              !/usr/bin/env python3
            
            
               2
            
            
              #
            
            
               -*-coding:utf-8-*-
            
            
               3
            
            
               4
            
            
              """
            
            
               5
            
            
              @author:fyh

            
            
               6
            
            
              @time:2019/5/31

            
            
               7
            
            
              """
            
            
               8
            
            
               9
            
             str1 = 
            
              "
            
            
              hello python
            
            
              "
            
            
              10
            
            
              11
            
            
              for
            
             c 
            
              in
            
            
               str1:

            
            
              12
            
            
              print
            
            (c, end=
            
              '
            
            
              \t
            
            
              '
            
            
              )

            
            
              13
            
            
              14
            
            
              #
            
            
               运行结果：h    e    l    l    o         p    y    t    h    o    n

1.2 字符串的常用操作

            
               1
            
            
              #
            
            
              !/usr/bin/env python3
            
            
               2
            
            
              #
            
            
               -*-coding:utf-8-*-
            
            
               3
            
            
               4
            
            
              """
            
            
               5
            
            
              @author:fyh

            
            
               6
            
            
              @time:2019/5/31

            
            
               7
            
            
              """
            
            
               8
            
            
               9
            
            
              #
            
            
               1   * 重复输出字符串
            
            
              10
            
            
              print
            
            (
            
              '
            
            
              hello
            
            
              '
            
             * 2
            
              )

            
            
              11
            
            
              12
            
            
              #
            
            
               2 [] ,[:] 通过索引获取字符串中字符
            
            
              13
            
            
              print
            
            (
            
              '
            
            
              helloworld
            
            
              '
            
            [2
            
              :])

            
            
              14
            
            
              15
            
            
              #
            
            
               3 in  成员运算符 - 如果字符串中包含给定的字符返回 True
            
            
              16
            
            
              print
            
            (
            
              '
            
            
              el
            
            
              '
            
            
              in
            
            
              '
            
            
              hello
            
            
              '
            
            
              )

            
            
              17
            
            
              18
            
            
              #
            
            
               4 %   格式字符串
            
            
              19
            
            
              print
            
            (
            
              '
            
            
              alex is a good teacher
            
            
              '
            
            
              )

            
            
              20
            
            
              print
            
            (
            
              '
            
            
              %s is a good teacher
            
            
              '
            
             % 
            
              '
            
            
              alex
            
            
              '
            
            
              )

            
            
              21
            
            
              22
            
            
              #
            
            
               5 +   字符串拼接
            
            
              23
            
             a = 
            
              '
            
            
              123
            
            
              '
            
            
              24
            
             b = 
            
              '
            
            
              abc
            
            
              '
            
            
              25
            
             c = 
            
              '
            
            
              789
            
            
              '
            
            
              26
            
             d1 = a + b +
            
               c

            
            
              27
            
            
              print
            
            (d1)  
            
              #
            
            
               +效率低,该用join
            
            
              28
            
            
              29
            
            
              #
            
            
               join效率高
            
            
              30
            
             d2 = 
            
              ''
            
            
              .join([a, b, c])

            
            
              31
            
            
              print
            
            (d2)

1.3 字符串相关的函数

              
                #
              
              
                 string.upper() 转换 string 中的小写字母为大写
              
              
                
#
              
              
                 string.lower() 转换 string 中所有大写字符为小写
              
              
                
#
              
              
                 string.startswith(obj, beg=0,end=len(string)) 检查字符串是否是以obj开头，是则返回True，否则返回 False。如果beg 和 end 指定值，则在指定范围内检查.
              
              
                
#
              
              
                 string.endswith(obj, beg=0, end=len(string)) 检查字符串是否以 obj 结束，如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束，如果是，返回 True,否则返回 False.
              
              
                
#
              
              
                 string.replace(str1, str2, num=string.count(str1)) 把 string 中的 str1 替换成 str2,如果 num 指定，则替换不超过 num 次.
              
              
                
#
              
              
                 string.strip([obj]) 在 string 上执行 lstrip()和 rstrip() 去除空格
              
              
                
#
              
              
                 string.split(str="", num=string.count(str)) 以 str 为分隔符切片 string，如果 num有指定值，则仅分隔 num 个子字符串
              
              
                
#
              
              
                 string.find(str, beg=0, end=len(string)) 检测 str 是否包含在 string 中，如果 beg 和 end 指定范围，则检查是否包含在指定范围内，如果是返回开始的索引值，否则返回-1
              
              
                
#
              
              
                 string.encode(encoding='UTF-8', errors='strict') 以 encoding 指定的编码格式编码 string，如果出错默认报一个ValueError 的异常，除非 errors 指定的是ignore或者replace
              
              
                
#
              
              
                 string.decode(encoding='UTF-8', errors='strict') 以 encoding 指定的编码格式解码 string，如果出错默认报一个ValueError的异常，除非errors指定的是'ignore'或 者'replace'
              
              
                
#
              
              
                 string.join(seq) 以 string 作为分隔符，将 seq 中所有的元素(的字符串表示)合并为一个新的字符串
              
              
                
#
              
              
                 string.format()  格式化输出

常用的函数

              
                #
              
              
                 string.capitalize() 把字符串的第一个字符大写
              
              
                
#
              
              
                 string.center(width) 返回一个原字符串居中,并使用空格填充至长度 width 的新字符串
              
              
                
#
              
              
                 string.count(str, beg=0, end=len(string)) 返回 str 在 string 里面出现的次数，如果 beg 或者 end 指定则返回指定范围内 str 出现的次数
              
              
                
#
              
              
                 string.expandtabs(tabsize=8) 把字符串 string 中的 tab 符号转为空格，tab 符号默认的空格数是8。
              
              
                
#
              
              
                 string.index(str, beg=0, end=len(string)) 跟find()方法一样，只不过如果str不在 string中会报一个异常.
              
              
                
#
              
              
                 string.isalnum() 如果 string 至少有一个字符并且所有字符都是字母或数字则返回 True,否则返回 False
              
              
                
#
              
              
                 string.isalpha() 如果 string 至少有一个字符并且所有字符都是字母则返回 True,否则返回 False
              
              
                
#
              
              
                 string.isdecimal() 如果 string 只包含十进制数字则返回 True 否则返回 False.
              
              
                
#
              
              
                 string.isdigit() 如果 string 只包含数字则返回 True 否则返回 False.
              
              
                
#
              
              
                 string.islower() 如果 string 中包含至少一个区分大小写的字符，并且所有这些(区分大小写的)字符都是小写，则返回 True，否则返回 False
              
              
                
#
              
              
                 string.isnumeric() 如果 string 中只包含数字字符，则返回 True，否则返回 False
              
              
                
#
              
              
                 string.isspace() 如果 string 中只包含空格，则返回 True，否则返回 False.
              
              
                
#
              
              
                 string.istitle() 如果 string 是标题化的(见 title())则返回 True，否则返回 False
              
              
                
#
              
              
                 string.isupper() 如果 string 中包含至少一个区分大小写的字符，并且所有这些(区分大小写的)字符都是大写，则返回 True，否则返回 False
              
              
                
#
              
              
                 string.ljust(width) 返回一个原字符串左对齐,并使用空格填充至长度 width 的新字符串
              
              
                
#
              
              
                 string.lstrip() 截掉 string 左边的空格
              
              
                
#
              
              
                 string.maketrans(intab, outtab]) maketrans() 方法用于创建字符映射的转换表，对于接受两个参数的最简单的调用方式，第一个参数是字符串，表示需要转换的字符，第二个参数也是字符串表示转换的目标。
              
              
                
#
              
              
                 max(str) 返回字符串 str 中最大的字母。
              
              
                
#
              
              
                 min(str) 返回字符串 str 中最小的字母。
              
              
                
#
              
              
                 string.partition(str) 有点像 find()和 split()的结合体,从 str 出现的第一个位置起,把 字 符 串 string 分 成 一 个 3 元 素 的 元 组 (string_pre_str,str,string_post_str),如果 string 中不包含str 则 string_pre_str == string.
              
              
                
#
              
              
                 string.rfind(str, beg=0,end=len(string) ) 类似于 find()函数，不过是从右边开始查找.
              
              
                
#
              
              
                 string.rindex( str, beg=0,end=len(string)) 类似于 index()，不过是从右边开始.
              
              
                
#
              
              
                 string.rjust(width) 返回一个原字符串右对齐,并使用空格填充至长度 width 的新字符串
              
              
                
#
              
              
                 string.rpartition(str) 类似于 partition()函数,不过是从右边开始查找.
              
              
                
#
              
              
                 string.rstrip() 删除 string 字符串末尾的空格.
              
              
                
#
              
              
                 string.splitlines(num=string.count('\n')) 按照行分隔，返回一个包含各行作为元素的列表，如果 num 指定则仅切片 num 个行.
              
              
                
#
              
              
                 string.swapcase() 翻转 string 中的大小写
              
              
                
#
              
              
                 string.title() 返回"标题化"的 string,就是说所有单词都是以大写开始，其余字母均为小写(见 istitle())
              
              
                
#
              
              
                 string.translate(str, del="") 根据 str 给出的表(包含 256 个字符)转换 string 的字符,要过滤掉的字符放到 del 参数中

其它的函数

            
               1
            
            
              #
            
            
              !/usr/bin/env python3
            
            
               2
            
            
              #
            
            
               -*-coding:utf-8-*-
            
            
               3
            
            
               4
            
            
              """
            
            
               5
            
            
              @author:fyh

            
            
               6
            
            
              @time:2019/5/31

            
            
               7
            
            
              """
            
            
               8
            
            
               9
            
             name = 
            
              "
            
            
              hello world
            
            
              "
            
            
              10
            
            
              #
            
            
               小写字母变为大写
            
            
              11
            
            
              print
            
            (name.upper())    
            
              #
            
            
               HELLO WORLD
            
            
              12
            
            
              print
            
            (name)            
            
              #
            
            
               hello world
            
            
              13
            
            
              14
            
            
              #
            
            
               把大写字母变小写
            
            
              15
            
             name2 = 
            
              "
            
            
              HELLO WORLD
            
            
              "
            
            
              16
            
            
              print
            
            (name2.lower())    
            
              #
            
            
               hello world
            
            
              17
            
            
              print
            
            (name2)            
            
              #
            
            
               HELLO WORLD
            
            
              18
            
            
              19
            
            
              #
            
            
               判断是否以。。。开头
            
            
              20
            
             name3 = 
            
              "
            
            
              hello
            
            
              "
            
            
              21
            
            
              print
            
            (name3.startswith(
            
              "
            
            
              he
            
            
              "
            
            ))   
            
              #
            
            
               True
            
            
              22
            
            
              #
            
            
               检查字符串是否以。。结尾
            
            
              23
            
            
              print
            
            (name3.endswith(
            
              "
            
            
              lo
            
            
              "
            
            ))     
            
              #
            
            
               True
            
            
              24
            
            
              25
            
            
              #
            
            
               replace   替换
            
            
              26
            
             name4 = 
            
              "
            
            
              python
            
            
              "
            
            
              27
            
            
              print
            
            (name4.replace(
            
              '
            
            
              th
            
            
              '
            
            , 
            
              '
            
            
              aa
            
            
              '
            
            ))    
            
              #
            
            
               pyaaon
            
            
              28
            
            
              29
            
            
              #
            
            
               去除空格
            
            
              30
            
             name5 = 
            
              "
            
            
                bbcc  
            
            
              "
            
            
              31
            
            
              print
            
            (name5.strip())    
            
              #
            
            
               bbcc
            
            
              32
            
            
              33
            
            
              #
            
            
               分割
            
            
              34
            
             str1 = 
            
              "
            
            
              aa|bb|cc|dd
            
            
              "
            
            
              35
            
            
              print
            
            (str1.split(
            
              '
            
            
              |
            
            
              '
            
            ))  
            
              #
            
            
               ['aa', 'bb', 'cc', 'dd']
            
            
              36
            
            
              37
            
            
              #
            
            
               查找  返回开始的索引值
            
            
              38
            
             str2 = 
            
              "
            
            
              we are family
            
            
              "
            
            
              39
            
            
              print
            
            (str2.find(
            
              "
            
            
              are
            
            
              "
            
            ))     
            
              #
            
            
               3
            
            
              40
            
            
              41
            
            
              #
            
            
               join  拼接
            
            
              42
            
             lst1 = [
            
              '
            
            
              aa
            
            
              '
            
            , 
            
              '
            
            
              bb
            
            
              '
            
            , 
            
              '
            
            
              cc
            
            
              '
            
            , 
            
              '
            
            
              dd
            
            
              '
            
            
              ]

            
            
              43
            
            
              print
            
            (
            
              "
            
            
              -
            
            
              "
            
            .join(lst1))       
            
              #
            
            
               aa-bb-cc-dd

1.4 字符串切片

切片使用索引值来限定范围，根据步长从原序列中取出一部分元素组成新序列
切片方法适用于字符串、列表、元组
切片的语法表达式为：[start_index : end_index : step]，其中：
- start_index：起始索引
- end_index：结束索引
- step：步长

切片操作是指按照步长，截取从起始索引到结束索引，但不包含结束索引（也就是结束索引减1）的所有元素。

切片不会改变原对象，而是重新生成了一个新的对象

            
               1
            
            
              #
            
            
              !/usr/bin/env python3
            
            
               2
            
            
              #
            
            
               -*-coding:utf-8-*-
            
            
               3
            
            
               4
            
            
              """
            
            
               5
            
            
              @author:fyh

            
            
               6
            
            
              @time:2019/5/31

            
            
               7
            
            
              """
            
            
               8
            
            
               9
            
             str1 = 
            
              "
            
            
              hello world
            
            
              "
            
            
              10
            
            
              11
            
            
              12
            
            
              print
            
            (str1[1:6
            
              ])

            
            
              13
            
            
              #
            
            
               结果是ello
            
            
              14
            
            
              15
            
            
              print
            
            (str1[1:6:2
            
              ])

            
            
              16
            
            
              #
            
            
               结果是el
            
            
              17
            
            
              18
            
            
              print
            
            (str1[2
            
              :])

            
            
              19
            
            
              #
            
            
               结果是llo world
            
            
              20
            
            
              #
            
            
               保留start_index，但省略end_index，这样会从起始索引开始，切到最后一个元素为止
            
            
              21
            
            
              22
            
            
              print
            
            (str1[:5
            
              ])

            
            
              23
            
            
              #
            
            
               结果是hello
            
            
              24
            
            
              #
            
            
               省略start_index，保留end_index，这样会从第一个元素开始，切到end_index - 1的元素为止
            
            
              25
            
            
              26
            
            
              print
            
            (str1[-1:-6:-1
            
              ])

            
            
              27
            
            
              #
            
            
               结果是dlrow
            
            
              28
            
            
              29
            
            
              print
            
            (str1[1:6:-1
            
              ])

            
            
              30
            
            
              #
            
            
               结果为空
            
            
              31
            
            
              #
            
            
               切片时,一定要保证start_index到end_index的方向与步长step的方向同向，否则会切出空的序列

1.5 字符串拼接

Python的字符串格式化有三种方式: 百分号方式、format方式、f-strings方式

1.5.1 百分号方式

格式：%[(name)][flags][width].[precision]typecode

(name) 可选，用于选择指定的key
flags 可选，可供选择的值有:

+ 右对齐；正数前加正好，负数前加负号；
- 左对齐；正数前无符号，负数前加负号；
空格右对齐；正数前加空格，负数前加负号；
0 右对齐；正数前无符号，负数前加负号；用0填充空白处

width 可选，占有宽度
precision 可选，小数点后保留的位数
typecode 必选

s，获取传入对象的__str__方法的返回值，并将其格式化到指定位置
r，获取传入对象的__repr__方法的返回值，并将其格式化到指定位置
c，整数：将数字转换成其unicode对应的值，10进制范围为 0 <= i <= 1114111（py27则只支持0-255）；字符：将字符添加到指定位置
o，将整数转换成八进制表示，并将其格式化到指定位置
x，将整数转换成十六进制表示，并将其格式化到指定位置
d，将整数、浮点数转换成十进制表示，并将其格式化到指定位置
e，将整数、浮点数转换成科学计数法，并将其格式化到指定位置（小写e）
E，将整数、浮点数转换成科学计数法，并将其格式化到指定位置（大写E）
f，将整数、浮点数转换成浮点数表示，并将其格式化到指定位置（默认保留小数点后6位）
F，同上
g，自动调整将整数、浮点数转换成浮点型或科学计数法表示（超过6位数用科学计数法），并将其格式化到指定位置（如果是科学计数则是e；）
G，自动调整将整数、浮点数转换成浮点型或科学计数法表示（超过6位数用科学计数法），并将其格式化到指定位置（如果是科学计数则是E；）
%，当字符串中存在格式化标志时，需要用 %%表示一个百分号

注：Python中百分号格式化是不存在自动将整数转换成二进制表示的方式

常用的格式化：

            
               1
            
             tpl = 
            
              "
            
            
              i am %s
            
            
              "
            
             % 
            
              "
            
            
              alex
            
            
              "
            
            
               2
            
            
               3
            
             tpl = 
            
              "
            
            
              i am %s age %d
            
            
              "
            
             % (
            
              "
            
            
              alex
            
            
              "
            
            , 18
            
              )

            
            
               4
            
            
               5
            
             tpl = 
            
              "
            
            
              i am %(name)s age %(age)d
            
            
              "
            
             % {
            
              "
            
            
              name
            
            
              "
            
            : 
            
              "
            
            
              alex
            
            
              "
            
            , 
            
              "
            
            
              age
            
            
              "
            
            : 18
            
              }

            
            
               6
            
            
               7
            
             tpl = 
            
              "
            
            
              percent %.2f
            
            
              "
            
             % 99.97623

            
               8
            
            
               9
            
             tpl = 
            
              "
            
            
              i am %(pp).2f
            
            
              "
            
             % {
            
              "
            
            
              pp
            
            
              "
            
            : 123.425556
            
              , }

            
            
              10
            
            
              11
            
             tpl = 
            
              "
            
            
              i am %.2f %%
            
            
              "
            
             % 123.425556

1.5.2 format方式

格式：[[fill]align][sign][#][0][width][,][.precision][type]

fill 【可选】空白处填充的字符
align 【可选】对齐方式（需配合width使用）

<，内容左对齐
>，内容右对齐(默认)
＝，内容右对齐，将符号放置在填充字符的左侧，且只对数字类型有效。即使：符号+填充物+数字
^，内容居中

sign 【可选】有无符号数字

+，正号加正，负号加负；
-，正号不变，负号加负；
空格，正号空格，负号加负；

# 【可选】对于二进制、八进制、十六进制，如果加上#，会显示 0b/0o/0x，否则不显示
，【可选】为数字添加分隔符，如：1,000,000
width 【可选】格式化位所占宽度
.precision 【可选】小数位保留精度
type 【可选】格式化类型

传入” 字符串类型 “的参数

s，格式化字符串类型数据
空白，未指定类型，则默认是None，同s

传入“ 整数类型 ”的参数

b，将10进制整数自动转换成2进制表示然后格式化
c，将10进制整数自动转换为其对应的unicode字符
d，十进制整数
o，将10进制整数自动转换成8进制表示然后格式化；
x，将10进制整数自动转换成16进制表示然后格式化（小写x）
X，将10进制整数自动转换成16进制表示然后格式化（大写X）

- - 传入“ 浮点型或小数类型 ”的参数

- e，转换为科学计数法（小写e）表示，然后格式化；
- E，转换为科学计数法（大写E）表示，然后格式化;
- f ，转换为浮点型（默认小数点后保留6位）表示，然后格式化；
- F，转换为浮点型（默认小数点后保留6位）表示，然后格式化；
- g，自动在e和f中切换
- G，自动在E和F中切换
- %，显示百分比（默认显示小数点后6位）

常用的格式化：

            
               1
            
             tpl = 
            
              "
            
            
              i am {}, age {}, {}
            
            
              "
            
            .format(
            
              "
            
            
              seven
            
            
              "
            
            , 18, 
            
              '
            
            
              alex
            
            
              '
            
            
              )

            
            
               2
            
            
               3
            
             tpl = 
            
              "
            
            
              i am {}, age {}, {}
            
            
              "
            
            .format(*[
            
              "
            
            
              seven
            
            
              "
            
            , 18, 
            
              '
            
            
              alex
            
            
              '
            
            
              ])

            
            
               4
            
            
               5
            
             tpl = 
            
              "
            
            
              i am {0}, age {1}, really {0}
            
            
              "
            
            .format(
            
              "
            
            
              seven
            
            
              "
            
            , 18
            
              )

            
            
               6
            
            
               7
            
             tpl = 
            
              "
            
            
              i am {0}, age {1}, really {0}
            
            
              "
            
            .format(*[
            
              "
            
            
              seven
            
            
              "
            
            , 18
            
              ])

            
            
               8
            
            
               9
            
             tpl = 
            
              "
            
            
              i am {name}, age {age}, really {name}
            
            
              "
            
            .format(name=
            
              "
            
            
              seven
            
            
              "
            
            , age=18
            
              )

            
            
              10
            
            
              11
            
             tpl = 
            
              "
            
            
              i am {name}, age {age}, really {name}
            
            
              "
            
            .format(**{
            
              "
            
            
              name
            
            
              "
            
            : 
            
              "
            
            
              seven
            
            
              "
            
            , 
            
              "
            
            
              age
            
            
              "
            
            : 18
            
              })

            
            
              12
            
            
              13
            
             tpl = 
            
              "
            
            
              i am {0[0]}, age {0[1]}, really {0[2]}
            
            
              "
            
            .format([1, 2, 3], [11, 22, 33
            
              ])

            
            
              14
            
            
              15
            
             tpl = 
            
              "
            
            
              i am {:s}, age {:d}, money {:f}
            
            
              "
            
            .format(
            
              "
            
            
              seven
            
            
              "
            
            , 18, 88888.1
            
              )

            
            
              16
            
            
              17
            
             tpl = 
            
              "
            
            
              i am {:s}, age {:d}
            
            
              "
            
            .format(*[
            
              "
            
            
              seven
            
            
              "
            
            , 18
            
              ])

            
            
              18
            
            
              19
            
             tpl = 
            
              "
            
            
              i am {name:s}, age {age:d}
            
            
              "
            
            .format(name=
            
              "
            
            
              seven
            
            
              "
            
            , age=18
            
              )

            
            
              20
            
            
              21
            
             tpl = 
            
              "
            
            
              i am {name:s}, age {age:d}
            
            
              "
            
            .format(**{
            
              "
            
            
              name
            
            
              "
            
            : 
            
              "
            
            
              seven
            
            
              "
            
            , 
            
              "
            
            
              age
            
            
              "
            
            : 18
            
              })

            
            
              22
            
            
              23
            
             tpl = 
            
              "
            
            
              numbers: {:b},{:o},{:d},{:x},{:X}, {:%}
            
            
              "
            
            .format(15, 15, 15, 15, 15, 15.87623, 2
            
              )

            
            
              24
            
            
              25
            
             tpl = 
            
              "
            
            
              numbers: {:b},{:o},{:d},{:x},{:X}, {:%}
            
            
              "
            
            .format(15, 15, 15, 15, 15, 15.87623, 2
            
              )

            
            
              26
            
            
              27
            
             tpl = 
            
              "
            
            
              numbers: {0:b},{0:o},{0:d},{0:x},{0:X}, {0:%}
            
            
              "
            
            .format(15
            
              )

            
            
              28
            
            
              29
            
             tpl = 
            
              "
            
            
              numbers: {num:b},{num:o},{num:d},{num:x},{num:X}, {num:%}
            
            
              "
            
            .format(num=15)

1.5.3 f-strings

f-strings 提供一种简洁易读的方式, 可以在字符串中包含 Python 表达式. f-strings 以字母 'f' 或 'F' 为前缀, 格式化字符串使用一对单引号、双引号、三单引号、三双引号. 格式化字符串中。

            
               1
            
            
              #
            
            
              !/usr/bin/env python
            
            
               2
            
            
              #
            
            
               -*-coding:utf-8-*-
            
            
               3
            
            
               4
            
            
              """
            
            
               5
            
            
              @author:fyh

            
            
               6
            
            
              @time:2019/6/5

            
            
               7
            
            
              """
            
            
               8
            
             name = 
            
              '
            
            
              豪仔
            
            
              '
            
            
               9
            
             age = 26

            
              10
            
             format_string1 = f
            
              '
            
            
              我的名字是 {name}, 我的年龄是 {age}
            
            
              '
            
            
              11
            
            
              print
            
            (format_string1)  
            
              #
            
            
               我的名字是 豪仔, 我的年龄是 26
            
            
              12
            
            
              13
            
             format_string2 = f
            
              "
            
            
              我的名字是 {name}, 我的年龄是 {age}
            
            
              "
            
            
              14
            
            
              print
            
            (format_string2)   
            
              #
            
            
               我的名字是 豪仔, 我的年龄是 26
            
            
              15
            
            
              16
            
             format_string3 = F
            
              '''
            
            
              我的名字是 {name}, 我的年龄是 {age}
            
            
              '''
            
            
              17
            
            
              print
            
            (format_string3)  
            
              #
            
            
               我的名字是 豪仔, 我的年龄是 26
            
            
              18
            
            
              19
            
             format_string4 = F
            
              """
            
            
              我的名字是 {name}, 我的年龄是 {age}
            
            
              """
            
            
              20
            
            
              print
            
            (format_string4)   
            
              #
            
            
               我的名字是 豪仔, 我的年龄是 26
            
            
              21
            
            
              22
            
            
              #
            
            
               花括号中的数字会先运算
            
            
              23
            
             format_string5 = f
            
              '
            
            
              3 + 5 = {3 + 5}
            
            
              '
            
            
              24
            
            
              print
            
            (format_string5)   
            
              #
            
            
               3 + 5 = 8
            
            
              25
            
            
              26
            
             a = 10

            
              27
            
             b = 20

            
              28
            
             format_string6 = f
            
              '
            
            
              3 + 5 = {a + b}
            
            
              '
            
            
              29
            
            
              print
            
            (format_string6)   
            
              #
            
            
               3 + 5 = 30
            
            
              30
            
            
              31
            
            
              #
            
            
               两个花括号会被替换为一个花括号, 注意{{}} 不表示表达式
            
            
              32
            
             format_string7 = F
            
              '
            
            
              我的名字是 {{name}}, 我的年龄是 {{age}}
            
            
              '
            
            
              33
            
            
              print
            
            (format_string7)

二、bytes

Python3最重要的新特性之一是对字符串和二进制数据流做了明确的区分。文本总是Unicode，由str类型表示，二进制数据则由bytes类型表示。Python3不会以任意隐式的方式混用str和bytes，你不能拼接字符串和字节流，也无法在字节流里搜索字符串（反之亦然），也不能将字符串传入参数为字节流的函数（反之亦然）。

2.1 回顾编码的发展史

在计算机历史的早期，美国为代表的英语系国家主导了整个计算机行业，26个英文字母组成了多样的英语单词、语句、文章。因此，最早的字符编码规范是ASCII码，一种8位即1个字节的编码规范，它可以涵盖整个英语系的编码需要。

编码是什么？编码就是把一个字符用一个二进制来表示。我们都知道，所有的东西，不管是英文、中文还是符号等等，最终存储在磁盘上都是01010101这类东西。在计算机内部，读取和存储数据归根结底，处理的都是0和1组成的比特流。问题来了，人类看不懂这些比特流，如何让这些010101对人类变得可读呢？于是出现了字符编码，它是个翻译机，在计算机内部某个地方，透明的帮我们将比特流翻译成人类可以直接理解的文字。对于一般用户，不需要知道这个过程是什么原理，是怎么执行的。但是对于程序员却是个必须搞清楚的问题。

以ASCII编码为例，它规定1个字节8个比特位代表1个字符的编码，也就是“00000000”这么宽，一个一个字节的解读。例如：01000001表示大写字母A，有时我们会“偷懒"的用65这个十进制来表示A在ASCII中的编码。8个比特位，可以没有重复的最多表示2的8次方(255)个字符。

后来，计算机得到普及，中文、日文、韩文等等国家的文字需要在计算机内表示，ASCII的255位远远不够，于是标准组织制定出了叫做UNICODE的万国码，它规定任何一个字符（不管哪国的）至少以2个字节表示，可以更多。其中，英文字母就是用2个字节，而汉字是3个字节。这个编码虽然很好，满足了所有人的要求，但是它不兼容ASCII，同时还占用较多的空间和内存。因为，在计算机世界更多的字符是英文字母，明明可以1个字节就能够表示，非要用2个。

于是UTF-8编码应运而生，它规定英文字母系列用1个字节表示，汉字用3个字节表示等等。因此，它兼容ASCII，可以解码早期的文档。UTF-8很快就得到了广泛的应用。

在编码的发展历程中，我国还创造了自己的编码方式，例如GBK，GB2312，BIG5。他们只局限于在国内使用，不被国外认可。在GBK编码中，中文汉字占2个字节。

2.2 bytes和str的异同

回到bytes和str的身上。bytes是一种比特流，它的存在形式是01010001110这种。我们无论是在写代码，还是阅读文章的过程中，肯定不会有人直接阅读这种比特流，它必须有一个编码方式，使得它变成有意义的比特流，而不是一堆晦涩难懂的01组合。因为编码方式的不同，对这个比特流的解读也会不同，对实际使用造成了很大的困扰。下面让我们看看Python是如何处理这一系列编码问题的：

            >>> s = 
            
              "
            
            
              中文
            
            
              "
            
            
>>>
            
               s

            
            
              '
            
            
              中文
            
            
              '
            
            
>>>
            
               type(s)

            
            <
            
              class
            
            
              '
            
            
              str
            
            
              '
            
            >
>>> b = bytes(s, encoding=
            
              '
            
            
              utf-8
            
            
              '
            
            
              )

            
            >>>
            
               b
b
            
            
              '
            
            
              \xe4\xb8\xad\xe6\x96\x87
            
            
              '
            
            
>>>
            
               type(b)

            
            <
            
              class
            
            
              '
            
            
              bytes
            
            
              '
            
            >

从例子可以看出，s是个字符串类型。Python有个内置函数bytes()可以将字符串str类型转换成bytes类型，b实际上是一串01的组合，但为了在ide环境中让我们相对直观的观察，它被表现成了b'\xe4\xb8\xad\xe6\x96\x87'这种形式，开头的b表示这是一个bytes类型。\xe4是十六进制的表示方式，它占用1个字节的长度，因此”中文“被编码成utf-8后，我们可以数得出一共用了6个字节，每个汉字占用3个，这印证了上面的论述。在使用内置函数bytes()的时候，必须明确encoding的参数，不可省略。

我们都知道，字符串类str里有一个encode()方法，它是从字符串向比特流的编码过程。而bytes类型恰好有个decode()方法，它是从比特流向字符串解码的过程。除此之外，我们查看Python源码会发现bytes和str拥有几乎一模一样的方法列表，最大的区别就是encode和decode。

从实质上来说，字符串在磁盘上的保存形式也是01的组合，也需要编码解码。

如果，上面的阐述还不能让你搞清楚两者的区别，那么记住下面两几句话：

在将字符串存入磁盘和从磁盘读取字符串的过程中，Python自动地帮你完成了编码和解码的工作，你不需要关心它的过程。
使用bytes类型，实质上是告诉Python，不需要它帮你自动地完成编码和解码的工作，而是用户自己手动进行，并指定编码格式。
Python已经严格区分了bytes和str两种数据类型，你不能在需要bytes类型参数的时候使用str参数，反之亦然。这点在读写磁盘文件时容易碰到。

在bytes和str的互相转换过程中，实际就是编码解码的过程，必须显式地指定编码格式。

            
               1
            
            
              #
            
            
              !/usr/bin/env python3
            
            
               2
            
            
              #
            
            
               -*-coding:utf-8-*-
            
            
               3
            
            
               4
            
            
              """
            
            
               5
            
            
              @author:fyh

            
            
               6
            
            
              @time:2019/5/31

            
            
               7
            
            
              """
            
            
               8
            
            
              #
            
            
               gbk编码的bytes
            
            
               9
            
             b = bytes(
            
              '
            
            
              中国
            
            
              '
            
            , encoding=
            
              '
            
            
              gbk
            
            
              '
            
            
              )

            
            
              10
            
            
              print
            
            (b)        
            
              #
            
            
               b'\xd6\xd0\xb9\xfa'
            
            
              11
            
            
              print
            
            (type(b))  
            
              #
            
            
              
            
            
              12
            
            
              13
            
             str1 =
            
               str(b)

            
            
              14
            
            
              print
            
            (str1)     
            
              #
            
            
               b'\xd6\xd0\xb9\xfa'
            
            
              15
            
            
              print
            
            (type(str1))   
            
              #
            
            
              
            
            
              16
            
            
              17
            
            
              #
            
            
               指定编码格式
            
            
              18
            
             str2 = str(b, encoding=
            
              '
            
            
              gbk
            
            
              '
            
            
              )

            
            
              19
            
            
              print
            
            (str2)     
            
              #
            
            
               中国
            
            
              20
            
            
              print
            
            (type(str2))   
            
              #
            
            
              
            
            
              21
            
            
              22
            
            
              #
            
            
               再把字符串str2转换为utf8编码格式的bytes类型:
            
            
              23
            
             b2 = bytes(str2, encoding=
            
              '
            
            
              utf8
            
            
              '
            
            
              )

            
            
              24
            
            
              print
            
            (b2)       
            
              #
            
            
               b'\xe4\xb8\xad\xe5\x9b\xbd'
            
            
              25
            
            
              print
            
            (type(b2))     
            
              #

2.3 encode和decode

上面说过了，python3默认的编码时Unicode，用字符串表示，二进制数据由bytes类型表示。

encode：将str转换为bytes，是一个编码的过程
decode：将bytes转换为str，是一个解码的过程

            
               1
            
            
              #
            
            
              !/usr/bin/env python3
            
            
               2
            
            
              #
            
            
               -*-coding:utf-8-*-
            
            
               3
            
            
               4
            
            
              """
            
            
               5
            
            
              @author:fyh

            
            
               6
            
            
              @time:2019/5/31

            
            
               7
            
            
              """
            
            
               8
            
            
               9
            
            
              """
            
            
              10
            
            
              其中decode()与encode()方法可以接受参数， 其声明分别为:

            
            
              11
            
            
                  bytes.decode(encoding="utf-8", errors="strict")

            
            
              12
            
            
                  str.encode(encoding="utf-8", errors="strict")

            
            
              13
            
            
              14
            
            
                      其中 encoding是指在解码/编码(动词)过程中使用的字符编码(名词)

            
            
              15
            
            
              16
            
            
                      errors是指错误的处理方案,errrors参数默认值是strict(严格的)意味着如果编解码出错将会抛出UnicodeError

            
            
              17
            
            
              18
            
            
                      如果想忽略编解码错误 可以将errors设置为ignore

            
            
              19
            
            
              """
            
            
              20
            
            
              21
            
            
              22
            
            
              #
            
            
               编码 encode
            
            
              23
            
             str1 = 
            
              "
            
            
              中国
            
            
              "
            
            
              24
            
            
              25
            
             str1_utf8 = str1.encode(encoding=
            
              '
            
            
              utf8
            
            
              '
            
            
              )

            
            
              26
            
            
              print
            
            (str1_utf8)        
            
              #
            
            
               b'\xe4\xb8\xad\xe5\x9b\xbd'
            
            
              27
            
            
              print
            
            (type(str1_utf8))  
            
              #
            
            
              
            
            
              28
            
            
              29
            
             str1_gbk = str1.encode(encoding=
            
              "
            
            
              gbk
            
            
              "
            
            
              )

            
            
              30
            
            
              print
            
            (str1_gbk)         
            
              #
            
            
               b'\xd6\xd0\xb9\xfa'
            
            
              31
            
            
              print
            
            (type(str1_gbk))   
            
              #
            
            
              
            
            
              32
            
            
              33
            
            
              34
            
            
              #
            
            
               解码 decode
            
            
              35
            
             str2 = str1_utf8.decode(encoding=
            
              "
            
            
              utf8
            
            
              "
            
            
              )

            
            
              36
            
            
              print
            
            (str2)     
            
              #
            
            
               中国
            
            
              37
            
            
              print
            
            (type(str2))   
            
              #
            
            
              
            
            
              38
            
            
              39
            
             str3 = str1_gbk.decode(encoding=
            
              "
            
            
              gbk
            
            
              "
            
            
              )

            
            
              40
            
            
              print
            
            (str3)         
            
              #
            
            
               中国
            
            
              41
            
            
              print
            
            (type(str3))   
            
              #

ps：编码和解码时，对应的编码方式要一致

ps：对数据的编码解码工作是通过返回值查看到最终结果的，前面的数据对象并不受影响

更多文章、技术交流、商务合作、联系博主

微信扫码或搜索：z360901061

微信扫一扫加我为好友

QQ号联系： 360901061

您的支持是博主写作最大的动力，如果您喜欢我的文章，感觉我的文章对您有帮助，请用微信扫描下面二维码支持博主2元、5元、10元、20元等您想捐的金额吧，狠狠点击下面给点支持吧，站长非常感激您！手机微信长按不能支付解决办法：请将微信支付二维码保存到相册，切换到微信，然后点击微信右上角扫一扫功能，选择支付二维码完成支付。

【本文对您有帮助就好】元

2元

5元

10元

20元

自定义