Python内置了多种类型的数据结构,常用的有:列表、元组、集合和字典。
本文主要介绍列表和元组。
列表(list)和元组(tuple)
定义
列表和元组,都是一个可以放置任意数据类型的有序集合。
列表和元组的区别
- 列表是动态的 ,长度大小不固定,可以随意增加、删减或者改变元素(mutable)。
- 元组是静态的 ,长度大小固定,无法增加删减或改变(immutable)。
如果要对已有的元组做任何“改变”,只能重新开辟一块内存,创建新的元组。
# 列表(list)
list
=
[
1
,
2
,
3
,
4
,
5
]
list
.
append
(
6
)
# 添加元素 5 到原列表的末尾
print
(
list
)
# 元组
tup
=
(
1
,
2
,
3
,
4
)
new_tup
=
tup
+
(
5
,
)
# 创建新的元组 new_tup,并依次填充原元组的值
print
(
new_tup
)
列表和元组的基本操作和注意事项
索引
在python中,列表和元组都支持负数索引,-1表示最后一个元素,-2表示倒数第2个元素,以此类推
# 列表
list
=
[
1
,
2
,
3
,
4
]
list
[
0
]
list
[
-
1
]
# 元组
tup
=
(
1
,
2
,
3
,
4
)
tup
[
1
]
tup
[
-
2
]
切片操作
列表和元组都支持切片操作
list
=
[
1
,
2
,
3
,
4
]
l
[
1
:
3
]
# 返回列表中索引从 1 到 2 的子列表
[
2
,
3
]
tup
=
(
1
,
2
,
3
,
4
)
tup
[
1
:
3
]
# 返回元组中索引从 1 到 2 的子元组
(
2
,
3
)
随意嵌套
l
=
[
[
1
,
2
,
3
]
,
[
4
,
5
]
]
# 列表的每一个元素也是一个列表
tup
=
(
(
1
,
2
,
3
)
,
(
4
,
5
,
6
)
)
# 元组的每一个元素也是一元组
列表和元组的相互转换
两者可以通过 list() 和 tuple() 函数相互转换:
list
(
(
1
,
2
,
3
)
)
[
1
,
2
,
3
]
tuple
(
[
1
,
2
,
3
]
)
(
1
,
2
,
3
)
常用的内置函数
- count(item) 表示统计列表 / 元组中 item 出现的次数。
- index(item) 表示返回列表 / 元组中 item 第一次出现的索引。
- list.reverse() 和 list.sort() 分别表示原地倒转列表和排序(注意,元组没有内置的这两个函数)。
- reversed() 和 sorted() 同样表示对列表 / 元组进行倒转和排序,但是会返回一个倒转后或者排好序的新的列表 / 元组。
l
=
[
3
,
2
,
3
,
7
,
8
,
1
]
l
.
count
(
3
)
2
l
.
index
(
7
)
3
l
.
reverse
(
)
l
[
1
,
8
,
7
,
3
,
2
,
3
]
l
.
sort
(
)
l
[
1
,
2
,
3
,
3
,
7
,
8
]
tup
=
(
3
,
2
,
3
,
7
,
8
,
1
)
tup
.
count
(
3
)
2
tup
.
index
(
7
)
3
list
(
reversed
(
tup
)
)
[
1
,
8
,
7
,
3
,
2
,
3
]
sorted
(
tup
)
[
1
,
2
,
3
,
3
,
7
,
8
]
列表和元组存储方式的差异
前面我们说过:列表和元组最重要的区别就是,列表是动态的、可变的,而元组是静态的、不可变的。这样的差异,势必会影响两者存储方式。我们先看下面的例子:
l
=
[
1
,
2
,
3
]
l
.
__sizeof__
(
)
64
tup
=
(
1
,
2
,
3
)
tup
.
__sizeof__
(
)
48
上面的例子中,我们在列表和元组中放置了相同的元素,但是元组的存储空间,却比列表要少 16 字节。这是为什么呢?
事实上,由于列表是动态的,所以它需要存储指针,来指向对应的元素(上述例子中,对于 int 型,8 字节)。另外,由于列表可变,所以需要额外存储已经分配的长度大小(8 字节),这样才可以实时追踪列表空间的使用情况,当空间不足时,及时分配额外空间。
l
=
[
]
l
.
__sizeof__
(
)
//
空列表的存储空间为
40
字节
40
l
.
append
(
1
)
l
.
__sizeof__
(
)
72
//
加入了元素
1
之后,列表为其分配了可以存储
4
个元素的空间
(
72
-
40
)
/
8
=
4
l
.
append
(
2
)
l
.
__sizeof__
(
)
72
//
由于之前分配了空间,所以加入元素
2
,列表空间不变
l
.
append
(
3
)
l
.
__sizeof__
(
)
72
//
同上
l
.
append
(
4
)
l
.
__sizeof__
(
)
72
//
同上
l
.
append
(
5
)
l
.
__sizeof__
(
)
104
//
加入元素
5
之后,列表的空间不足,所以又额外分配了可以存储
4
个元素的空间
上面的例子,大概描述了列表空间分配的过程。我们可以看到,为了减小每次增加 / 删减操作时空间分配的开销,Python 每次分配空间时都会额外多分配一些,这样的机制(over-allocating)保证了其操作的高效性:增加 / 删除的时间复杂度均为 O(1)。
但是对于元组,情况就不同了。元组长度大小固定,元素不可变,所以存储空间固定。
在数据量小的情况下,这样的差异可以忽略不计。但是当数据量很大时,比如列表和元组存储元素的个数是一亿,十亿甚至更大数量级时,这种差异就不能忽视了。
列表和元组的性能
通过上面列表和元组存储方式的差异的学习,我们可以得出结论:元组要比列表更加轻量级一些,所以总体上来说,元组的性能速度要略优于列表。
另外,Python 会在后台,对静态数据做一些 资源缓存 (resource caching)。通常来说,因为垃圾回收机制的存在,如果一些变量不被使用了,Python 就会回收它们所占用的内存,返还给操作系统,以便其他变量或其他应用使用。
但是对于一些静态变量,比如元组,如果它不被使用并且占用空间不大时,Python 会暂时缓存这部分内存。这样,下次我们再创建同样大小的元组时,Python 就可以不用再向操作系统发出请求,去寻找内存,而是可以直接分配之前缓存的内存空间,这样就能大大加快程序的运行速度。
下面的例子,是计算 初始化 一个相同元素的列表和元组分别所需的时间。我们可以看到,元组的初始化速度,要比列表快 5 倍。
python
-
m timeit
'x=(1,2,3,4,5,6)'
20000000
loops
,
best of
5
:
9.97
nsec per loop
python
-
m timeit
'x=[1,2,3,4,5,6]'
5000000
loops
,
best of
5
:
50.1
nsec per loop
但如果是 索引操作 的话,两者的速度差别非常小,几乎可以忽略不计。
python
-
m timeit
-
s
'x=[1,2,3,4,5,6]'
'y=x[3]'
10000000
loops
,
best of
5
:
22.2
nsec per loop
python
-
m timeit
-
s
'x=(1,2,3,4,5,6)'
'y=x[3]'
10000000
loops
,
best of
5
:
21.9
nsec per loop
当然,如果你想要增加、删减或者改变元素,那么列表显然更优。原因你现在肯定知道了,那就是对于元组,你必须得通过新建一个元组来完成。
列表和元组的使用场景
那么列表和元组到底用哪一个呢?根据上面所说的特性,我们具体情况具体分析。
1. 如果存储的数据和数量不变,比如你有一个函数,需要返回的是一个地点的经纬度,然后直接传给前端渲染,那么肯定选用元组更合适。
def
get_location
(
)
:
.
.
.
.
.
return
(
longitude
,
latitude
)
2. 如果存储的数据或数量是可变的,比如社交平台上的一个日志功能,是统计一个用户在一周之内看了哪些用户的帖子,那么则用列表更合适。
viewer_owner_id_list
=
[
]
# 里面的每个元素记录了这个 viewer 一周内看过的所有 owner 的 id
records
=
queryDB
(
viewer_id
)
# 索引数据库,拿到某个 viewer 一周内的日志
for
record
in
records
:
viewer_owner_id_list
.
append
(
record
.
id
)
总结
- 列表和元组都是有序的,可以存储任意数据类型的集合。
- 列表是动态的,长度可变,可以随意增加、删减、改变元素。
- 元组是静态的,长度大小固定,不可对元素进行增加、删减、改变操作。
- 列表的存储空间略大于元组,性能略逊于元组。元组相对列表更轻量级。