一:dict和set是python 里面两种常用的数据结构,其底层是用哈希表实现的,类比java里面的HashSet和HashMap。
dict和set的查询等操作的时间复杂度一般为O(1),远远好于一般数组的O(n)。之所以会这样,是因为dict和set维护这一张哈希表,通过哈希函数,可以快速定位到元素所在的位置。
老版本的python的哈希表数据结构:
--+-------------------------------+
| 哈希值 (hash) 键 (key) 值 (value)
--+-------------------------------+
0 | hash0 key0 value0
--+-------------------------------+
1 | hash1 key1 value1
--+-------------------------------+
2 | hash2 key2 value2
--+-------------------------------+
. | ...
__+_______________________________+
PS:这一种数据结构,每个元素的空间为 hash+key+value。 所占的空间较大,如果哈希表扩张后比较稀疏,会造成很大的空间浪费。
新版本的python的哈希表数据结构:
Indices
----------------------------------------------------
None | index | None | None | index | None | index ...
----------------------------------------------------
Entries
--------------------
hash0 key0 value0
---------------------
hash1 key1 value1
---------------------
hash2 key2 value2
---------------------
...
---------------------
PS:新版本的哈希表数据结构分成了索引和Entry两个数组。索引数组里面存放的是int。这样子就算在比较稀疏的情况大,空间的浪费也远远比第一种小。
二:常用的一些操作:
1:dict和set的初始化方法:
d1 = {'name': 'jason', 'age': 20, 'gender': 'male'}
d2 = dict({'name': 'jason', 'age': 20, 'gender': 'male'})
d3 = dict([('name', 'jason'), ('age', 20), ('gender', 'male')])
d4 = dict(name='jason', age=20, gender='male')
s1 = {1, 2, 3}
s2 = set([1, 2, 3])
2:dict和set的查找方法:
d1['name']
di.get('name', default_value)
用get方法的话,如果key不存在,不会报错,但[]会报错,而且get方法如何设置默认值。
3: 查看元素是否存在可以用 in
4; 更多的方法可以使用 dir(dict) 或 dir(set)查看。