自学Python：python中的OS模块与pickle模块

OS模块

OS就是Operating System的缩写，意为操作系统，这可是一个非常高大上的模块，因为在python中，对于文件系统的访问就是通过OS模块来实现的。我们所知道常用的操作系统就有Windows、Mac OS、Linux、UNIX等，这些操作系统底层对于文件系统的访问工作原理是不一样的，因此你可能就要针对不同的系统来考虑使用哪些文件系统模块，这样的做法是非常麻烦的，因为如果程序的运行环境一旦改变，你就要相应的去修改大量的代码来应付。

但是python是一种跨平台的语言，同样的源代码在不同的操作系统不需要修改就可以同样实现，有了OS模块，不需要关心什么操作系统下使用什么模块，OS模块会帮你选择正确的模块并调用。

下面是OS模块中关于文件/目录常用的函数的使用方法：

函数名	使用方法
getcwd()	返回当前的工作目录
chdir(path)	改变当前工作目录
listdir(path=’.’)	列举指定目录中的文件名(‘.’表示当前目录，’..'表示上一级目录)
mkdir(path)	创建一个单层空目录，如果该目录已经存在则会抛出异常
makedirs(path)	递归的创建多层目录，如果内层目录已经存在则报错，('E:/a/b’和’E:/a/c’不会冲突)
remove(path)	删除文件
rmdir(path)	删除一个单层目录，如果目录非空则抛出异常
removedirs(path)	递归的删除一系列目录，从子目录到父目录逐层尝试删除，遇到非空目录抛出异常
rename(old, new)	重命名
system(command)	运行系统的shell命令

以下是支持路径操作中常用到的一些定义，支持所有平台
os.curdir	指代当前目录 == (’.’)
os.pardir	指代上一级目录 == (’..’)
os.sep	输出操作系统特定的路径分隔符(在windows下为’\\’,Linux下为‘/’)
os.linesep	当前平台使用的行终止符(在Windows下为’\r\n’，Linux下为’\n’)
os.name	指代当前实用的操作系统(包括’posix’、‘nt’、‘mac’、‘os2’、‘ce’、‘java’)

1、 getcwd()
有些情况下我们需要获得应用程序当前的工作目录(比如要保存临时文件),那么可以使用getcwd()函数获得：

            
              >>> import os
>>> os.getcwd()
'E:\\Program Files (x86)\\python37-32'

2、 chdir(path)

            
              >>> os.chdir('E:/a')
>>> os.getcwd()
'E:\\a'

3、listdir(path = ‘.’)
有时候你可能需要知道当前工作目录下有哪些文件和子目录，那么listdir()函数可以帮你列举出来。path参数用于指定列举的目录，默认值是’.’，代表根目录，也可以使用’..'代表上一级目录：

            
              >>> os.chdir('E:/Program Files')
>>> os.listdir(path = '.')
['Tencent', 'YouKu']

            
              os.listdir('./Tencent')

4、mkdir(path)
mkdir()函数用于创建文件夹，如果该文件夹存在，则抛出FileExistsError异常：

5、makedirs(path)
makedirs()函数可用于创建多层目录，用过linux系统的都知道，在linux中的话，要建立多层目录可以使用 mkdir /A/B/C/D -p

            
              >>> os.chdir('E:/a')
>>> os.listdir()
>>> ['B']
>>> os.makedirs('E:/a/A/B/C')
>>> os.listdir('E:/a/')
['A', 'B']
>>> os.listdir('E:/a/A/B/')
['C']

6、remove(path)、rmdir(path)和removedirs(path)
remove()函数用于删除指定的文件，注意是删除文件，不是删除目录。如果需要删除目录，则用rmdir()函数；如果要删除多层目录，则用removedirs()函数。

            
              >>> os.chdir('E:/A/A/B/C')
>>> os.listdir()
['test.txt']
>>> os.remove('test.txt')
>>> os.listdir()
[]
>>> os.chdir('E:/A/A/B/')
>>> os.listdir()
['C']
>>> os.rmdir('C')
>>> os.listdir()
[]
>>> os.chdir('E:/A/')
>>> os.removedirs('E:/A/A/B')
>>> os.listdir()
['B']

7、rename(old, new)
rename()函数用于重命名文件或者文件夹

            
              >>> os.listdir()
['B']
>>> os.rename('B', 'TEST_DIR')
>>> os.listdir()
['TEST_DIR']
>>> os.chdir('TEST_DIR')
>>> os.listdir()
['C', 'test2.txt']
>>> os.rename('test2.txt', 'new_test.txt')
>>> os.listdir()
['C', 'new_test.txt']

8、system(command)
os模块的这个方法我个人感觉在linux系统中非常好用，在一些运维自动化脚本中用的非常频繁，当然在windows中也可以用，几乎每个操作系统都会提供一些小工具，system()函数用于使用这些小工具，她或使用相应的命令将这些工具调出来，比如说windows中的计算器，在dos窗口我们需要使用calc命令调出，因此，在python中我们可以使用system()函数调用计算器

            
              >>> os.system('calc')

9、walk(top)
最后是walk()函数，这个函数在有些时候确实非常有用，可以省去很多麻烦。该函数的作用是遍历top参数指定路径下的所有子目录，并将结果返回一个三元组(路径，[包含目录]，[包含文件])。看一下下面的例子：

            
              >>> os.getcwd()
'E:\\A'
>>> for i in os.walk('.'):
 print(i)
 
('.', ['TEST_DIR', 'TEST_DIR2'], [])
('.\\TEST_DIR', ['C'], ['new_test.txt'])
('.\\TEST_DIR\\C', ['gd0306'], ['test.png'])
('.\\TEST_DIR\\C\\gd0306', [], ['gd0306.txt'])
('.\\TEST_DIR2', ['NEW_DIR'], ['test2.txt'])
('.\\TEST_DIR2\\NEW_DIR', [], ['test3.txt'])

os.path

除了上面提到的os模块的一些功能外，还有一个强大的模块是os.path，它可以完成一些针对路径名的操作。其常用的函数方法有：

函数名	使用方法
basename(path)	去掉目录路径，单独返回文件名
dirname(path)	去掉文件名，单独返回目录路径
join(path1[,path2[, …]])	将path1和path2各部分组合成一个路径名
split(path)	分割文件名与路径，返回(f_path, f_name)元祖。如果完全使用目录，他也会讲最后一个目录作为文件名分离，且不会判断文件或者目录是否存在
splitext(path)	分离文件名与扩展名，返回(f_name, f_extension)元祖
getsize(file)	返回指定文件的尺寸，大小为字节
getatime(file)	返回指定文件最近的访问时间(浮点型秒数，可用time模块的gmtime()或localtime()函数换算)
getctime(file)	返回指定文件的创建时间(浮点型秒数，可用time模块的gmtime()或者localtime()换算)
getmtime(file)	返回指定文件最新的修改时间(浮点型秒数，可用time模块的gmtime()或者localtime()换算)

以下为函数返回True或者False

函数名	使用方法
exists(path)	判断指定路径(目录或者文件)是否存在
isabs(path)	判断指定路径是否为绝对路径
isdir(path)	判断指定路径是否存在且是一个目录
isfile(path)	判断指定路径是否存在且是一个文件
islink(path)	判断指定路径是否存在且是一个符号链接(软连接)
ismount(path)	判断指定路径是否存在且是一个挂载点
samefile(path1, path2)	判断path1和path2两个路径是否指向同一个文件

1、basename(path)和dirname(path)
basename()和dirname()函数分别用于获得文件名和路径名：

            
              >>> os.path.dirname(r'E:/A/TEST_DIR/new_test.txt')
'E:/A/TEST_DIR'
>>> os.path.basename(r'E:/A/TEST_DIR/new_test.txt')
'new_test.txt'

2、join(path1[,path2[, …]])
join()函数跟BIF的那个join()函数不同，os.path.join()是用于将路径名和文件名组合成一个完整的路径，这个目录路径和文件都可以不存在：

            
              >>> os.path.join(r'E:/A/TEST_DIR', 'gd.txt')
'E:/A/TEST_DIR\\gd.txt'
>>> os.path.join(r'E:/A/TEST_DIR3', 'gd.txt')
'E:/A/TEST_DIR3\\gd.txt'

3、split(path)和splitext(path)
split()和splitext()函数都用于分割路径，split()函数分割路径和文件名(如果完全使用目录，他也会将最后一个目录作为文件名分离，且不会判断文件或者目录是否存在)；splitext()函数则是用于分割文件名和扩展名：

            
              >>> os.path.split('E:/A/TEST_DIR/new_test.txt')
('E:/A/TEST_DIR', 'new_test.txt')
>>> os.path.splitext('E:/A/TEST_DIR/new_test.txt')
('E:/A/TEST_DIR/new_test', '.txt')

4、getsize(file)
getsize()函数用于获取文件的尺寸，返回值是以字节为单位的：

            
              >>> os.path.getsize('E:/A/TEST_DIR/new_test.txt')
2170

5、getatime()、getctime()、getmtime()
这三个函数分别用于获取文件的最近访问时间、创建时间和修改时间。不过返回值是浮点型秒数，可用time模块的gmtime()或localtime()函数换算：

            
              >>> import time
>>> temp = time.localtime(os.path.getatime('E:/A/TEST_DIR/new_test.txt'))
>>> print('E:/A/TEST_DIR/new_test.txt 被访问的时间是:', time.strftime('%d %b %Y %H: %M: %S', temp))
E:/A/TEST_DIR/new_test.txt 被访问的时间是: 23 May 2019 22: 12: 44
>>> 
>>> temp = time.localtime(os.path.getctime('E:/A/TEST_DIR/new_test.txt'))
>>> print('E:/A/TEST_DIR/new_test.txt 被创建的时间是:', time.strftime('%d %b %Y %H: %M: %S', temp))
E:/A/TEST_DIR/new_test.txt 被创建的时间是: 23 May 2019 20: 49: 56
>>> 
>>> temp = time.localtime(os.path.getmtime('E:/A/TEST_DIR/new_test.txt'))
>>> print('E:/A/TEST_DIR/new_test.txt 被修改的时间是:', time.strftime('%d %b %Y %H: %M: %S', temp))
E:/A/TEST_DIR/new_test.txt 被修改的时间是: 23 May 2019 22: 12: 44

pickle：泡菜？

pickle是python提供的一个标准模块，使用这个模块，可以非常容易地将列表、字典这类复杂数据类型存储为文件了。
pickle就是泡菜，腌菜的意思，用官方文档中的话说，这是一个令人惊叹的模块，它几乎可以把所有python的对象都转化为二进制的形式存放，这个过程称为pickling，那么从二进制形式转化会对象的过程称为unpickling。
我们来举一个将列表数据保存到文件的例子：

            
              import pickle as p

my_list = [123, 345, 'pythoner', [12, 34, 56]]

# 使用二进制可写的方式创建一个文件
pickle_file = open('E:/A/TEST_DIR/C/my_list.pkl', 'wb')

# 使用pickle模块的dump方法将数据保存到创建的.pkl文件中
p.dump(my_list, pickle_file)

# 关闭文件
pickle_file.close()

运行这段python代码之后，就会出现my_list.pkl这个文件，里面存储的数据格式为二进制，所以要打开的话要以二进制方式打开，还有这个文件的后缀名是随意的，使用pkl是为了方便记忆与分辨。

我们要想在python中将之前保存到文件的列表数据还原，就需要在python中以二进制可读的方式打开pkl文件，随后再使用pickle模块的load方法将数据加载进来

            
              import pickle as p

# 使用二进制可读的方式打开之前保存列表数据的pkl文件
pickle_file = open('E:/A/TEST_DIR/C/my_list.pkl', 'rb')

# 调用pickle模块的load方法将列表数据加载到my_list对象中
my_list = p.load(pickle_file)
print(my_list)

运行这段代码就可以得到我们之前的列表了

利用pickle模块不但可以保存列表数据，其实他可以保存任何你能想象到的东西！！！

更多文章、技术交流、商务合作、联系博主

微信扫码或搜索：z360901061

微信扫一扫加我为好友

QQ号联系： 360901061

您的支持是博主写作最大的动力，如果您喜欢我的文章，感觉我的文章对您有帮助，请用微信扫描下面二维码支持博主2元、5元、10元、20元等您想捐的金额吧，狠狠点击下面给点支持吧，站长非常感激您！手机微信长按不能支付解决办法：请将微信支付二维码保存到相册，切换到微信，然后点击微信右上角扫一扫功能，选择支付二维码完成支付。

【本文对您有帮助就好】元

2元

5元

10元

20元

自定义