摘要:不同方法读取excel中的多个不同sheet表格性能比较
# 方法1
def read_excel(path):
df=pd.read_excel(path,None)
print(df.keys())
# for k,v in df.items():
# print(k)
# print(v)
# print(type(v))
return df
# 方法2
def read_excel1(path):
data_xls = pd.ExcelFile(path)
print(data_xls.sheet_names)
data={}
for name in data_xls.sheet_names:
df=data_xls.parse(sheetname=name,header=None)
data[name]=df
# print(df)
# print(name)
return data
# 方法3
def read_excel2(path):
data_xls = pd.io.excel.ExcelFile(path)
data={}
print(data_xls.sheet_names)
for name in data_xls.sheet_names:
df=pd.read_excel(data_xls,sheetname=name,header=None)
data[name]=df
return data
运行结果
结论:若读取多个sheet表格时,方法2和方法3相对于方法1的效率较高。
需要解决的问题:
方法1的解析结果
方法2的解析结果
方法3的解析结果