习题1:
读入文件pmi_days.csv,完成以下操作:
1.统计质量等级对应的天数,例如:
优:5天
良:3天
中度污染:2天
2.找出PMI2.5的最大值和最小值,分别指出是哪一天。
import pandas as pd import numpy as np path = open( " pmi_days.csv " ) data = pd.read_csv(path) gp = data.groupby( ' 质量等级 ' ) you = dict([x for x in gp])[ ' 优 ' ] liang = dict([x for x in gp])[ ' 良 ' ] qing = dict([x for x in gp])[ ' 轻度污染 ' ] zhong = dict([x for x in gp])[ ' 中度污染 ' ] print ( " 优:{}天\n良:{}天\n轻度污染:{}天\n中度污染:{}天 " .format(len(you.index),len(liang.index), len(qing.index),len(zhong.index))) pm = data.sort_values(by= ' PM2.5 ' ) pm_1 = pm.reset_index(drop= True) print ( " PM2.5的最大的一天是:{}\t数值:{} " .format(pm_1[ " PM2.5 " ][-1],pm_1[ " 日期 " ][-1 ])) print ( " PM2.5的最小的一天是:{}\t数值:{} " .format(pm_1[ " PM2.5 " ][0],pm_1[ " 日期 " ][0]))
习题2: 读入文件1980-2018GDP.csv,完成以下操作: 1.按行输出每年GDP数据,表头列名如文件第1行所示。
2.将各年GDP数据转换成字典格式,以年份为keys,其它值为values(数据类型为列表方式),例如: { 2017:[827121.7,6.8%,60989] ........ }
3.遍历字典数据,求出GDP的最小值与最大值,并输出数据与对应的年份。
import pandas as pd path = open( " 1980-2018GDP.csv " ) data = pd.read_csv(path) # 按行输出每年GDP数据 print (data,end= " \n\n " ) # 将各年GDP数据转换成字典格式,以年份为keys,其它值为values(数据类型为列表方式) dict = data.set_index( ' 年份 ' ).T.to_dict( ' list ' ) print ( " 字典: " , end= "" ) print (format(dict),end= " \n\n " ) # 遍历字典数据,求出GDP的最小值与最大值,并输出数据与对应的年份。 max = max(dict, key= dict.get) min = min(dict, key= dict.get) print ( " GDP最大值:{}\t它所对应的年份:{} " .format(dict[max][0],max)) print ( " GDP最小值:{}\t它所对应的年份:{} " .format(dict[min][0],min))
1.按行输出每年GDP数据
2.将各年GDP转换为字典格式,以年份为keys,其他值为values(数据类型为列表方式)
3.遍历字典数据,求出GDP的最小值与最大值,并输出数据与对应的年份。