《Python3爬虫、数据清洗和可视化实战》
零一 韩要宾 黄园园 著
第11章 数据可视化
11.1 matplotlib
调用matplotlib有下面四个步骤:
(1)设定画图背景样式
mpl.style.use(“ggplot”)
(2)设定画布
#命名画布为fig,并把fig分为两个小画布(ax1,ax2),设置fig的大小为12*4点
fig, (ax1,ax2) = plt.subplots(1,2,figsize=(12,4))
(3)画图及设定元素
df_mean.价格.plot(kind=”barh”,ax=ax1) #kind=”barh”画一张条形图; ax=ax1画在ax1画布上
ax1.set_xlabel(“各省份平均价格”) #设定X轴标签
(4)自动调整格式
fig.tight_layout()
11.2 各种图形绘制
(1)饼图
pie.add(“图例名称”,”属性名称”,”属性值”,饼图半径-radius=,饼图圆心-center=,图形类型-rosetype-radius,area)
(2)漏斗图
funnel.add(“图例名称”,属性名称,属性对应值,其他设置)
(3)柱形图
bar.add(“图例名称”,横坐标轴数据,纵坐标轴数据,数据是否堆叠-is_stack=True or False,其他设置)
(4)条形图
将柱形图旋转九十度即可:is_convert=True
bar.add(“图例名称”,横坐标轴数据,纵坐标轴数据, is_convert=True,数据是否堆叠-is_stack=True or False,其他设置)
(5)折线图
Line.add(“图例名称”,横坐标轴,纵坐标轴,是否显示图形标记-is_symbol_show,是否平滑曲线-is_smooth,是否堆叠-is_stack,是否为阶梯线图-is_step,是否填充曲线绘制面积-is_fill) # is_symbol_show默认值为True,其他的都为False。
(6)仪表盘
gauge.add(“图例名称”,”属性名称”,属性值,仪表盘数据范围-scale_range 默认[0,100],仪表盘角度范围-angle_range 默认[225,-45])
(7)水球图
liquid.add(“图例名称”,数据,水球外形-shape,波浪颜色- liquid_color,是否显示波浪画面-is_ liquid_animation,是否显示边框-is_ liquid_outline_show)
#水球外形可选值有:circle(默认)、rect、roundRect、triangle、diamond、pin、arrow
(8)词云
worldCloud.add(“图例名称”,”属性名称”,属性值,词云图轮廓-shape,词大小范围-word_size_range=[12,50],词旋转角度-rotate_step=45)
#词云图轮廓可选值:circle(默认)、cardioid、triangle-forward、triangle、diamond、pentagon、star
(9)散点图
scatter.add(“图例名称”,横坐标轴数据,纵坐标轴数据,标记图形大小-symbol_size=10)
(10)箱形图
Boxplot.add(“图例名称”,横坐标轴数据,纵坐标轴数据,其他数据)
#能显示一组数据的最大值、最小值、中位数、下四分位数及上四分位数
(11)3D柱形图
Bar3D.add(“图例名称”,横坐标轴数据,纵坐标轴数据,数据集,柱透明度-默认1,着色效果-color,)
#color参数的值有:lambert带光照、realistic真实渲染
《Python3爬虫、数据清洗和可视化实战》之阅读笔记就写完了。下一本是《Python数据科学入门》Dmitry Zinoview著。如果大家有什么想看的书也可以推荐我阅读整理哦。(
"Let excellence be your brand."--Oprah Winfrey
)