可视化是在整个数据挖掘的关键辅助工具,可以清晰的理解数据,从而调整我们的分析方法。

  1. Matplotlib 基本概念

  Matplotlib是python的一个数据可视化工具库,专门用于开发2D图表(包括3D图表), 操作简单。

  2. Matplotlib三层结构

  容器层

  容器层由Canvas、Figure、Axes三部分组成。

  Canvas位于最底层的系统层,充当画板,即放置Figure的工具。

  Figure是Canvas上方的第一层,也是需要用户来操作的应用层的第一层,在绘图的过程中充当画布的角色。

  Axes是应用层的第二层,在绘图的过程中相当于画布上的绘图区的角色。

  Figure:指整个图形(可以通过plt.figure()设置画布的大小和分辨率等)

  Axes(坐标系):数据的绘图区域

  Axis(坐标轴):坐标系中的一条轴,包含大小限制、刻度和刻度标签

  特点为:

  一个figure(画布)可以包含多个axes(坐标系/绘图区),但是一个axes只能属于一个figure。

  一个axes(坐标系/绘图区)可以包含多个axis(坐标轴),包含两个即为2d坐标系,3个即为3d坐标

  辅助显示层

  辅助显示层为Axes(绘图区)内的除了根据数据绘制出的图像以外的内容,主要包括Axes外观(facecolor)、边框线(spines)、坐标轴(axis)、坐标轴名称(axis label)、坐标轴刻度(tick)、坐标轴刻度标签(tick label)、网格线(grid)、图例(legend)、标题(title)等内容。

  图像层

  图像层指Axes内通过plot、scatter、bar、histogram、pie等函数根据数据绘制出的图像

  总结

  Canvas(画板)位于最底层,用户一般接触不到;

  Figure(画布)建立在Canvas之上;

  Axes(绘图区)建立在Figure之上;

  坐标轴(axis)、图例(legend)等辅助显示层以及图像层都是建立在Axes之上。

  3.plt的基本用法

  3.1 Figure对象

  matplotlib的图像都位于Figure对象中,我们可以调用plt.figure()来创建Figure对象。

  fig = plt.figure()

  figure有一个比较重要的参数figsize,它衡量图片的大小和纵横比(单位为inch):

  fig = plt.figure(figsize=(4,5))

  比如,以上代码代表建立一个宽度为4inch,高度为5inch的figure对象。

  3.2 plot的使用

  有了figure对象之后,就可以利用plot函数作图了。注意不可以使用figure对象来调用plot,按照惯例我们使用plt.plot()来作图,而图像自动分配到上一个建立的figure中。

  3.3 如何在同一个figure内部设置多个图片

  figure对象调用add_subplot函数来添加figure内部不同位置的图片,add_subplot函数的3个参数分别为figure内部纵向和横向的字图片个数,以及当前创建的子图片是第几个,例如: 无锡看妇科的医院 http://www.ytsgfk120.com/

  fig = plt.figure()

  # add_subplot返回的是一个subplot对象

  sp1 = fig.add_subplot(2,3,1)

  sp2 = fig.add_subplot(2,3,2)

  sp3 = fig.add_subplot(2,3,3)

  sp4 = fig.add_subplot(2,3,4)

  fig

  如果要在subplot内部作图,我们只需要用对应的subplot对象调用plot即可:

  sp1.plot(np.random.randn(50), 'k--', color='r')

  fig

  3.4 如何调整subplot的间距

  有时候各subplot的间距会过大或者过小,这时候与我们需要使用subplots_adjust函数来调整间距:

  fig.tight_layout() # 调整整体空白

  plt.subplots_adjust(wspace =0, hspace =0) # 调整子图间距

  plt.subplots_adjust(left=None, bottom=None, right=None, top=None,wspace=None,hspace=None)

  参数详解:

  left = 0.125 # the left side of the subplots of the figure

  right = 0.9 # the right side of the subplots of the figure

  bottom = 0.1 # the bottom of the subplots of the figure

  top = 0.9 # the top of the subplots of the figure

  wspace = 0.2 # the amount of width reserved for blank space between subplots,

  # expressed as a fraction of the average axis width

  hspace = 0.2 # the amount of height reserved for white space between subplots,

  # expressed as a fraction of the average axis height

  # 调整fig内部的subplot长宽间距都为0.5

  fig.subplots_adjust(wspace = 0.5, hspace = 0.5)

  fig