如何在 matplotlib 中加注释和内嵌图

    技术2022-07-12  82

    在用Matplotlib进行可视化过程中,很多时候为了更直观地展现数据大小,会将具体的数值标注在图形中,比如在柱状图上标明数值大小。

    这篇文章会以一个实际的案例,详细讲讲如何给数据加注解,同时也介绍一下一种比较骚的操作,即Matplotlib的内嵌图(把一张小图嵌入到一张大图中),学会这个后,你能够绘制出这种图形

    数据注释

    演示的数据集为2016年抵美(到达美国)人数排名前十的国家数据,包含国名和具体入境人数,人数的具体单位为百万人次

    import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline plt.rcParams['font.sans-serif'] = 'SimHei' x_data = ['加拿大','墨西哥','英国','日本','中国','德国','韩国','法国','巴西','印度'] y_data = [13.428347,12.255948,3.019111,2.352919,2.09833,1.322882,1.282097,1.127868,1.109066,0.874016]

    有了数据后,可以非常快地画出一张柱状图

    fig,ax = plt.subplots(figsize=(16,6)) ax.bar(x_data,y_data)

    接下来开始加注释,即在柱状图上显示具体数值。在Matplotlib中,为数据加上注释有两种方式,一种是使用ax.text(),另一种则是ax.annotate()。

    ax.text()

    ax.text()的主要作用是为图中加上一些text,也就是文字。不仅是能够加注释,只要指定了坐标,可以在图上的任何坐标加上text。

    函数中的几个重要的参数,具体介绍一下

    x:x的坐标

    y:y的坐标

    s:要加的文字

    rotation:文字旋转的角度

    fontsize:文字字体大小

    fontweight:文字字体粗细

    需要注意的是,每次调用ax.text()只能生成一个Text对象,也就是说每次只能加一个注释,多个的话需要写循环生成。

    所以一般加注释是这么一个流程:先确定注释的横纵坐标-->写循环调用ax.text()

    fig,ax = plt.subplots(figsize=(16,6)) ax.bar(x_data,y_data) # 循环生成text # horizontalalignment参数设置注释居中显示 for x,y in zip(x_data,y_data):     ax.text(x,y+0.05,y,fontsize=14,horizontalalignment='center')

    关于图表美化方面,这里暂时不过多赘述。

    ax.annotate()

    相比于ax.text(),ax.annotate()更像是专门为做注释而生的,annotate便是注释的意思。

    ax.annotate()的注释功能更强大,除了加入文本注释外,如果有需要还能够加上箭头→进行指示。

    一些主要的参数如下:

    s:注释文本

    xy:要加注释的数据点位置

    xytext:文本注释的位置,默认情况下为xy

    arrowprops:一个控制箭头的属性的dict,如果需要显示箭头,必须要设置

    这里比较有意思的两个参数是xy和xytext,二者貌似没啥区别的样子,这个地方确实很容易产生困惑。

    一般情况下,s和xy是必须要设置的参数,如果不指定,xytext默认和xy一致。

    但如果要设置箭头的话,xy的坐标则定义了箭头的头部,xytext则指定箭头的尾部和文本注释的位置,实际画图来理解看看。

    ax.annotate()和ax.text()的画图流程是一致的,都需要循环生成注释。

    不设置箭头,简单加上注释

    fig,ax = plt.subplots(figsize=(16,6)) ax.bar(x_data,y_data) for x,y in zip(x_data,y_data):     ax.annotate(y,(x,y+0.05),fontsize=14,horizontalalignment='center')

    加上注释并设置箭头

    fig,ax = plt.subplots(figsize=(16,6)) ax.bar(x_data,y_data) # 箭头头部坐标(x,y) # 箭头尾部坐标(注释坐标)为(x,y+1) for x,y in zip(x_data,y_data):     ax.annotate(y,xy = (x,y),xytext = (x,y+1),fontsize=14,horizontalalignment='center',                arrowprops =dict(arrowstyle='->')) # 将纵坐标范围扩大 ax.set_ylim([0,16])

    设置了显示箭头之后,可以明显地看出,箭头是由xytext坐标指向xy的坐标的,所以,当你不需要设置箭头的时候,xytext设置的意义并不大。

    内嵌图

    内嵌图大家可能用的比较少,但这种图其实还是挺有用的。

    拿上面的数据例子来说,柱状图显示了2016年抵美人数排名前十的国家的具体人数,如果这时想结合各大地域抵美人数的占比数据进行分析,该如何绘图?

    一个比较直接的想法是用subplots子图来实现,比如上边显示柱状图,下边显示饼图,如下:

    zhou_name = ['西欧','亚洲','南美洲','大洋洲','加勒比地区','中东地区','中美洲','东欧','非洲'] zhou_percent = [36.2,30.8,13.9,4.3,4.1,3.8,2.8,2.6,1.5] fig,ax = plt.subplots(2,1,figsize=(16,12)) ax[0].bar(x_data,y_data) for x,y in zip(x_data,y_data):     ax[0].annotate(y,(x,y+0.05),fontsize=14,horizontalalignment='center') ax[1].pie(zhou_percent,labels=zhou_name,autopct='%1.1f%%')

    这当然是可行的,但还有更好的方案,那便是内嵌图。注意到这里的柱状图右侧有很大的留白部分,如果把饼图放到柱状图右侧的留白部分会显得更加直观。

    内嵌图有两种生成方式,一种是fig.add_axes(),另一种则是使用inset_axes()。

    fig.add_axes()

    fig.add_axes()就是在原有的Figure上加上一个新的区域Axes,然后在这个区域中绘制图形。

    使用这个方法的话需要指定新增的这个区域Axes在Figure中的相对位置和区域大小,输入参数均为相对于原来Figure的比例值,如下:

    # left和bottom控制新Axes的位置 # width和height控制新Axes的大小(长宽) # 这些均用相对数来表示,大小在0-1之间 left,bottom,width,height = [0.5,0.3,0.5,0.5] fig,ax1 = plt.subplots(figsize=(16,6)) ax1.bar(x_data,y_data) for x,y in zip(x_data,y_data):     ax1.annotate(y,(x,y+0.05),fontsize=14,horizontalalignment='center') # 运用fig.add_axes()新增一个区域Axes绘图 ax2 = fig.add_axes([left,bottom,width,height]) ax2.pie(zhou_percent,labels=zhou_name,autopct='%1.1f%%')

    inset_axes

    相比于fig.add_axes()需要对相对位置进行调试,使用inset_axes()进行绘图则可以方便进行定位。

    inset_axes中的位置由参数loc设置,可以用字符串控制,也可以输入数字,具体如下:

    'upper right'  : 1

    'upper left'   : 2

    'lower left'   : 3

    ......

    'upper center' : 9

    'center'       : 10

    # 使用前需要先导包 from mpl_toolkits.axes_grid1.inset_locator import inset_axes fig,ax1 = plt.subplots(figsize=(16,6)) ax1.bar(x_data,y_data) for x,y in zip(x_data,y_data):     ax1.annotate(y,(x,y+0.05),fontsize=14,horizontalalignment='center') # 将内嵌图置于右侧,宽度和长度分别为相对长度 ax2 = inset_axes(ax1,width = '60%',height = '60%',loc='right') ax2.pie(zhou_percent,labels=zhou_name,autopct='%1.1f%%')

    美化方面这里就不再多讲了,具体可以参照这篇文章如何用 Matplotlib 画一张好看的图。

    推荐阅读:

    一文读懂高并发情况下的常见缓存问题

    用 Django 开发基于以太坊智能合约的 DApp

    一文读懂 Python 分布式任务队列 celery

    5 分钟解读 Python 中的链式调用

    用 Python 创建一个比特币价格预警应用

    ▼ 点击即享阿里云产品0.9折优惠起

    Processed: 0.013, SQL: 9