查看原文
其他

Python可视化28|matplotlib绘制韦恩图(2-6组数据)

pythonic生物人 pythonic生物人 2022-09-11


"pythonic生物人"的第73篇分享

  • 韦恩图可以清晰的反映不同组数据共有和各自独有的部分
  • 本文手把手介绍如下两种python绘制venn图策略:
    matplotlib_venn【2~3组数据,可以更个性化设置】
    pyvenn【2~6组数据】

本文速览

欢迎随缘关注@pythonic生物人

  • 二组数据venn
  • 3组数据venn
  • 4组数据venn
  • 5组数据venn图
  • 6组数据venn

目录

1、 matplotlib_venn
(1)两组数据venn图
绘图数据格式
一些简单参数介绍 
所有圈外框属性设置 
单个圈特性设置
单个圈文本设置
添加额外注释 
多子图绘制venn图 
(2)3组数据venn图
基本参数介绍
个性化设置图中7部分每一部分


2、pyvenn
两组数据venn
3组数据venn
4组数据venn
5组数据venn
6组数据venn


python中Matplotlib并没有现成的函数可直接绘制venn图, 不过已经有前辈基于matplotlib.patches及matplotlib.path开发了两个轮子:

  • matplotlib_venn【2~3组数据】
  • pyvenn【2~6组数据】

1、 matplotlib_venn

该模块包含'venn2', 'venn2_circles',  'venn3', 'venn3_circles'四个关键函数,这里主要详细介绍'venn2','venn3'同理。

(1)两组数据venn图

matplotlib_venn.venn2(subsets, set_labels=('A', 'B'), set_colors=('r', 'g'), alpha=0.4, normalize_to=1.0, ax=None, subset_label_formatter=None)

  • 绘图数据格式

subsets参数接收绘图数据集,以下5种方式均可以,注意细微异同。

#导入依赖packages
import matplotlib.pyplot as plt
from matplotlib_venn import venn2,venn2_circles#记得安装matplotlib_venn(pip install matplotlib_venn 或者conda install matplotlib_venn)


# subsets参数
#绘图数据的格式,以下5种方式均可以,注意异同
subset = [[{1,2,3},{1,2,4}],#列表list(集合1,集合2)
          ({1,2,3},{1,2,4}),#元组tuple(集合1,集合2)
          {'10'1'01'1'11'2},#字典dict(A独有,B独有,AB共有)
          (332),####元组tuple(A有,B有,AB共有),注意和其它几种方式的异同点
          [3,3,2]#列表list(A有,B有,AB共有)           
         ]
for i in subset:
    my_dpi=100
    plt.figure(figsize=(500/my_dpi, 500/my_dpi), dpi=my_dpi)
    g=venn2(subsets=i)#默认数据绘制venn图,只需传入绘图数据
    plt.title('subsets=%s'%str(i))
    plt.show()

  • 一些简单参数介绍

my_dpi=150
plt.figure(figsize=(580/my_dpi, 580/my_dpi), dpi=my_dpi)#控制图尺寸的同时,使图高分辨率(高清)显示
g=venn2(subsets = [{1,2,3},{1,2,4}], #绘图数据集
        set_labels = ('Label 1''Label 2'), #设置组名
        set_colors=("#098154","#c72e29"),#设置圈的颜色,中间颜色不能修改
        alpha=0.6,#透明度
        normalize_to=1.0,#venn图占据figure的比例,1.0为占满
       )
plt.show()
  • 所有圈外框属性设置

my_dpi=150
plt.figure(figsize=(580/my_dpi, 580/my_dpi), dpi=my_dpi)
g=venn2(subsets = [{1,2,3},{1,2,4}],
        set_labels = ('Label 1''Label 2'),
        set_colors=("#098154","#c72e29"),
        alpha=0.6,
        normalize_to=1.0,
       )
g=venn2_circles(subsets = [{1,2,3},{1,2,4}], 
        linestyle='--', linewidth=0.8, color="black"#外框线型、线宽、颜色
       )
plt.show()
  • 单个圈特性设置

g.get_patch_by_id('10')返回一个matplotlib.patches.PathPatch对象,有诸多参数可个性化修改 ,详细见matplotlib官网。

my_dpi=150
plt.figure(figsize=(550/my_dpi, 550/my_dpi), dpi=my_dpi)

g=venn2(subsets = [{1,2,3},{1,2,4}], 
        set_labels = ('Label 1''Label 2'), 
        set_colors=("#098154","#c72e29"),
        alpha=0.6,
        normalize_to=1.0,
       )
g.get_patch_by_id('10').set_edgecolor('red')#左圈外框颜色
g.get_patch_by_id('10').set_linestyle('--')#左圈外框线型
g.get_patch_by_id('10').set_linewidth(2)#左圈外框线宽
g.get_patch_by_id('01').set_edgecolor('green')#右圈外框颜色
g.get_patch_by_id('11').set_edgecolor('blue')#中间圈外框颜色
plt.show()
  • 单个圈文本设置

g.get_label_by_id('10') 返回一个matplotlib.text.Text对象,有诸多参数可个性化修改 ,详细见matplotlib官网。

my_dpi=150
plt.figure(figsize=(600/my_dpi, 600/my_dpi), dpi=my_dpi)
g=venn2(subsets = [{1,2,3},{1,2,4}], 
        set_labels = ('Label 1''Label 2'), 
        set_colors=("#098154","#c72e29"),
        alpha=0.6,
        normalize_to=1.0,
       )
g.get_label_by_id('10').set_fontfamily('Microsoft YaHei')#左圈中1的字体设置为微软雅黑
g.get_label_by_id('10').set_fontsize(20)#1的大小设置为20
g.get_label_by_id('10').set_color('r')#1的颜色
g.get_label_by_id('10').set_rotation(45)#1的倾斜度
  • 添加额外注释

my_dpi=150
plt.figure(figsize=(580/my_dpi, 580/my_dpi), dpi=my_dpi)#控制图尺寸的同时,使图高分辨率(高清)显示
g=venn2(subsets = [{1,2,3},{1,2,4}], #绘图数据集
        set_labels = ('Label 1''Label 2'), #设置组名
        set_colors=("#098154","#c72e29"),#设置圈的颜色,中间颜色不能修改
        alpha=0.6,#透明度
        normalize_to=1.0,#venn图占据figure的比例,1.0为占满
       )

plt.annotate('I like this green part!'
             color='#098154',
             xy=g.get_label_by_id('10').get_position() - np.array([00.05]), 
             xytext=(-80,40),
             ha='center', textcoords='offset points'
             bbox=dict(boxstyle='round,pad=0.5', fc='#098154', alpha=0.6),#注释文字底纹
             arrowprops=dict(arrowstyle='-|>', connectionstyle='arc3,rad=0.5',color='#098154')#箭头属性设置
            )


plt.annotate('She like this red part!'
             color='#c72e29',
             xy=g.get_label_by_id('01').get_position() + np.array([00.05]), 
             xytext=(80,40),
             ha='center', textcoords='offset points'
             bbox=dict(boxstyle='round,pad=0.5', fc='#c72e29', alpha=0.6),
             arrowprops=dict(arrowstyle='-|>', connectionstyle='arc3,rad=0.5',color='#c72e29')
            )

plt.annotate('We both dislike this strange part!'
             color='black',
             xy=g.get_label_by_id('11').get_position() + np.array([00.05]), 
             xytext=(20,80),
             ha='center', textcoords='offset points'
             bbox=dict(boxstyle='round,pad=0.5', fc='grey', alpha=0.6),
             arrowprops=dict(arrowstyle='-|>', connectionstyle='arc3,rad=-0.5',color='black')
            )

plt.show()
  • 多子图绘制venn图

fig,axs=plt.subplots(1,3, figsize=(10,8),dpi=150)
g=venn2(subsets = [{1,2,3},{1,2,4}], 
        set_labels = ('Label 1''Label 2'), 
        set_colors=("#098154","#c72e29"),
        alpha=0.6,
        normalize_to=1.0,
        ax=axs[0],#该参数指定
       )
g=venn2(subsets = [{1,2,3,4,5,6},{1,2,4,5,6,7,8}], 
        set_labels = ('Label 3''Label 4'), 
        set_colors=("#098154","#c72e29"),
        alpha=0.6,
        normalize_to=1.0,
        ax=axs[1],
       )
g=venn2(subsets = [{0,1,2,3},{1,2,4}], 
        set_labels = ('Label 5''Label 6'), 
        set_colors=("#098154","#c72e29"),
        alpha=0.6,
        normalize_to=1.0,
        ax=axs[2],
       )
plt.show()

(2)3组数据venn图

matplotlib_venn.venn3(subsets, set_labels=('A', 'B', 'C'), set_colors=('r', 'g', 'b'), alpha=0.4, normalize_to=1.0, ax=None, subset_label_formatter=None)
参数和venn2几乎一样,介绍几个重要参数

  • 基本参数介绍

my_dpi=150
plt.figure(figsize=(600/my_dpi, 600/my_dpi), dpi=my_dpi)#控制图尺寸的同时,使图高分辨率(高清)显示
g=venn3(subsets = [{1,2,3},{1,2,4},{2,6,7}], #传入三组数据
        set_labels = ('Label 1''Label 2','Label 3'), #设置组名
        set_colors=("#01a2d9""#31A354""#c72e29"),#设置圈的颜色,中间颜色不能修改
        alpha=0.8,#透明度
        normalize_to=1.0,#venn图占据figure的比例,1.0为占满
       )
plt.show()
  • 个性化设置图中7部分每一部分

(100, 010, 110, 001, 101, 011, 111)分别代替每一小块,那么代替的是那一小块了?

my_dpi=150
plt.figure(figsize=(600/my_dpi, 600/my_dpi), dpi=my_dpi)
g=venn3(subsets = [{1,2,3},{1,2,4},{2,6,7}],
        set_labels = ('Label 1''Label 2','Label 3'),
        set_colors=("#01a2d9""#31A354""#c72e29"),
        alpha=0.8,
        normalize_to=1.0,
       )

for i in list('100, 010, 110, 001, 101, 011, 111'.split(', ')):
    g.get_label_by_id('%s'%i).set_text('%s'%i)#修改每个组分的文本
    
#然后就可以如同venn2中那样个性化设置了
g.get_label_by_id('110').set_color('red')#1的颜色
g.get_patch_by_id('110').set_edgecolor('red')

plt.show()

2、pyvenn

同样,该库还是基于matplotlib.patches二次开发;区别于上文,pyvenn支持2到6组数据;matplotlib_venn更加灵活多变。
pyvenn具有'venn2', 'venn3', 'venn4', 'venn5', 'venn6'五大主要函数,这里主要介绍venn2,其它同理。

  • 两组数据venn

venn.draw_annotate、venn.draw_text、venn.venn2中的fill()参数非常助于个性化设置。

venn2(labels, names=['A', 'B'], **options)

import matplotlib.pyplot as plt

#添加pyvenn路径
import sys
sys.path.append(r'path\pyvenn-master')
import venn

mycolor=[[0.105882352941176470.61960784313725490.4666666666666667,0.6],
         [0.90588235294117650.16078431372549020.54117647058823530.6]]

labels = venn.get_labels([[1,2,3,4,5,6],[1,2,4,5,6,7,8]], fill=['number'
                                                                'logic',#开启每个组分代码
                                                                'percent'#每个组分的百分比
                                                               ],
                        )
fig, ax = venn.venn2(labels,
                    names=list('AB'),
                    dpi=96,
                    colors=mycolor,#传入RPGA色号,直接传hex色号或者RGB会导致重叠部分被覆盖
                    fontsize=15,#控制组名及中间数字大小
                   
                    
                    )
plt.style.use('seaborn-whitegrid')
ax.set_axis_on()#开启坐标网格线
#ax.set_title('venn2')



# 提取plt.annotate部分参数
venn.draw_annotate(fig, ax, x=0.3, y=0.18#箭头的位置
                   textx=0.1, texty=0.05#箭尾的位置
                   text='Aoligei!', color='r'#注释文本属性
                   arrowcolor='r',#箭头的颜色等属性
                  )

#添加文本
venn.draw_text(fig, ax, x=0.25, y=0.2, text='number:logic(percent)',
               fontsize=12, ha='center', va='center')
  • 3组数据venn

labels = venn.get_labels([range(10), range(515), range(38)], fill=['number',
                                                                       'logic',
                                                                       'percent'
                                                                      ]
                        )
fig, ax = venn.venn3(labels, names=list('ABC'),dpi=96)
fig.show()
  • 4组数据venn

labels = venn.get_labels([range(10), range(515), range(38), range(817)], fill=['number'
                                                                                     'logic',
                                                                                     'percent'                                                                                     
                                                                                    ])
fig, ax = venn.venn4(labels, names=list('ABCD'))
fig.show()
  • 5组数据venn

labels = venn.get_labels([range(10), range(515), range(38), range(817), range(1020)], fill=['number',
                                                                                                    'logic',
                                                                                                    'percent'
                                                                                                   ])
fig, ax = venn.venn5(labels, names=list('ABCDEF'))
fig.show()
  • 6组数据venn

labels = venn.get_labels([range(10), range(515), range(38), range(817), range(1020), range(1325)], fill=['number''logic','percent'])
fig, ax = venn.venn6(labels, names=list('ABCDEF'))
fig.show()


参考资料

  • https://github.com/konstantint/matplotlib-venn
  • https://github.com/tctianchi/pyvenn

欢迎随缘关注@pythonic生物人



"点赞"、"在看"鼓励下呗

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存