查看原文
其他

65 个 Matplotlib 可视化案例

The following article is from 萝卜大杂烩 Author 周萝卜

今天分享python可视化技巧整理,从基础到进阶应有尽有,建议收藏。

Matplotlib 作为 Python 家族当中最为著名的画图工具,基本的操作还是要掌握的,今天就来分享一波。

目录:

  • 启用和检查交互模式

  • 在 Matplotlib 中绘制折线图

  • 绘制带有标签和图例的多条线的折线图

  • 在 Matplotlib 中绘制带有标记的折线图

  • 改变 Matplotlib 中绘制的图形的大小

  • 在 Matplotlib 中设置轴限制

  • 使用 Python Matplotlib 显示背景网格

  • 使用 Python Matplotlib 将绘图保存到图像文件

  • 将图例放在 plot 的不同位置

  • 绘制具有不同标记大小的线条

  • 用灰度线绘制折线图

  • 以高 dpi 绘制 PDF 输出

  • 绘制不同颜色的多线图

  • 语料库创建词云

  • 使用特定颜色在 Matplotlib Python 中绘制图形

  • NLTK 词汇色散图

  • 绘制具有不同线条图案的折线图

  • 更新 Matplotlib 折线图中的字体外观

  • 用颜色名称绘制虚线和点状图

  • 以随机坐标绘制所有可用标记

  • 绘制一个非常简单的条形图

  • 在 X 轴上绘制带有组数据的条形图

  • 具有不同颜色条形的条形图

  • 使用 Matplotlib 中的特定值改变条形图中每个条的颜色

  • 在 Matplotlib 中绘制散点图

  • 使用单个标签绘制散点图

  • 用标记大小绘制散点图

  • 在散点图中调整标记大小和颜色

  • 在 Matplotlib 中应用样式表

  • 自定义网格颜色和样式

  • 在 Python Matplotlib 中绘制饼图

  • 在 Matplotlib 饼图中为楔形设置边框

  • 在 Python Matplotlib 中设置饼图的方向

  • 在 Matplotlib 中绘制具有不同颜色主题的饼图

  • 在 Python Matplotlib 中打开饼图的轴

  • 具有特定颜色和位置的饼图

  • 在 Matplotlib 中绘制极坐标图

  • 在 Matplotlib 中绘制半极坐标图

  • Matplotlib 中的极坐标等值线图

  • 绘制直方图

  • 在 Matplotlib 直方图中选择 bins

  • 在 Matplotlib 中绘制没有条形的直方图

  • 使用 Matplotlib 同时绘制两个直方图

  • 绘制具有特定颜色、边缘颜色和线宽的直方图

  • 用颜色图绘制直方图

  • 更改直方图上特定条的颜色

  • 箱线图

  • 箱型图按列数据分组

  • 更改箱线图中的箱体颜色

  • 更改 Boxplot 标记样式、标记颜色和标记大小

  • 用数据系列绘制水平箱线图

  • 箱线图调整底部和左侧

  • 使用 Pandas 数据在 Matplotlib 中生成热图

  • 带有中间颜色文本注释的热图

  • 热图显示列和行的标签并以正确的方向显示数据

  • 将 NA cells 与 HeatMap 中的其他 cells 区分开来

  • 在 matplotlib 中创建径向热图

  • 在 Matplotlib 中组合两个热图

  • 使用 Numpy 和 Matplotlib 创建热图日历

  • 在 Python 中创建分类气泡图

  • 使用 Numpy 和 Matplotlib 创建方形气泡图

  • 使用 Numpy 和 Matplotlib 创建具有气泡大小的图例

  • 使用 Matplotlib 堆叠条形图

  • 在同一图中绘制多个堆叠条

  • Matplotlib 中的水平堆积条形图

1启用和检查交互模式

import matplotlib as mpl
import matplotlib.pyplot as plt
 
# Set the interactive mode to ON
plt.ion()
 
# Check the current status of interactive mode
print(mpl.is_interactive())

Output:

True

2在 Matplotlib 中绘制折线图

import matplotlib.pyplot as plt

#Plot a line graph
plt.plot([515])

# Add labels and title
plt.title("Interactive Plot")
plt.xlabel("X-axis")
plt.ylabel("Y-axis")
plt.show()

Output:

3绘制带有标签和图例的多条线的折线图

import matplotlib.pyplot as plt

#Plot a line graph
plt.plot([515], label='Rice')
plt.plot([36], label='Oil')
plt.plot([8.001014.2], label='Wheat')
plt.plot([1.954126.985475.414115.997.9999], label='Coffee')

# Add labels and title
plt.title("Interactive Plot")
plt.xlabel("X-axis")
plt.ylabel("Y-axis")

plt.legend()
plt.show()

Output:

4在 Matplotlib 中绘制带有标记的折线图

import matplotlib.pyplot as plt
 
# Changing default values for parameters individually
plt.rc('lines', linewidth=2, linestyle='-', marker='*')
plt.rcParams['lines.markersize'] = 25
plt.rcParams['font.size'] = '10.0'
 
#Plot a line graph
plt.plot([1020304050])
# Add labels and title
plt.title("Interactive Plot")
plt.xlabel("X-axis")
plt.ylabel("Y-axis")
 
plt.show()

Output:

5改变 Matplotlib 中绘制的图形的大小

import matplotlib.pyplot as plt
 
# Changing default values for parameters individually
plt.rc('lines', linewidth=2, linestyle='-', marker='*')
 
plt.rcParams["figure.figsize"] = (48)
 
# Plot a line graph
plt.plot([1020304050607080])
# Add labels and title
plt.title("Interactive Plot")
plt.xlabel("X-axis")
plt.ylabel("Y-axis")
 
plt.show()

Output:

6在 Matplotlib 中设置轴限制

import matplotlib.pyplot as plt

data1 = [11121314151617]
data2 = [15.512.511.79.5012.5011.5014.75]

# Add labels and title
plt.title("Interactive Plot")
plt.xlabel("X-axis")
plt.ylabel("Y-axis")

# Set the limit for each axis
plt.xlim(1117)
plt.ylim(916)

# Plot a line graph
plt.plot(data1, data2)

plt.show()

Output:

7使用 Python Matplotlib 显示背景网格

import matplotlib.pyplot as plt

plt.grid(True, linewidth=0.5, color='#ff0000', linestyle='-')

#Plot a line graph
plt.plot([1020304050])
# Add labels and title
plt.title("Interactive Plot")
plt.xlabel("X-axis")
plt.ylabel("Y-axis")

plt.show()

Output:


8使用 Python Matplotlib 将绘图保存到图像文件

import matplotlib.pyplot as plt

plt.grid(True, linewidth=0.5, color='#ff0000', linestyle='-')

#Plot a line graph
plt.plot([1020304050])
# Add labels and title
plt.title("Interactive Plot")
plt.xlabel("X-axis")
plt.ylabel("Y-axis")

plt.savefig("foo.png", bbox_inches='tight')

Output:

9将图例放在 plot 的不同位置

import matplotlib.pyplot as plt
 
#Plot a line graph
plt.plot([515], label='Rice')
plt.plot([36], label='Oil')
plt.plot([8.001014.2], label='Wheat')
plt.plot([1.954126.985475.414115.997.9999], label='Coffee')
 
# Add labels and title
plt.title("Interactive Plot")
plt.xlabel("X-axis")
plt.ylabel("Y-axis")
 
plt.legend(bbox_to_anchor=(1.11.05))
 
plt.show()

Output:

10绘制具有不同标记大小的线条

import matplotlib.pyplot as plt
 
y1 = [1214151819131516]
y2 = [2224252829232526]
y3 = [3234353839333536]
y4 = [4244454849434546]
y5 = [5254555859535556]
 
 
# Plot lines with different marker sizes
plt.plot(y1, y2, label = 'Y1-Y2', lw=2, marker='s', ms=10# square
plt.plot(y1, y3, label = 'Y1-Y3', lw=2, marker='^', ms=10# triangle
plt.plot(y1, y4, label = 'Y1-Y4', lw=2, marker='o', ms=10# circle
plt.plot(y1, y5, label = 'Y1-Y5', lw=2, marker='D', ms=10# diamond
plt.plot(y2, y5, label = 'Y2-Y5', lw=2, marker='P', ms=10# filled plus sign
 
plt.legend()
plt.show()

Output:

11用灰度线绘制折线图

import matplotlib.pyplot as plt

# Plot a line graph with grayscale lines 
plt.plot([515], label='Rice', c='0.15')
plt.plot([36], label='Oil', c='0.35')
plt.plot([8.001014.2], label='Wheat',  c='0.55')
plt.plot([1.954126.985475.414115.997.9999], label='Coffee',  c='0.85')

# Add labels and title
plt.title("Interactive Plot")
plt.xlabel("X-axis")
plt.ylabel("Y-axis")

plt.legend()
plt.show()

Output:

12以高 dpi 绘制 PDF 输出

import matplotlib.pyplot as plt

#Plot a line graph
plt.plot([515], label='Rice')
plt.plot([36], label='Oil')
plt.plot([8.001014.2], label='Wheat')
plt.plot([1.954126.985475.414115.997.9999], label='Coffee')

# Add labels and title
plt.title("Interactive Plot")
plt.xlabel("X-axis")
plt.ylabel("Y-axis")

plt.savefig('output.pdf', dpi=1200, format='pdf', bbox_inches='tight')

Output:

生成带有图片的pdf文件

13绘制不同颜色的多线图

import matplotlib.pyplot as plt
 
for i in range(10):
    plt.plot([i]*5, c='C'+str(i), label='C'+str(i))
 
# Plot a line graph
plt.xlim(05)
 
# Add legend
plt.legend()
 
# Display the graph on the screen
plt.show()

Output:

14语料库创建词云

import nltk
from nltk.corpus import webtext
from nltk.probability import FreqDist
from wordcloud import WordCloud
import matplotlib.pyplot as plt

nltk.download('webtext')
wt_words = webtext.words('testing.txt')  # Sample data
data_analysis = nltk.FreqDist(wt_words)

filter_words = dict([(m, n) for m, n in data_analysis.items() if len(m) > 3])

wcloud = WordCloud().generate_from_frequencies(filter_words)

# Plotting the wordcloud
plt.imshow(wcloud, interpolation="bilinear")

plt.axis("off")
(-0.5399.5199.5-0.5)
plt.show()

Output:

15使用特定颜色在 Matplotlib Python 中绘制图形

import matplotlib.pyplot as plt

#Plot a line graph with specific colors
plt.plot([515], label='Rice', c='C7')
plt.plot([36], label='Oil', c='C8')
plt.plot([8.001014.2], label='Wheat',  c='C4')
plt.plot([1.954126.985475.414115.997.9999], label='Coffee',  c='C6')

# Add labels and title
plt.title("Interactive Plot")
plt.xlabel("X-axis")
plt.ylabel("Y-axis")

plt.legend()
plt.show()

Output

16NLTK 词汇色散图

import nltk
from nltk.corpus import webtext
from nltk.probability import FreqDist
from wordcloud import WordCloud
import matplotlib.pyplot as plt

words = ['data''science''dataset']

nltk.download('webtext')
wt_words = webtext.words('testing.txt')  # Sample data

points = [(x, y) for x in range(len(wt_words))
          for y in range(len(words)) if wt_words[x] == words[y]]

if points:
    x, y = zip(*points)
else:
    x = y = ()

plt.plot(x, y, "rx", scalex=.1)
plt.yticks(range(len(words)), words, color="b")
plt.ylim(-1, len(words))
plt.title("Lexical Dispersion Plot")
plt.xlabel("Word Offset")
plt.show()

Output:

17绘制具有不同线条图案的折线图

import matplotlib.pyplot as plt

# Plot a line graph with grayscale lines 
plt.plot([511], label='Rice', c='C1', ls='--')
plt.plot([216], label='Oil', c='C4', ls='-.')
plt.plot([814], label='Wheat', c='C7', ls=':')

# Add labels and title
plt.title("Interactive Plot")
plt.xlabel("X-axis")
plt.ylabel("Y-axis")

plt.legend()
plt.show()

Output:

18更新 Matplotlib 折线图中的字体外观

import matplotlib.pyplot as plt

fontparams = {'font.size'12'font.weight':'bold',
              'font.family':'arial''font.style':'italic'}

plt.rcParams.update(fontparams)

# Plot a line graph with specific font style
plt.plot([511], label='Rice')
plt.plot([216], label='Oil')
plt.plot([814], label='Wheat')

labelparams = {'size'20'weight':'semibold',
              'family':'serif''style':'italic'}

# Add labels and title
plt.title("Interactive Plot", labelparams)
plt.xlabel("X-axis", labelparams)
plt.ylabel("Y-axis", labelparams)

plt.legend()
plt.show()

Output:

19用颜色名称绘制虚线和点状图

import matplotlib.pyplot as plt
 
x = [24589131516]
y = [134710111417]
 
# Plot a line graph with dashed and maroon color
plt.plot(x, y, label='Price', c='maroon', ls=('dashed'), lw=2)
 
# Plot a line graph with dotted and teal color
plt.plot(y, x, label='Rank', c='teal', ls=('dotted'), lw=2)
 
plt.legend()
plt.show()

Output:

20以随机坐标绘制所有可用标记

import numpy as np
import matplotlib.pyplot as plt
from matplotlib.lines import Line2D
 
# Prepare 50 random numbers to plot
n1 = np.random.rand(50)
n2 = np.random.rand(50)
 
markerindex = np.random.randint(0, len(Line2D.markers), 50)
 
for x, y in enumerate(Line2D.markers):
    i = (markerindex == x)
    plt.scatter(n1[i], n2[i], marker=y)
 
plt.show()

Output:

21绘制一个非常简单的条形图

import matplotlib.pyplot as plt

year = [200120022003200420052006]
unit = [5060754570105]

# Plot the bar graph
plot = plt.bar(year, unit)

# Add the data value on head of the bar
for value in plot:
    height = value.get_height()
    plt.text(value.get_x() + value.get_width()/2.,
             1.002*height,'%d' % int(height), ha='center', va='bottom')

# Add labels and title
plt.title("Bar Chart")
plt.xlabel("Year")
plt.ylabel("Unit")

# Display the graph on the screen
plt.show()

Output:

22在 X 轴上绘制带有组数据的条形图

import pandas as pd
import matplotlib.pyplot as plt
 
df = pd.DataFrame([[1234], [71.42.12.8], [5.51.581.2],
                   [1.51.418], [7118], [5492]],
                  columns=['Apple''Orange''Banana''Pear'],
                  index=[1713202835])
width = 2
bottom = 0
 
for i in df.columns:
    plt.bar(df.index, df[i], width=width, bottom=bottom)
    bottom += df[i]
 
plt.legend(df.columns)
plt.tight_layout()
 
# Display the graph on the screen
plt.show()

Output:

23具有不同颜色条形的条形图

import matplotlib.pyplot as plt
import matplotlib as mp
import numpy as np
 
data = [86712910589]
 
# Colorize the graph based on likeability:
likeability_scores = np.array(data)
 
data_normalizer = mp.colors.Normalize()
color_map = mp.colors.LinearSegmentedColormap(
    "my_map",
    {
        "red": [(01.01.0),
                (1.0.5.5)],
        "green": [(00.50.5),
                  (1.000)],
        "blue": [(00.500.5),
                 (1.000)]
    }
)
 
# Map xs to numbers:
N = len(data)
x_nums = np.arange(1, N+1)
 
# Plot a bar graph:
plt.bar(
    x_nums,
    data,
    align="center",
    color=color_map(data_normalizer(likeability_scores))
)
 
plt.xticks(x_nums, data)
plt.show()

Output:

24使用 Matplotlib 中的特定值改变条形图中每个条的颜色

import matplotlib.pyplot as plt
import matplotlib.cm as cm
from matplotlib.colors import Normalize
from numpy.random import rand

data = [235681275]
fig, ax = plt.subplots(11)

# Get a color map
my_cmap = cm.get_cmap('jet')

# Get normalize function (takes data in range [vmin, vmax] -> [0, 1])
my_norm = Normalize(vmin=0, vmax=8)

ax.bar(range(8), rand(8), color=my_cmap(my_norm(data)))
plt.show()

Output:

25在 Matplotlib 中绘制散点图

import matplotlib.pyplot as plt

x1 = [214591811221621822]
x2 = [1212514919822262832]

plt.scatter(x1, x2)

# Set X and Y axis labels
plt.xlabel('Demand')
plt.ylabel('Price')

#Display the graph
plt.show()

Output:

26使用单个标签绘制散点图

import numpy as np
import matplotlib.pyplot as plt

N = 6
data = np.random.random((N, 4))
labels = ['point{0}'.format(i) for i in range(N)]

plt.subplots_adjust(bottom=0.1)
plt.scatter(
    data[:, 0], data[:, 1], marker='o', c=data[:, 2], s=data[:, 3] * 1500,
    cmap=plt.get_cmap('Spectral'))

for label, x, y in zip(labels, data[:, 0], data[:, 1]):
    plt.annotate(
        label,
        xy=(x, y), xytext=(-2020),
        textcoords='offset points', ha='right', va='bottom',
        bbox=dict(boxstyle='round,pad=0.5', fc='yellow', alpha=0.5),
        arrowprops=dict(arrowstyle='->', connectionstyle='arc3,rad=0'))

plt.show()

Output:

27用标记大小绘制散点图

import matplotlib.pyplot as plt

x1 = [214591811221621822]
x2 = [1212514919822262832]

plt.figure(1)
# You can specify the marker size two ways directly:
plt.plot(x1, 'bo', markersize=20)  # blue circle with size 10 
plt.plot(x2, 'ro', ms=10,)  # ms is just an alias for markersize
plt.show()

Output:

28在散点图中调整标记大小和颜色

import matplotlib.pyplot as plt
import matplotlib.colors

# Prepare a list of integers
val = [236914]

# Prepare a list of sizes that increases with values in val
sizevalues = [i**2*50+50 for i in val]

# Prepare a list of colors
plotcolor = ['red','orange','yellow','green','blue']

# Draw a scatter plot of val points with sizes in sizevalues and
# colors in plotcolor
plt.scatter(val, val, s=sizevalues, c=plotcolor)

# Set axis limits to show the markers completely
plt.xlim(020)
plt.ylim(020)

plt.show()

Output:

29在 Matplotlib 中应用样式表

import matplotlib.pyplot as plt
import matplotlib.colors
import matplotlib as mpl

mpl.style.use('seaborn-darkgrid')

# Prepare a list of integers
val = [236914]

# Prepare a list of sizes that increases with values in val
sizevalues = [i**2*50+50 for i in val]

# Prepare a list of colors
plotcolor = ['red','orange','yellow','green','blue']

# Draw a scatter plot of val points with sizes in sizevalues and
# colors in plotcolor
plt.scatter(val, val, s=sizevalues, c=plotcolor)

# Draw grid lines with red color and dashed style
plt.grid(color='blue', linestyle='-.', linewidth=0.7)

# Set axis limits to show the markers completely
plt.xlim(020)
plt.ylim(020)

plt.show()

Output:

30自定义网格颜色和样式

import matplotlib.pyplot as plt
import matplotlib.colors

# Prepare a list of integers
val = [236914]

# Prepare a list of sizes that increases with values in val
sizevalues = [i**2*50+50 for i in val]

# Prepare a list of colors
plotcolor = ['red','orange','yellow','green','blue']

# Draw a scatter plot of val points with sizes in sizevalues and
# colors in plotcolor
plt.scatter(val, val, s=sizevalues, c=plotcolor)

# Draw grid lines with red color and dashed style
plt.grid(color='red', linestyle='-.', linewidth=0.7)

# Set axis limits to show the markers completely
plt.xlim(020)
plt.ylim(020)

plt.show()

Output:

31在 Python Matplotlib 中绘制饼图

import matplotlib.pyplot as plt


labels = ['India''Canada''Japan''Australia''Russia']
sizes = [3119151421]  # Add upto 100%

# Plot the pie chart
plt.pie(sizes, labels=labels, autopct='%1.1f%%', startangle=90)

# Equal aspect ratio ensures that pie is drawn as a circle.
plt.axis('equal')

# Display the graph onto the screen
plt.show()

Output:

32在 Matplotlib 饼图中为楔形设置边框

import matplotlib.pyplot as plt
 
labels = ['India''Canada''Japan''Australia''Russia']
sizes = [3119151421]  # Add upto 100%
 
# Plot the pie chart
plt.pie(sizes, labels=labels, autopct='%1.1f%%', startangle=90,
        wedgeprops={"edgecolor":"0",'linewidth'1,
                    'linestyle''dashed''antialiased'True})
 
# Equal aspect ratio ensures that pie is drawn as a circle.
plt.axis('equal')
 
# Display the graph onto the screen
plt.show()

Output:

33在 Python Matplotlib 中设置饼图的方向

import matplotlib.pyplot as plt
 
labels = ['India''Canada''Japan''Australia''Russia']
sizes = [3119151421]  # Add upto 100%
 
# Plot the pie chart
plt.pie(sizes, labels=labels, counterclock=False, startangle=90)
 
# Equal aspect ratio ensures that pie is drawn as a circle.
plt.axis('equal')
 
# Display the graph onto the screen
plt.show()

Output:

34在 Matplotlib 中绘制具有不同颜色主题的饼图

import matplotlib.pyplot as plt

sizes = [122311171924291112975321]
labels = ["Market %s" % i for i in sizes]

fig1, ax1 = plt.subplots(figsize=(55))
fig1.subplots_adjust(0.3011)

theme = plt.get_cmap('copper')
ax1.set_prop_cycle("color", [theme(1. * i / len(sizes))
                             for i in range(len(sizes))])

_, _ = ax1.pie(sizes, startangle=90, radius=1800)

ax1.axis('equal')

total = sum(sizes)
plt.legend(
    loc='upper left',
    labels=['%s, %1.1f%%' % (
        l, (float(s) / total) * 100)
            for l, s in zip(labels, sizes)],
    prop={'size'11},
    bbox_to_anchor=(0.01),
    bbox_transform=fig1.transFigure
)

plt.show()

Output:

35在 Python Matplotlib 中打开饼图的轴

import matplotlib.pyplot as plt

sizes = [122311171924291112975321]
labels = ["Market %s" % i for i in sizes]

fig1, ax1 = plt.subplots(figsize=(55))
fig1.subplots_adjust(0.10.111)

theme = plt.get_cmap('jet')
ax1.set_prop_cycle("color", [theme(1. * i / len(sizes))
                             for i in range(len(sizes))])

_, _ = ax1.pie(sizes, startangle=90, radius=1800, frame=True)

ax1.axis('equal')
plt.show()

Output:

36具有特定颜色和位置的饼图

import numpy as np
import matplotlib.pyplot as plt

fig =plt.figure(figsize = (4,4))
ax11 = fig.add_subplot(111)
# Data to plot
labels = 'Python''C++''Ruby''Java'
sizes = [25013075200]
colors = ['gold''yellowgreen''lightcoral''lightskyblue']

# Plot
w,l,p = ax11.pie(sizes,  labels=labels, colors=colors,
                 autopct='%1.1f%%', startangle=140, pctdistance=1, radius=0.5)

pctdists = [.8.5.4.2]

for t,d in zip(p, pctdists):
    xi,yi = t.get_position()
    ri = np.sqrt(xi**2+yi**2)
    phi = np.arctan2(yi,xi)
    x = d*ri*np.cos(phi)
    y = d*ri*np.sin(phi)
    t.set_position((x,y))

plt.axis('equal')
plt.show()

Output:

37在 Matplotlib 中绘制极坐标图

import matplotlib.pyplot as plt
import numpy as np

employee = ["Sam""Rony""Albert""Chris""Jahrum"]
actual = [455355615745]
expected = [505560655550]

# Initialise the spider plot by setting figure size and polar projection
plt.figure(figsize=(106))
plt.subplot(polar=True)

theta = np.linspace(02 * np.pi, len(actual))

# Arrange the grid into number of sales equal parts in degrees
lines, labels = plt.thetagrids(range(0360, int(360/len(employee))), (employee))

# Plot actual sales graph
plt.plot(theta, actual)
plt.fill(theta, actual, 'b', alpha=0.1)

# Plot expected sales graph
plt.plot(theta, expected)

# Add legend and title for the plot
plt.legend(labels=('Actual''Expected'), loc=1)
plt.title("Actual vs Expected sales by Employee")

# Dsiplay the plot on the screen
plt.show()

Output:

38在 Matplotlib 中绘制半极坐标图

import matplotlib.pyplot as plt
import numpy as np

theta = np.linspace(0, np.pi)
r = np.sin(theta)

fig = plt.figure()
ax = fig.add_subplot(111, polar=True)
c = ax.scatter(theta, r, c=r, s=10, cmap='hsv', alpha=0.75)

ax.set_thetamin(0)
ax.set_thetamax(180)

plt.show()

Output:

39Matplotlib 中的极坐标等值线图

import numpy as np
import matplotlib.pyplot as plt

# Using linspace so that the endpoint of 360 is included
actual = np.radians(np.linspace(036020))
expected = np.arange(07010)

r, theta = np.meshgrid(expected, actual)
values = np.random.random((actual.size, expected.size))

fig, ax = plt.subplots(subplot_kw=dict(projection='polar'))
ax.contourf(theta, r, values)

plt.show()

Output:

40绘制直方图

import numpy as np
import matplotlib.pyplot as plt

# Data in numpy array
exp_data = np.array([121513201920111911121913
                    12106193110446537
                    127981211111819181936
                    569111014141617171902
                    03146687767111110
                    1110131315182019110816
                    191917161111013153869
                    1015192456911109109
                    15161813])

# Plot the distribution of numpy data
plt.hist(exp_data, bins = 19)

# Add axis labels
plt.xlabel("Year")
plt.ylabel("Salary")
plt.title("Example of Histogram Plot")

plt.show()

Output:

41在 Matplotlib 直方图中选择 bins

import numpy as np
import matplotlib.pyplot as plt

# Data in numpy array
data = np.array([121513201920111911121913
                    12106193110446537
                    127981211111819181936
                    569111014141617171902
                    03146687767111110
                    1110131315182019110816
                    191917161111013153869
                    1015192456911109109
                    15161813])

# Plot the distribution of numpy data
ax = plt.hist(data, bins=np.arange(min(data), max(data) + 0.250.25), align='left')
# Add axis labels
plt.xlabel("Year")
plt.ylabel("Salary")
plt.title("Example of Histogram Plot")

plt.show()

Output:

42在 Matplotlib 中绘制没有条形的直方图

import numpy as np
import matplotlib.pyplot as plt

# Data in numpy array
data = np.array([121513201920111911121913,
                 12106193110446537,
                 127981211111819181936,
                 569111014141617171902,
                 03146687767111110,
                 1110131315182019110816,
                 191917161111013153869,
                 1015192456911109109,
                 15161813])

bins, edges = np.histogram(data, 21, normed=1)
left, right = edges[:-1], edges[1:]
X = np.array([left, right]).T.flatten()
Y = np.array([bins, bins]).T.flatten()

plt.plot(X, Y)
plt.show()

Output:

43使用 Matplotlib 同时绘制两个直方图

import numpy as np
import matplotlib.pyplot as plt

age = np.random.normal(loc=1, size=100# a normal distribution
salaray = np.random.normal(loc=-1, size=10000# a normal distribution

_, bins, _ = plt.hist(age, bins=50, range=[-66], density=True)
_ = plt.hist(salaray, bins=bins, alpha=0.5, density=True)
plt.show()

Output:

44绘制具有特定颜色、边缘颜色和线宽的直方图

import numpy as np
import matplotlib.pyplot as plt

# Data in numpy array
exp_data = np.array([121513201920111911121913
                    12106193110446537
                    127981211111819181936
                    569111014141617171902
                    03146687767111110
                    1110131315182019110816
                    191917161111013153869
                    1015192456911109109
                    15161813])

# Plot the distribution of numpy data
plt.hist(exp_data, bins=21, align='left', color='b', edgecolor='red',
              linewidth=1)

# Add axis labels
plt.xlabel("Year")
plt.ylabel("Salary")
plt.title("Example of Histogram Plot")

plt.show()

Output:

45用颜色图绘制直方图

import numpy as np
import matplotlib.pyplot as plt

# Data in numpy array
data = np.array([121513201920111911121913
                    12106193110446537
                    127981211111819181936
                    569111014141617171902
                    03146687767111110
                    1110131315182019110816
                    191917161111013153869
                    1015192456911109109
                    15161813])

cm = plt.cm.RdBu_r

n, bins, patches = plt.hist(data, 25, normed=1, color='green')
for i, p in enumerate(patches):
    plt.setp(p, 'facecolor', cm(i/25)) # notice the i/25

plt.show()

Output:

46更改直方图上特定条的颜色

import pandas as pd
import matplotlib.pyplot as plt

s = pd.Series([121513201920111911121913
                    12106193110446537
                    127981211111819181936
                    569111014141617171902
                    03146687767111110
                    1110131315182019110816
                    191917161111013153869
                    1015192456911109109
                    15161813])

p = s.plot(kind='hist', bins=50, color='orange')

bar_value_to_label = 5

min_distance = float("inf")  # initialize min_distance with infinity
index_of_bar_to_label = 0
for i, rectangle in enumerate(p.patches):  # iterate over every bar
    tmp = abs(  # tmp = distance from middle of the bar to bar_value_to_label
        (rectangle.get_x() +
            (rectangle.get_width() * (1 / 2))) - bar_value_to_label)
    if tmp < min_distance:  # we are searching for the bar with x cordinate
                            # closest to bar_value_to_label
        min_distance = tmp
        index_of_bar_to_label = i
p.patches[index_of_bar_to_label].set_color('b')

plt.show()

Output:

47箱线图

import matplotlib.pyplot as plt
import pandas as pd

df = pd.DataFrame([[10203040], [7142128], [1515812],
                   [151418], [7118], [5492]],
                  columns=['Apple''Orange''Banana''Pear'],
                  index=['Basket1''Basket2''Basket3''Basket4',
                         'Basket5''Basket6'])

df.boxplot(['Apple''Orange''Banana''Pear'])
plt.show()

Output:

48箱型图按列数据分组

import matplotlib.pyplot as plt
import pandas as pd
 
employees = pd.DataFrame({
    'EmpCode': ['Emp001''Emp002''Emp003''Emp004''Emp005''Emp006'
                , 'Emp007''Emp008''Emp009''Emp010''Emp011''Emp012'
                , 'Emp013''Emp014''Emp015''Emp016''Emp017''Emp018'
                , 'Emp019''Emp020'],
    'Occupation': ['Chemist''Statistician''Statistician''Statistician',
                   'Programmer''Chemist''Statistician''Statistician',
                   'Statistician''Programmer''Chemist''Statistician',
                   'Statistician''Statistician''Programmer''Chemist',
                   'Statistician''Statistician''Statistician''Programmer'
                   ],
    'Age': [23243429402526294041403541293335,
            29303637]})
 
employees.boxplot(column=['Age'], by=['Occupation'])
 
plt.show()

Output:

49更改箱线图中的箱体颜色

import matplotlib.pyplot as plt
import pandas as pd

df = pd.DataFrame([[10203040], [7142128], [1515812],
                   [151418], [7118], [5492]],
                  columns=['Apple''Orange''Banana''Pear'],
                  index=['Basket1''Basket2''Basket3''Basket4',
                         'Basket5''Basket6'])

box = plt.boxplot(df, patch_artist=True)

colors = ['blue''green''purple''tan''pink''red']

for patch, color in zip(box['boxes'], colors):
    patch.set_facecolor(color)

plt.show()

Output:

50更改 Boxplot 标记样式、标记颜色和标记大小

import matplotlib.pyplot as plt
import pandas as pd

df = pd.DataFrame([[10203040], [71421128], [15158912],
                   [-151418], [7-1118], [5492]],
                  columns=['Apple''Orange''Banana''Pear'],
                  index=['Basket1''Basket2''Basket3''Basket4',
                         'Basket5''Basket6'])


flierprops = dict(marker='+', markerfacecolor='g', markersize=15,
                  linestyle='none', markeredgecolor='r')

df.boxplot(['Apple''Orange''Banana''Pear'], flierprops=flierprops)


plt.show()

Output:

51用数据系列绘制水平箱线图

import matplotlib.pyplot as plt

data = [-121513-2019201119-11121910
                    121061931104496537
                    1277981211111819181936
                    569111018141617171902
                    0314668776979111110
                    1110131315182019111816
                    19891716111110131538699
                    10151924569111091099
                    15161813]

fig = plt.figure(figsize=(73), dpi=100)
ax = plt.subplot(21,2)

ax.boxplot(data, False, sym='rs', vert=False, whis=0.75, positions=[0], widths=[0.5])

plt.tight_layout()
plt.show()

Output:

52箱线图调整底部和左侧

import matplotlib.pyplot as plt
import pandas as pd

x = [[1.22.33.04.5],
     [1.12.22.95.0]]

df = pd.DataFrame(x, index=['Apple''Orange'])
df.T.boxplot()

plt.subplots_adjust(bottom=0.25)

plt.show()

Output:

53使用 Pandas 数据在 Matplotlib 中生成热图

import matplotlib.pyplot as plt
import pandas as pd

df = pd.DataFrame([[10203040], [7142128], [5515812],
                    [151418]],
                  columns=['Apple''Orange''Banana''Pear'],
                  index=['Basket1''Basket2''Basket3''Basket4']
                  )

plt.imshow(df, cmap="YlGnBu")
plt.colorbar()
plt.xticks(range(len(df)),df.columns, rotation=20)
plt.yticks(range(len(df)),df.index)
plt.show()

Output:

54带有中间颜色文本注释的热图

import pandas as pd
import matplotlib.pyplot as plt

data = {
        'Basket1': [90959950504581],
        'Basket2': [91988975984980],
        'Basket3': [92979985967588],
        'Basket4': [94968879986986]
        }

fig, ax = plt.subplots(figsize=(94))
df = pd.DataFrame.from_dict(data, orient='index')

im = ax.imshow(df.values, cmap="YlGnBu")
fig.colorbar(im)

# Loop over data dimensions and create text annotations
textcolors = ["k""w"]
threshold = 55
for i in range(len(df)):
    for j in range(len(df.columns)):
        text = ax.text(j, i, df.values[i, j],
                       ha="center", va="center",
                       color=textcolors[df.values[i, j] > threshold])

plt.show()

Output:

55热图显示列和行的标签并以正确的方向显示数据

import matplotlib.pyplot as plt
import numpy as np

column_labels = list('ABCDEFGH')
row_labels = list('12345678')

data = np.random.rand(88)

fig, ax = plt.subplots()
heatmap = ax.pcolor(data, cmap=plt.cm.Reds)

# Put the major ticks at the middle of each cell
ax.set_xticks(np.arange(data.shape[0]), minor=False)
ax.set_yticks(np.arange(data.shape[0]), minor=False)

# Want a more natural, table-like display
ax.invert_yaxis()
ax.xaxis.tick_top()

ax.set_xticklabels(row_labels, minor=False)
ax.set_yticklabels(column_labels, minor=False)

plt.show()

Output:

56将 NA cells 与 HeatMap 中的其他 cells 区分开来

import matplotlib.pyplot as plt
import matplotlib.patches as patches
 
import numpy as np
 
column_labels = list('ABCDEFGH')
row_labels = list('12345678')
 
data = np.random.rand(88)
data = np.ma.masked_greater(data, 0.8)
 
fig, ax = plt.subplots()
heatmap = ax.pcolor(data, cmap=plt.cm.gray, edgecolors='blue', linewidths=1,
                   antialiased=True)
 
fig.colorbar(heatmap)
ax.patch.set(hatch='..', edgecolor='red')
 
# Put the major ticks at the middle of each cell
ax.set_xticks(np.arange(data.shape[0]), minor=False)
ax.set_yticks(np.arange(data.shape[0]), minor=False)
 
# Want a more natural, table-like display
ax.invert_yaxis()
ax.xaxis.tick_top()
 
ax.set_xticklabels(row_labels, minor=False)
ax.set_yticklabels(column_labels, minor=False)
 
 
plt.show()

Output:

57在 matplotlib 中创建径向热图

import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
import numpy as np

fig = plt.figure()
ax = Axes3D(fig)

n = 12
m = 24
rad = np.linspace(010, m)
a = np.linspace(02 * np.pi, n)
r, th = np.meshgrid(rad, a)

z = np.random.uniform(-11, (n,m))
plt.subplot(projection="polar")

plt.pcolormesh(th, r, z, cmap = 'Blues')

plt.plot(a, r, ls='none', color = 'k'
plt.grid()
plt.colorbar()
plt.show()

Output:

58在 Matplotlib 中组合两个热图

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import seaborn as sns

df1 = pd.DataFrame(np.random.rand(204), columns=list("ABCD"))
df2 = pd.DataFrame(np.random.rand(204), columns=list("WXYZ"))

fig, (ax1, ax2) = plt.subplots(ncols=2)
fig.subplots_adjust(wspace=0.01)

sns.heatmap(df1, cmap="rocket", ax=ax1, cbar=False)
fig.colorbar(ax1.collections[0], ax=ax1, location="left", use_gridspec=False, pad=0.2)

sns.heatmap(df2, cmap="icefire", ax=ax2, cbar=False)
fig.colorbar(ax2.collections[0], ax=ax2, location="right", use_gridspec=False, pad=0.2)

ax2.yaxis.tick_right()
ax2.tick_params(rotation=0)
plt.show()

Output:

59使用 Numpy 和 Matplotlib 创建热图日历

import datetime as dt
import matplotlib.pyplot as plt
import numpy as np


def main():
    dates, data = generate_data()
    fig, ax = plt.subplots(figsize=(610))
    calendar_heatmap(ax, dates, data)
    plt.show()


def generate_data():
    num = 60
    data = np.random.randint(020, num)
    start = dt.datetime(201811)
    dates = [start + dt.timedelta(days=i) for i in range(num)]
    return dates, data


def calendar_array(dates, data):
    i, j = zip(*[d.isocalendar()[1:] for d in dates])
    i = np.array(i) - min(i)
    j = np.array(j) - 1
    ni = max(i) + 1

    calendar = np.nan * np.zeros((ni, 7))
    calendar[i, j] = data
    return i, j, calendar


def calendar_heatmap(ax, dates, data):
    i, j, calendar = calendar_array(dates, data)
    im = ax.imshow(calendar, interpolation='none', cmap='summer')
    label_days(ax, dates, i, j, calendar)
    label_months(ax, dates, i, j, calendar)
    ax.figure.colorbar(im)


def label_days(ax, dates, i, j, calendar):
    ni, nj = calendar.shape
    day_of_month = np.nan * np.zeros((ni, 7))
    day_of_month[i, j] = [d.day for d in dates]

    for (i, j), day in np.ndenumerate(day_of_month):
        if np.isfinite(day):
            ax.text(j, i, int(day), ha='center', va='center')

    ax.set(xticks=np.arange(7),
           xticklabels=['M''T''W''R''F''S''S'])
    ax.xaxis.tick_top()


def label_months(ax, dates, i, j, calendar):
    month_labels = np.array(['Jan''Feb''Mar''Apr''May''Jun''Jul',
                             'Aug''Sep''Oct''Nov''Dec'])
    months = np.array([d.month for d in dates])
    uniq_months = sorted(set(months))
    yticks = [i[months == m].mean() for m in uniq_months]
    labels = [month_labels[m - 1for m in uniq_months]
    ax.set(yticks=yticks)
    ax.set_yticklabels(labels, rotation=90)


main()

Output:

60在 Python 中创建分类气泡图

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

df = pd.DataFrame({'Company1':['Chemist''Scientist''Worker',
                               'Accountant''Programmer''Chemist',
                              'Scientist''Worker''Statistician',
                              'Programmer''Chemist''Accountant''Statistician',
                               'Scientist''Accountant''Chemist',
                              'Scientist''Statistician''Statistician',
                              'Programmer'],                   
                   'Company2':['Programmer''Statistician''Scientist',
                               'Statistician''Worker''Chemist',
                              'Accountant''Accountant''Statistician',
                              'Chemist''Programmer''Scientist''Scientist',
                               'Accountant''Programmer''Chemist',
                              'Accountant''Scientist''Scientist',
                              'Worker'],
                   'Count':[531512422611515,
                             1,  12244222266]
                   })

# Create padding column from values for circles that are neither too small nor too large
df["padd"] = 2.5 * (df.Count - df.Count.min()) / (df.Count.max() - df.Count.min()) + 0.5

fig = plt.figure()
# Prepare the axes for the plot - you can also order your categories at this step
s = plt.scatter(sorted(df.Company1.unique()),
                sorted(df.Company2.unique(), reverse = True), s = 0)
s.remove
# Plot data row-wise as text with circle radius according to Count
for row in df.itertuples():
    bbox_props = dict(boxstyle = "circle, pad = {}".format(row.padd),
                      fc = "w", ec = "b", lw = 2)
    plt.annotate(str(row.Count), xy = (row.Company1, row.Company2),
                 bbox = bbox_props, ha="center", va="center", zorder = 2,
                 clip_on = True)

# Plot grid behind markers
plt.grid(ls = "--", zorder = 1)

# Take care of long labels
fig.autofmt_xdate()
plt.tight_layout()
plt.show()

Output:

61使用 Numpy 和 Matplotlib 创建方形气泡图

import matplotlib.pyplot as plt
import numpy as np
import random

xs = np.arange(151)
ys = np.arange(0.561)

colors = ["red""blue""green"]


def square_size_color(value):

    square_color = random.choice(colors)

    if value < 1:
        square_size = random.choice(range(110))
    if 3 > value > 1:
        square_size = random.choice(range(1025))
    else:
        square_size = random.choice(range(2535))

    return square_size, square_color


for x in xs:
    for y in ys:
        square_size, square_color = square_size_color(y)
        plt.plot(x, y, linestyle="None", marker="s",
                 markersize=square_size, mfc=square_color, mec=square_color)

plt.grid(visible=True, axis='y')
plt.xlim(0.54.5)
plt.ylim(-0.56.5)
plt.show()

Output:

62使用 Numpy 和 Matplotlib 创建具有气泡大小的图例

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
 
N = 50
M = 5 # Number of bins
 
x = np.random.rand(N)
y = np.random.rand(N)
a2 = 400*np.random.rand(N)
 
# Create the DataFrame from your randomised data and bin it using groupby.
df = pd.DataFrame(data=dict(x=x, y=y, a2=a2))
bins = np.linspace(df.a2.min(), df.a2.max(), M)
grouped = df.groupby(np.digitize(df.a2, bins))
 
# Create some sizes and some labels.
sizes = [50*(i+1.for i in range(M)]
labels = ['Tiny''Small''Medium''Large''Huge']
 
for i, (name, group) in enumerate(grouped):
    plt.scatter(group.x, group.y, s=sizes[i], alpha=0.5, label=labels[i])
 
plt.legend()
plt.show()

Output:

63使用 Matplotlib 堆叠条形图

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

df = pd.DataFrame([[10203040], [7142128], [5500]],
                  columns=['Apple''Orange''Banana''Pear'],
                  index=['Basket1''Basket2''Basket3'])

ax = df.plot(kind='bar', stacked=True)
ax.set_xlabel('DataFrame Values')
ax.set_ylabel('Basket')
plt.show()

Output:

64在同一图中绘制多个堆叠条

import pandas as pd
import matplotlib.pyplot as plt

df = pd.DataFrame(dict(
    A=[1234],
    B=[2345],
    C=[3456]
))

fig, axes = plt.subplots(12, figsize=(104), sharey=True)

df.plot.bar(ax=axes[0])
df.diff(axis=1).fillna(df).astype(df.dtypes).plot.bar(ax=axes[1], stacked=True)

plt.show()

Output:

65Matplotlib 中的水平堆积条形图

import numpy as np
import matplotlib.pyplot as plt

people = ('A','B','C','D','E','F','G','H')
segments = 4

# generate some multi-dimensional data & arbitrary labels
data = 3 + 10* np.random.rand(segments, len(people))
percentages = (np.random.randint(5,20, (len(people), segments)))
y_pos = np.arange(len(people))

fig = plt.figure(figsize=(10,8))
ax = fig.add_subplot(111)

colors ='rgbwmc'
patch_handles = []
left = np.zeros(len(people)) # left alignment of data starts at zero
for i, d in enumerate(data):
    patch_handles.append(ax.barh(y_pos, d, 
      color=colors[i%len(colors)], align='center'
      left=left))
    # accumulate the left-hand offsets
    left += d

# go through all of the bar segments and annotate
for j in range(len(patch_handles)):
    for i, patch in enumerate(patch_handles[j].get_children()):
        bl = patch.get_xy()
        x = 0.5*patch.get_width() + bl[0]
        y = 0.5*patch.get_height() + bl[1]
        ax.text(x,y, "%d%%" % (percentages[i,j]), ha='center')

ax.set_yticks(y_pos)
ax.set_yticklabels(people)
ax.set_xlabel('Distance')

plt.show()

Output:


- EOF -


推荐阅读  点击标题可跳转

1、不写一行代码,即可调用 Matplotlib 绘图!

2、一行代码让 matplotlib 图表变高大上

3、这 40 个 Python 可视化图表案例,强烈建议收藏!



看完本文有收获?请转发分享给更多人

推荐关注「数据分析与开发」,提升数据技能

点赞和在看就是最大的支持❤️

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存