数据可视化 | 甘特图,看这篇就够了
The following article is from 凹凸数据 Author 愆
本文转载自公众号凹凸数据
甘特图又称为横道图、条状图,它是以作业排序为目的,将活动与时间联系起来的最早尝试的工具之一,能够很直观地显示项目、进度等和时间的内在关系随着时间的进展情况,在管理和生产活动中被广泛使用。
用来制作甘特图的专业工具也不少,常见的有:Microsoft Office Project、GanttProject、WARCHART XGantt、jQuery.Gantt、Excel等,网络上也有一些优质工具支持在线绘制甘特图。
可是这种现成的工具,往往也存在一些弊端,让编程人员不知所措。比如说,花里胡哨的UI,让人目不暇接,不知点哪个才好:
相比之下,还是简简单单的代码来的醒目、直观、安全又便捷。而且,第二种方式,使得图表的自定义程度也更高,配色、组件尺寸等调整也往往更加方便。
下面用一个例子来说明如何使用Python绘制甘特图:
背景:假定疫苗生产需经过CJ1、CJ2、CJ3、CJ4共4个工位,且必须按照CJ1-CJ2-CJ3-CJ4的顺序轮流在4个工位加工。为防止疫苗包装出现混乱,规定每个工位不能同时生产不同类型的疫苗,且疫苗生产不允许插队,即进入第一个工位安排的每类疫苗的生产顺序一旦确定就要一直保持不变,而且前一种类型的疫苗离开某个工位后,后一种类型的疫苗才能进入这个工位。已知各工位生产加工10种疫苗的平均时长(单位:min)如下表:
思路:在生产调度问题中,关于最短加工时长的目标优化问题,比较常见的算法是根据 Johnson 规则推广的 CDS 算法 ,在此不再赘述,感兴趣的朋友可以自行搜索。假定已确定的生产顺序为YM4-5-2-7-10-1-8-6-3-9,并计算出了每个工位的开始加工时间(单位:min),如下表:
首先,导入依赖的库:
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.patches as mpatches
正常显示中文和负号:
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
读取数据表,获取各工位加工时长和各工位开始加工时间:
df1 = pd.read_excel('time.xlsx', sheet_name='continue_time', index_col='YM')
df2 = pd.read_excel('time.xlsx', sheet_name='start_time', index_col='YM')
CJS = ['CJ1', 'CJ2', 'CJ3', 'CJ4']
YMS = ['YM4', 'YM5', 'YM2', 'YM7', 'YM10', 'YM1', 'YM8', 'YM6', 'YM3', 'YM9']
# continue_time:各工位加工时长,start_time:各工位开始加工时间
continue_time = []
start_time = []
for cj in CJS:
continue_time.append([ym for ym in df1[cj][YMS]])
start_time.append([ym for ym in df2[cj][YMS]])
获取数组大小,用于之后的循环:
m = range(len(continue_time))
n = range(len(continue_time[0]))
以下是绘图过程:
# 指定每个水平柱子颜色
colors = ['r', 'pink', 'orange', 'y', 'g', 'b', 'deeppink', 'purple', 'brown', 'black']
# 设置画布大小和分辨率
plt.figure(figsize=(20, 8), dpi=200)
# barh:水平柱状图,设置循坏迭代以绘制层叠效果
for i in m:
for j in n:
plt.barh(m[i] + 1, continue_time[i][j], left=start_time[i][j], color=colors[j])
plt.title("疫苗生产甘特图", fontsize=17)
labels = [''] * len(continue_time[0])
for f in n:
labels[f] = "YM%d" % (f + 1)
# 添加图例
patches = [mpatches.Patch(color=colors[i],label="{:s}".format(labels[i])) for i in range(len(continue_time[0]))]
plt.legend(handles=patches, loc=4)
# XY轴标签
plt.xlabel("加工时间/分钟", fontsize=15)
plt.ylabel("各工位加工流程", fontsize=15)
# XY轴刻度
plt.yticks([1, 2, 3, 4], ['CJ1', 'CJ2', 'CJ3', 'CJ4'])
# 网格线,此图使用不好看,注释掉
# plt.grid(linestyle="--",alpha=0.5)
plt.savefig('gatte.jpg')
plt.show()
到此为止,一副甘特图就完工了。
colors = ['#3B9DD3', '#41ADE8', '#48BEFF', '#44D5FF', '#40EBFF', '#40E0CF', '#43C59E', '#42B091', '#409B83', '#51A48E']
于是乎,一副精美的甘特图出来了~
(将上面第一步的设置渐变配色列表替换为以下内容即可~)
from colour import Color
red = Color("red")
colors = list(red.range_to(Color("purple"), 14))
colors = [color.rgb for color in colors]
结果如下:
最后,简单总结一下甘特图优缺点。
优点
醒目、直观、易于理解;
方便调配各项业务及工作流程的时间安排;
有专业软件支持,无须担心复杂计算和分析。
局限
仅仅部分地反映了活动流程的时间、成本和范围约束;
不适用于时间依赖关系过复杂的场景,否则将大大提高读图成本。
点击搜索你感兴趣的内容吧
往期推荐
数据Seminar
这里是大数据、分析技术与学术研究的三叉路口
推荐 | 青酱
欢迎扫描👇二维码添加关注