查看原文
其他

案例分享丨以数据画像推动高校党建工作

翟鸣宇 等 中国教育网络 2023-11-11

大连理工大学


支部画像是加强智慧党建、创新基层党建工作的积极尝试。利用数据技术开展党建工作,能够有效增强高校党建工作的整体性、针对性、时代性和创新性,对高校党建工作质量提升具有重要的意义。


为进一步强化基层党组织的凝聚力和战斗力,本文依据大连理工大学网信中心党支部近三年工作落实的实际情况,梳理、总结和分类支部党建活动项目,构建支部党建活动基础数据,整合机关党委党建工作指标要求,采用机器学习中的多标记分类学习方法和百度EasyDL开发平台,以指标形式完成对党支部工作的量化评估,形成支部的标签化描述和特征化标识,展示支部画像的全貌,创新性地利用数据分析方法全面评估支部建设、大力推进支部发展。


支部画像数据源及指标分类


支部党建活动项目数据是客观准确刻画支部画像的最基础素材。学校网信中心支部2019年~2021年党建活动项目基础数据主要分为文档、照片、视频三类,收集基础数据后,按照自然年度分类保存到大工云盘。


按照大连理工大学机关党委对机关党支部党建工作的相关要求,支部画像指标分类由一级指标、二级指标组成,具体如表1所示。


表1 支部画像指标分类

(上下滑动查看完整表格)

一级指标

二级指标

二级指标简称

1. 组织健全

1_1 规范设置

规范设置

1_2 配强班子

配强班子

1_3 按期换届

按期换届

2. 制度完善

2_1 坚持“三会一课”制度

三会一课

2_2 坚持组织生活会制度

组织生活

2_3 坚持民主评议党员制度

民主评议

2_4 坚持联系服务群众制度

服务群众

2_5 坚持谈话提醒制度

谈话提醒

2_6 坚持和完善党日制度

党日制度

2_7 坚持请示报告制度

请示报告

3. 责任落实

3_1 落实思想政治工作责任

思政工作

3_2 落实全面从严治党责任

从严治党

3_3 落实意识形态工作责任

意识形态

3_4 落实安全稳定工作责任

安全稳定

4. 运行规范

4_1 支部工作规范开展

工作规范

4_2 队伍建设规范进行

建设规范

5. 活动经常

5_1 健全活动机制

健全机制

5_2 建设活动阵地

建设阵地

5_3 巩固活动成果

巩固成果

6. 档案齐全

6_1 规范党员信息台账

党员信息

6_2 规范组织生活台账

组织台账

6_3 规范联系服务群众台账

联系群众

6_4 规范党费收缴使用台账

党费缴用

7. 作用突出

7_1 支部战斗堡垒作用充分发挥

战斗堡垒

7_2 党员先锋模范作用突出

先锋模范

8. 特色工作

8_1 创新做法

创新做法

8_2 荣誉奖励

荣誉奖励



生成支部画像的技术路线


基础数据收集与存储


将上述分类后的基础数据从大工云盘下载到本地后,使用python语言编写程序,递归遍历资料文件的各个目录和子目录,从中提取目录名及文件标题。然后将文件划分为文本、图片和视频三类进行存放,其中Word及text类型的文档将其内容提取后保存,其他类型的文档,如pdf、PowerPoint及Excel文档等,以二进制的形式保存,对于图片和视频等形式的文件,仅保存文件名称。


基础数据以文档形式为主,并采用json文件格式存储。主要的关键字为“目录名”、“文档”、“名称”、“类型”、“内容”、“图片”及“其他”。


数据多标记


1.多标记学习


多标记学习考虑一个对象与多个标签关联,学习的目标是通过训练标记已知的训练样本,尽可能正确地预测未知样本的标记集合,将所有合适的标记赋予待分类对象。

支部党建活动产生的每个数据同时具有多个指标标记。例如,网信中心党支部联合中国银联大连分公司党支部、外国语学院教工行政党支部等9个师生党支部进行支部共建,开展“重走长征路、共传爱党情”校园打卡红色教育主题党日活动,针对此类数据样本可以划分对应的标记为:

“2.6坚持和完善党日制度”、“4.1支部工作规范开展”、“5.1健全活动机制”等。本文采用多标记学习作为工具的目的是为支部党建活动的每条数据赋予多个指标标签,为后续支部画像提供分类依据。


2.多指标标记


生成训练数据:将2019年数据作为训练数据,手工对每一个文本内容按照上文所述的二级指标进行分类标记,生成的训练数据文件标签模式如表2所示。


表2 训练数据文件


训练学习模型:本文采用百度发布的EasyDL开发平台进行文本多分类模型的学习和训练,利用EasyDL开发平台提供的多标记学习文本多分类功能,通过定制分类标签来实现文本内容的自动标记。将数据文件内容分解为每个文本包含512个汉字的训练文本后,通过EasyDL处理,最终得到2019年的数据文件共分解为413个文本,共25个标签类别。


经EasyDL训练后产生文本多分类机器学习模型,该模型的效果评估如图1所示,总体效果满足要求。


图1 文本多分类模型效果评估结果


标记支部数据:将上述训练得到的模型在百度公有云上发布后,对外提供REST服务。将2020年和2021年的支部活动文本数据通过POST方式进行RESTful API的调用,即可实现支部活动成果的多指标分类标记。


例如,将一段党日相关活动文档作为参数,调用上述接口进行指标分类,结果如下面的json文件所示,其中name表示文档所属的分类名,score表示文档属于该类的准确度。


{

    "log_id":5641574522368167333,

    "results":[

      {

        "name":"思政工作",

        "score":0.8956924080848694

      },

      {

        "name":"党日制度",

        "score":0.8479165434837341

      },

      {

        "name":"三会一课",

        "score":0.8239158987998962

      }....

}


将2020年和2021年所有的支部相关活动文档进行多分类后,累加各个分类准确度的数值,并汇总成一级指标,得到一、二级指标的总准确度数值,最终结果如表3所示。从表中数据可以看出,网信中心在“责任落实”、“制度完善”、“运行规范”、“思政工作”、“活动经常”等方面取得了较高的成绩。


生成支部画像标签云


将上述数据导入在线词云生成工具(https://wordart.com/),可以生成支部画像标签云。


从标签云可以看出,网信中心党支部在“责任落实”、“工作规范”、“三会一课”、“思政工作”、“运行规范”、“活动经常”及“制度完善”等方面取得的成效比较突出,此结论与表3数据结论是一致的。


表3 各个指标的分类准确度数值


本文对大连理工大学支部画像数据源进行了处理和分类,生成了基于多标记学习的支部画像技术路线。通过对训练文本的学习,得出了一个文本多分类模型。通过模型效果评估,得到了较高的F1度量值、较高的准确率及召回率。在此模型的基础上,将2020年和2021年所有的支部相关活动文档进行多分类,生成指标的总准确度值,得到的标签云也与准确度值相一致。


支部画像准确诊断了学校网信中心党支部的实际工作情况,统计了支部年度工作数据,为支部量身定制了画像报告。数据技术在精准定位支部党建情况现状,打破传统思维桎梏,提升智慧党建水平,树立先进党建典型,激发党支部党建热情,充分发挥支部先进模范带动作用等方面具有重要意义。

基金项目:本文系大连理工大学党建研究课题的研究成果(课题编号 DUTDJ2118)

作者:翟鸣宇、宋超、杨雨濛、李长利(大连理工大学网信中心)

责编:陈荣

投稿或合作,请联系:eduinfo@cernet.com

往期推荐

● 电子签名如何应用于高校档案服务?

● 案例分享丨高校全量化日志平台建设


关注我们 了解更多↓

更多精彩视频推荐


欢迎分享、点赞、在看

积极留言还会有惊喜好礼哦~


继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存