查看原文
其他

WordBias显示偏见(刻板印象)的交互式可视化工具

大邓 大邓和他的Python
2024-09-09

词嵌入做为一种词向量模型,可以从文本中计算出隐含的上下文情景信息,态度及偏见。通过词向量距离的测算,就可以间接测得不同群体对某概念(组织、群体、品牌、地域等)的态度偏见。偏见(刻板印象)的介绍有

大数据时代下社会科学研究方法的拓展—基于词嵌入技术的文本分析的应用

目前有些Python库可以使用词嵌入模型展示人类认知偏见, 如:

今天又发现了一个Python项目,

WordBias:一种用于发现词嵌入偏见(刻板印象)的交互式可视化工具

https://github.com/bhavyaghai/WordBias

上图为WordBias的可视化界面。图片可以分为3部分:
(A) 控制面板提供选择要投影到平行坐标图上的单词的选项
(B) 主视图显示所选单词(蓝线)沿不同偏见类型(轴)的偏差分数
(C) 搜索面板使用户能够搜索单词并显示搜索/刷新结果。

在上图A位置填入了一连串负面词,如terror, terrorism、attack、dangerous、violence等 。

而在图中B位置,可以看到这些负面词在不同维度上存在不同的偏见。

  • 性别: 这类词主要倾向于男性
  • 地区:这类词倾向于伊斯兰地区
  • 年龄: 这类词倾向于年轻人
  • 经济:  这类词倾向于贫穷

这表明 Word2vec 嵌入包含对穆斯林地区的贫困男性存在偏见。 

精选文章


Python语法入门(含视频代码)

读完本文你就了解什么是文本分析

综述:文本分析在市场营销研究中的应用

大数据时代下社会科学研究方法的拓展—基于词嵌入技术的文本分析的应用

PyPlutchik库 | 可视化文本的情绪轮(情绪指纹)

计算文本的语言具体性 | 以JCR2021论文为例

使用文本相似度可以识别变化的时间点

PNAS | 文本网络分析&文化桥梁Python代码实现

tomotopy | 速度最快的LDA主题模型

量化历史语言学-贝叶斯语言谱系分析

Python与文化分析入门

在会计研究中使用Python进行文本分析

文本分析方法在《管理世界》(2021.5)中的应用

doccano|为机器学习建模做数据标注

量化历史语言学-贝叶斯语言谱系分析

继续滑动看下一个
大邓和他的Python
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存