查看原文
其他

男人负责赚钱养家,女人负责貌美如花?没想到电脑也有直男癌

2016-08-20 苏琬茜 爱范儿
性别歧视的硝烟也弥漫到计算机界?其实还是人类自己。
图:love donuts
男人就是程序员,女人就是家庭主妇
美国波士顿大学 Tolga Bolukbasi 和微软研究院研究团队发现,人工智能也存在着性别偏见。偏见的根源是人类让机器学习的词向量(word embedding),即人工智能学习人类平日语言表达所固有的框架。
人工智能学习词向量的方法,是通过定位大量文本中的单词同现,来作为指导系统如何使用语言的字典。
研究对象是面向公众开放的数据库 Word2vec。该数据库通过大量的 Google 新闻文本,学习了 300 万个英语单词。
含义近似的单词会归类在一块,在文章中的用法区别则表现了词对词的关系,如 “男人是国王,而女人就是 x”,计算机通过词向量的学习,自然会得出答案: x = 王后。同样,当输入 “巴黎:法国::东京:x”,系统就会反馈出 “x = 日本”。
然而,词向量同时也会抓取出文本中隐晦的性别歧视意味。如果问题变为 “男性:程序员::女性:x”,词向量就会让计算机得出 “x = 家庭主妇” 的答案。
论文中显示,数据库中 “她” 定向的职业词汇除了家庭主妇,还有护士、接待员、图书馆管理员、名媛、美发师、保姆、会计员、设计师、家政妇、室内设计师、咨询顾问。
相对的,“他” 定向的职业则是音乐大师、船长、司令官、哲学家、上尉、建筑师、金融家、战士、播音员、魔术师、战斗机飞行员、老板。
图:UMIA
以此类推,计算机认知系统中 “父亲” 就是 “医生”,“母亲” 就是 “护士”。
这样的结果让人失望,因为社会普遍认为,Google 新闻报道是由具有新闻专业主义的新闻记者所撰写,文本中应该有足够的客观性。事实证明,仍然避免不了字里行间的性别偏见。
研究团队还使用别的算法分析了其它数据库的词向量,同样存在着性别歧视情况。
研究表明,目前所有机器学习的数据库,词向量都反映了社会范围内存在的性别刻板印象,另外还有可能在现实生活中放大这样的偏见。
例如,在某所大学的网页上搜索计算机科学专业的博士生,计算机会将男性名字 John 和女性名字 Mary 区分开来进行定性,如前面提到数据库中的词向量是 “男性:程序员::女性:家庭主妇”,因而搜索结果会将 John 所在页面排列在 Mary 的前头。
这种情况非常不利于机器学习及其相关的实际应用。
不要悲观,还有解决的方法
结果虽然让人失望,但还不急着下结论。
研究团队表示,他们写这篇论文不单为了展示这个现象,研究目的在于如何让机器学习保留单词真正有用的意义内容,去除带有偏见的意义。
研究者借助 Amazon Mechanical Turk 众包平台做实验,让平台上 10 位任务者进行判断,词向量中对应单词之间的关系是否含有偏见,根据各个人的判断结果,来决定数据库中单词应该保留的注释。
由于性别间的联系因文化背景和个人有所区别,所以实验中要求按刻板印象的程度在 0-10 的范围内进行评级,而不是直接表明是否存在偏见的态度。
如果超过一半的人认为关系不恰当,研究团队就会对该词向量进行修正,重新录入数据库。
实验结果表明,方法行之有效,对比实验前,偏见程度大大降低,如 “护士” 趋向男性和女性的程度平等。此前,计算机倾向于将 “临时保姆” 定性到 “奶奶” 上,而不是 “爷爷”,进行修正后,爷爷奶奶均有平等机会当孙儿的 “临时保姆” 了。
Tay 不应成为人性恶的化身
微软在今年 3 月 23 日推出了 Tay,一个人工智能聊天机器人。微软希望 Tay 可以学习和模仿 19 岁少女的特征,并认为社交媒体会是不错的学习场所。
然而,当 Tay 出现在 Twitter 的 16 小时后微软将其紧急下线。Tay 作为人工智能,所以她会模仿人类的言语来回答其它用户的问题,在一天里,Tay 就被迅速 “教成” 了一位满口污言秽语的种族歧视者。
图:The Hacker News
即便 Tay 在 3 月 30 日突然再生,依旧迅速被微软撤回。
人工智能的初衷就是让计算机模仿人类,人类作为计算机学习的模板,计算机无法避免会学习到人类的某些缺陷。
不过 Tolga Bolukbasi 这份研究报告还是给人工智能带来了一些好消息。
也许不久的将来,Tay 会保持着人工智能的初心再次复活。
题图:Recruiting Blogs
   
爱范儿招聘新创组记者!简历请投:recruit@ifanr.com

职位要求:
- 至少 1 年媒体从业经验;
- 熟悉主流技术创新以及高速成长中的新技术、新模式,了解产业趋势以及技术如何影响人;
- 能用有趣、浅显的语言解读新技术;
- 无障碍地阅读外媒新闻

工作职责:
- 负责新创领域(新产品、新技术、新模式)的报道;
- 面对热点事件,独立操作大型或深度选题,包括策划、采访和写作

工作地点:广州

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存