查看原文
其他

吴少玫:与其反思自己,不如改变AI

奇途 奇途无障碍
2024-09-23

2024年1月28日上午09:00-12:00,在开展了十期后,我们打算开展一期数字经济残障女性就业结业研讨会。我们将本次研讨会的主题聚焦于“人工智能转型下的残障女性就业”,旨在探讨如何最大程度地发挥人工智能技术的潜力,为残障女性创造更广泛、更包容的就业机会。


我们特别邀请了来自不同领域的专家学者,分享他们的研究、经验和洞见,共同思考如何借助人工智能推动社会的多元化和包容性。

▲图为该研讨会海报,呈现了六位与会嘉宾的分享主题


接下来的推文中,我们会逐个发出嘉宾们的分享回顾。本期整理了吴少玫女士的分享:人工智能的价值和价值观



吴少玫

人工智能的价值和价值观

吴少玫拥有康奈尔大学博士学位,她是 AImpower.org 的创始人兼首席执行官。AImpower.org 是一家致力于与弱势群体一起研究和设计科技产品,以消除障碍并推进社会公平的技术性非营利机构。此前,少玫曾任职 Facebook 和 Instagram 的研究科学家,领导推动了包含无障碍产品(Accessibility)、人工智能促进包容(AI for inclusion),和种族公平性(Racial Equity)在内的多个“技术向善(Technologyfor Good)”项目。


我先前听到前面很多分享者聊的大部分内容都是关于人工智能如何影响残障者生活的,我在这里想聊聊残障者如何改造和影响人工智能。这个题目可能有点抽象,但是我会向大家讲几个我正在做具体的项目来向大家说明。


AI的价值

▲吴少玫分享的ppt演示,标题为:人工智能的价值,共有五个方面:速度、规模、准确度、创意和同理心


现在大家都知道,AI是非常热门的话题,得到了很多的资本投入。关于它的价值,大家应该都认同它的速度和大规模。但是说到准确度,可能在有些任务上还是没有办法达到理想的程度。


再说到创意,现在有很多新的研究,比如写作、画画等,但是总体来说大部分还是基于现有的一些人类文艺创作来实现的,AI要实现真正的它从无到有可能还是有一些困难。


最后一个维度,同理心。这一点我个人是存疑的,AI现在还是没有办法完全从共情的角度去同理。目前AI的最大的优势还是速度和规模。


AI的价值体现的价值观

身为社群伙伴,我想大家都可以联想到对于效率至上的推崇,其实是非常符合健全主义价值观的。健全主义就是对于残障人士的歧视或者偏见,在当前的人工智能背景下,对于效率的追求,反而赋予了健全主义前所未有的正当性。


健全主义价值观为什么不好?非常多的人群可能没有想过,或者并没有特别在乎。人工智能带有的健全主义价值观非常危险,现在只是体现为对于残障社群的歧视、边缘化,但是往长远来看,10年之内有可能对于整个人类的生存性都会产生威胁。


OPENAI也花了很多的精力或者警告超级智能体,他们认为10年内就会出现危险。它最大的威胁就是因为他们超级高效,超级厉害,所以他们有可能会反过来控制人类。但是现在主流的反抗现有的超级智能体的威胁的方法是一种理论的模型——用一种弱的智能训练强的智能,是一套非常复杂的模型。当我看到他们模型的时候,我就想起来,实际上残障社群很早以前就开始提科技的概念——通过残障的视角去创造一种新的价值观,创造新的科技,能代表包括残障群体在内的所有弱势群体的一种更加友好的价值观。

▲吴少玫分享的ppt演示,引用了一句话:我不仅仅想要在别人的桌上有个位置,我想要和我的残障伙伴们一起,创造出比一张桌子更伟大的东西。


我上方的幻灯片引用了一位残障倡导者2018年给的主题演讲,他不仅想要在别人的桌上有个位置,更想要和残障伙伴们一起创造出比一张桌子更伟大的东西。我非常认同他的理念,Almpower目前在做的就是和残障社群伙伴们一起创造出比现有的人工智能更加伟大的科学和科技产品。


案例分享

我现在在和一些口吃者一起创造新的语音模型。吴迪他们策展的清华科博的晚宴上面展示了一些口吃者和小度对话的结果,但是对话方面还很多的问题。因为口吃者说话的时候会叠字或者长停顿,导致目前的语音模型没有办法正常完成对话。针对这样的问题,口吃的社群朋友们成立了一个自组织,花了一年的时间收集了很多口吃的语料。社群成员想用他们的残障作为卖点,改变科技产品。经过一年的努力,他们收集到了由70个口吃者贡献的50个小时的语音。他们的标注特别友好,他们会把每一个重复都标出来。比如说“我叫小明,我住在北京。”他们标注的方法是和传统的语音标注方法很不一样的。


然后,我们用他们标注的结果试了现在最先进的开源语音识别模型,我们发现了很有趣的结果。比如原句是“当当当时我上去的时候,我就就就就和同学们说了一下。”这样的语音如果让OPENAI的Whisper模型转录就会删去所有的口吃,变成“当时我去的时候我就跟同学说了一下”,让整个句子变得非常短。并且很多时候当我们想要去分析有没有口吃的出现时,是完全找不到的。很多口吃者其实是有保留口吃痕迹的需求的。


另一个模型,Meta的语音转录工具叫做Wav2cc会乱转录。当有很多重复字出现的时候,它完全没有办法理解,用了很多同音字,就变成“当当当单舍瓦上去的时候我就舅舅就了跟同学们说一下”。目前该转录模型还有很多对口吃社群不友好的地方,我们正在和口吃的社群成员,还有大学里的老师一起想办法,如何用他们收集的语料更好地改进现有的模型。


改变AI行动

刚才讲了那么多,我也想让大家有一些可以参与行动的选项。我非常相信残障社群的力量,所以我想对大家说:与其反思自己,不如改变AI。你们每个人每一天的生活实际上都是非常珍贵的田野资料。所以,我个人现在也有在做很多自田野,我会记录下我在用一些产品时候的体验,特别是糟糕的体验。我相信如果大家一起来记录,可以合力改变现在科技的走向。


谢谢大家,我讲完了!


整理 | 敏敏


阅读更多:

吴迪:走出家门,残障女性标注员群像

黎越可:搭建“残障世界”:残障女性的劳动与生活故事

胡鸾娇:残障女性的就业挑战与机遇



继续滑动看下一个
奇途无障碍
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存