查看原文
其他

人工智能时代的读心术

数据科学学院 SDSCUHKSZ 2022-06-27

人工智能时代的读心术


最新的研究表明,人工智能科技具备了从脑电信号中检测出一个人正在听什么的能力,这为实现随心所听的脑控助听设备铺平了道路。


助听器通过放大声音使失聪的人能够听得更清楚,然而,对于那些能够通过助听器改善听力的人群而言,只有不到20%的人佩戴了助听器。其中一个重要原因就是,现有的助听器无法选择佩戴者想听的声音,而是直接地放大环境中所有的声音。


在十分嘈杂的环境中,健耳依然能够定位某个声源,并能够把注意力集中在某个特定的声源上。这就是人在解决“鸡尾酒会问题”[1]时表现出的本能。科学家们发现,人类大脑中形成的听觉注意力往往反映于大脑信号,例如,测量大脑皮层活动的脑电图。由于脑电图提供了一种研究大脑皮层活动的非侵入性方法,因此,针对脑电图的研究引起了学术界和工业界越来越多的关注。


基于脑电信号的听觉注意力检测技术搭建了大脑和助听器连接的桥梁,让脑控助听器的实现成为现实,也为未来的脑机接口开辟了许多新思路。受神经科学和心理声学研究成果的启发,研究人员正在努力地设计用来处理大量的嘈杂的脑电信号和破译人脑听觉活动的算法。我们是否能够准确并实时地检测到人的听觉注意力成为了实际应用中需要解决的关键问题,数据科学学院李海洲教授领衔的类脑计算团队在潜心寻找这个问题的答案,并取得了重要进展。


神经科学研究表明,大脑皮层的听觉反应与外部听觉刺激的能量之间存在着一定的相关性。数据科学学院李教授的团队成功地实现了一种能够将听觉刺激所蕴含的声学内容与大脑活动关联起来的算法,并于最近发表了这一发现[2]。当听者在多说话人环境中把注意力聚焦于单个特定的声音时,该算法能够以80%的准确率破译这个人正在听的是哪个声音,并且能够在一秒钟之内完成检测,这跟人脑切换注意力所需的时间延迟相近。


该团队的研究人员希望他们的工作能够与语音处理算法相结合,在脑控助听设备的研究中取得新的突破。读心术曾经是心理学家梦寐以求的超能力,在人工智能时代,读心术也是计算机科学家不倦的探索。


*该文章是由数据科学学院人类语言技术实验室供稿。

[1] “鸡尾酒会”问题即鸡尾酒会效应(英语:cocktail party effect),指人的一种听力选择能力,在这种情况下,注意力集中在某一个人的谈话之中而忽略背景中其他的对话或噪音。该效应揭示了人类听觉系统中令人惊奇的能力,即我们可以在噪声中谈话。(来源:百度百科 https://baike.baidu.com/item/鸡尾酒会效应/1934902?fr=aladdin)

[2] S. Cai, E. Su, L. Xie and H. Li, "EEG-Based Auditory Attention Detection via Frequency and Channel Neural Attention," in IEEE Transactions on Human-Machine Systems, vol. 52, no. 2, pp. 256-266, April 2022, doi: 10.1109/THMS.2021.3125283.

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存