查看原文
其他

哈科学家发明哈萨克语语音识别系统 引来飞利浦谈合作

哈萨克斯坦新冠疫情实时报道

1305457

确诊病例

1704

现有病例

10

单日新增

89

单日康复


据Khabar24 电视频道报道,哈萨克斯坦科学家奥肯·马米尔巴耶夫开发了一种哈萨克语语音识别系统,可将该语言的语音信息转换为文本文字。


该项目是在2018-2020 年财政支持的框架内实施的,项目主题为“基于深度神经网络的多语言语音自动识别技术”。2021年,奥肯·马米尔巴耶夫和他的团队获得了另一个 IT 项目的资助,用于开发一个自动搜索和分析非法网络内容的系统。


奥肯·马米尔巴耶夫


在读博士期间,奥肯·马米尔巴耶夫就萌生了发明一项有用服务的想法,并在语言学家的帮助下建立了语言基础。哈萨克语语音识别系统的原理非常简单:人工智能读取声音,然后将其转换为文本文字。


“创建系统时,遇到的最大问题就是语音数据语料库的开发。如果我们能收集到更多的数据,那么我们的识别模型就被训练出来了,可以识别所有单词。如果语料库很小,有些单词它就无法识别。我们现已获得两千小时的语音记录,进行系统测试时,单词识别的准确率为 8%。如果我们的语音记录达到五千小时左右,那么准确率可以达到90%,”奥肯·马米尔巴耶夫说。



现在,该系统被应用于Telegram 社交网络中的聊天机器人。要对其进行测试,只需按住录制语音消息按钮即可。之后,机器人会自动将语音转换为文字。



为方便起见,开发人员还开发了一个可用于商务会议的录音笔;完成录制后,系统可将其形成哈萨克语文本。飞利浦国际公司已经对这一发明产生了兴趣,并计划将该系统应用到其面向哈萨克斯坦市场的产品之一。


带有语音识别功能的飞利浦 Smart Mike Duo录音笔将被引入哈萨克斯坦市场,该麦克风会自动将语音转换为文字。该设备能够识别同时发出的两种不同的声音,并在两个不同的通道上自动将语音转换为文本。


奥肯·马米尔巴耶夫介绍说:“飞利浦提出合作并进一步推广该产品。将软件加载到计算机中,然后与录音笔连接。会自动识别两种不同的声音,并以两个块显示哈萨克语文本。这种录音笔在开会时很有用,可以文本形式保存会议信息”。


来源:24.kz orda.kz



期回顾
哈萨克斯坦调整入境政策  6月12日与意大利开通直航
托卡耶夫谈修宪:独立的哈萨克斯坦将掀开历史新篇章
俄乌局势持续升级 哈国防部长承诺人民可以睡安稳觉
责编:项婧


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存