用语音就能操控机械臂运动?
湖北大学电子信息专业研究生团队
《基于FPGA的语音识别机械臂系统》项目
突破重重难关,历时近四个月
研制出最听话的机械臂
从5824支队伍中脱颖而出
小贝了解到,该系统主要由语音识别系统、视觉识别摄像头和单片机控制部分组成。
打开开关,语音识别系统自动运行。“红色!”团队队长曾文平一声令下,语音识别系统将解析后的语音数据结果发送给摄像头,摄像头立即开始捕捉桌面上红色色块,并将其位置坐标传输到单片机。伴随着滋滋滋的电流声,黄色的机械臂根据单片机逆运动解算的结果,随着轴承缓缓旋转、下降,将桌面上的红色色块牢牢抓住,运送到桌面另一处放下,这个过程实际运行时间仅30秒。随着中国社会人口老龄化加剧,对于医疗护理机器人的需求也会大幅提升,《基于FPGA的语音识别机械臂系统》可以应用于医疗行业,通过语音操控的机械臂将极大程度优化老年人医疗体验,减轻医生护士的看护压力。——指导老师宋敏
在作品的设计过程中,最具突破性的点是团队三人负责板块之间的联动,欧阳一博负责语音系统,曾文平负责机械臂控制和摄像头,刘子涵负责通讯接口。曾文平设计的作品曾在湖北大学集成电路创新创业大赛获得二等奖,由于当时用到了机械臂,团队指导老师宋敏便建议他以这项作品为基础组队参加比赛。他第一时间就找到了刘子涵和欧阳一博:“他们两人在机械臂设计上都有自己的成果,把原有的设计成果进行整合,设计出来的作品能实现一加一大于二的效果。”语音数据的识别是项目设计的一大难点。设计初期,团队收集的数据有限,在数据处理完成后,他们发现语音识别系统并不能很好地识别各种年龄段的语音。为了使语音识别的数据库更加充分,团队自建数据库,耗时一个多月,找来两百多人进行语音内容的录制,提高了机械臂语音识别的泛化能力。团队的成员欧阳一博在语音识别部分充当了核心角色,他告诉小贝:“语音识别对广泛性要求很高,找人的过程虽然困难,但有了这两百多人的数据,大部分人的语音指令都可以轻松地识别。”决赛的准备时间是在暑假,团队成员欧阳一博因为个人原因在酒店隔离。在他负责的语音系统设计部分,欧阳一博每天和其他成员进行视频沟通,请团队成员帮忙检查优化自己的部分。检查数据、维修线路、总结问题并提出解决措施.....每天工作结束后,三人又开始对一天的修改和优化工作进行复盘。“累是真的累,但每次我们发现可以优化的细节,我们觉得一天的工作都是值的。”刘子涵说。“我常常说能力和成绩可以不是最出色的,但是态度一定要端正。”指导老师宋敏对团队的作品完成要求很高,每一步都会进行检查与指导。宋敏每次实验都会给团队成员知道答辩和试验技巧,团队成员也经常向老师分享自己在实验期间的困惑。“能拿到国奖是我们没有想到的,但是他们用行动证明我们的团队可以创造奇迹。”宋敏说。“最大的收获就是确定了自己在语音识别方面的研究方向。”谈到自己在本次研电赛中取得的收获,欧阳一博说,“在研究过程中也拥有了卷积神经网络语音识别系统和智能化语音识别技术应用管理系统两项软件著作权。”宋敏介绍,自学校研究生工作部、研究生院于2021年首次启动“一院一赛”工程后,她每次都会带领学生参加学科性竞赛。“这次获得一等奖,学校和学院都全程跟进我们这次比赛,提供人力物力的全面支持,有了学校的支持与鼓励,我们才能更好地沉下心来投身科研,参加比赛。”
文/记者团 李垠璋 熊思颖