一个简单、灵活、优雅的中文语音对话机器人/智能音箱项目!
推荐关注
责编:猿哥 | 来源:GitHub猿 整理
上次是谁要的系统项目啊,猿哥帮你找到了。
📚 项目介绍
🔥本项目系统是一个简单、灵活、优雅的中文语音对话机器人/智能音箱项目,还可能是首个支持脑机交互的开源智能音箱项目。扩展:接私活
特性
模块化。功能插件、语音识别、语音合成、对话机器人都做到了高度模块化,第三方插件单独维护,方便继承和开发自己的插件。
中文支持。集成百度、科大讯飞、阿里、腾讯等多家中文语音识别和语音合成技术,且可以继续扩展。
对话机器人支持。支持基于 AnyQ 的本地对话机器人,并支持接入图灵机器人、Emotibot 等在线对话机器人。
全局监听,离线唤醒。支持 Muse 脑机唤醒,及无接触的离线语音指令唤醒。
灵活可配置。支持定制机器人名字,支持选择语音识别和合成的插件。
智能家居。支持和 mqtt、HomeAssistant 等智能家居协议联动,支持语音控制智能家电。
后台配套支持。提供配套后台,可实现远程操控、修改配置和日志查看等功能。
另外,搜索公众号Linux就该这样学后台回复“知识库”,获取一份惊喜礼包。
开放API。可利用后端开放的API,实现更丰富的功能。
安装简单,支持更多平台。相比 dingdang-robot ,舍弃了 PocketSphinx 的离线唤醒方案,安装变得更加简单,代码量更少,更易于维护并且能在 Mac 以及更多 Linux 系统中运行。
工作机制
wukong-robot 被唤醒后,用户的语音指令先经过 ASR 引擎进行 ASR 识别成文本,然后对识别到的文本进行 NLU 解析,再将解析结果进行技能匹配,交给适合处理该指令的技能插件去处理。插件处理完成后,得到的结果再交给 TTS 引擎合成成语音,播放给用户。
虽然一次交互可能包含多次网络请求,不过带来的好处是:每一个环节都可以被修改和定制。而且我认为,到了 5G 时代,音箱的响应速度将不再成为体验问题。可定制和个性化才是未来的主流,而届时 wukong-robot 将会是更好的选择!
功能演示
项目源码,怎么领取?
扫码下方二维码,后台回复【机器人】即可获取所有系统
在 GitHub猿 还有更多优质项目系统学习资源,欢迎分享给其他同学吧!
猿哥个人微信
添加猿哥个人微信即送一份惊喜大礼包
→ 技术资料共享
→ 技术交流社群
一款现代化社区(论坛/问答/BBS/社交网络/博客)系统平台!一款开源的车牌识别系统!
最近,GitHub猿建了一个「GitHub猿交流群」,欢迎大家一起交流优秀开源项目,也可以宣传自己的开源项目,在 「GitHub猿」公众号后台回复【加群】邀请你入群。