前言:家里老人在电脑上看电视剧时不会播放、暂停等操作,老人学习能力较差,这些简单的操作完全可以通过程序完成,于是我便想通过语音识别实现控制视频播放,实现起来也很简单,接下来我会分享自己开发中的每一步 目标:实现语音控制视频播放、暂停、增大音量、减小音量 准备:离线语音识别模块、CH340 USB转TTL模块(用于下载、通信,一般商家会提供配套)、电脑 原理概述:首先给语音识别模块设置好命令词,语音模块识别出来后通过串口将指令发送给电脑,电脑上的python程序根据串口接收的数据执行播放、暂停等操作 第一步:设置语音模块 注意,购买的语音模块一定要有串口输出功能 各种语音模块设置方法不一样,大家按商家给的教程弄,我使用的模块是在网页端进行设置 串口参数设置,保持默认就行,简单记一下波特率,后面python编程会用 设置命令词和回复语 设置命令词对应动作 发送的数据尽量设置简单一点,只要后面的程序能和这里对应就行,比如我设置的是0、1、2、3 编译固件、烧录程序等就不演示了,各种语音模块方法不一样,大家按商家给的教程弄 第二步:编写python程序 程序只有几十行,很简单,不过我们先做一项准备工作,查看语音模块的端口名 打开电脑的设备管理器,我是win10,所以打开方法是右键此电脑-管理-设备管理器,然后展开端口,将语音模块插入电脑,我这里增加的端口是USB-SERIAL CH340(COM3),括号里的端口号不管,注意端口名是“USB-SERIAL CH340”中间有空格,那么我们用USB-SERIAL或者CH340其中一个进行识别就行(但不能用USB-SERIAL CH340,否则识别不出来,这和后面编程有关),我们先记住,后面会用 接下来就是代码了,程序的工作方式就是自动扫描并打开串口,接受串口数据,根据数据模拟按下按键的操作,实现播放暂停等功能,代码大部分已注释,大家应该能看懂 第三步:收尾 将python打包成exe并将程序设置为开机启动,其实设置开机启动可有可无,但是因为语音模块需要配合python程序才有控制视频的功能,所以为了我不在的时候我的家人打开电脑插上语音模块就能使用这个功能,我就直接开机启动了,网上有非常详细的教程,我就不多赘述了,大家直接百度即可 最后,享受成果吧 这是我使用的语音模块,很小,一只手就能握住
插在电脑上的样子,下面吊着的是喇叭
大家还可以继续开发更多其他功能,比如python可以打开外部软件,音乐软件有全局快捷键,可以让语音模块控制电脑打开音乐软件放歌等等,原理是一样的 参考: https://blog.csdn.net/cp_srd/article/details/104741429 https://blog.csdn.net/weixin_28432777/article/details/113673599
|