分享

一个简单的语音识别实现

 新用户79878317 2022-12-10 发布于河南

测试音频

链接:http://pan.baidu.com/s/1o8Ue4B4 密码:o5r1 ]

注意事项

  • 音频格式限制
    pcm(不压缩)、wav、amr

  • 采样频率及位数
    支持评测 8k/16k 采样率 16bit 位深的单声道语音(这个采样频率支持确实不太友好,大部分手机和电脑录音的现在都是44KHz了)

安装SDK

可以直接pip安装

pip install baidu-aip

接口调用

# 引入Speech SDKfrom aip import AipSpeechimport os
path = 'D:/data/VoiceRecog/'os.chdir(path)# 定义常量APP_ID = '你的 App ID'API_KEY = '你的 API Key'SECRET_KEY = '你的 Secret Key'# 初始化AipSpeech对象aipSpeech = AipSpeech(APP_ID, API_KEY, SECRET_KEY)# 读取文件def get_file_content(filePath):
    with open(filePath, 'rb') as fp:        return fp.read()# 识别本地文件#aipSpeech.asr(get_file_content('demo0.wav'), 'wav', 16000, {'lan': 'zh',})#遍历文件夹中的wav并进行识别for dir in [x for x in os.listdir(path) if x[-1]=='v']:    print dir    try:
        t = aipSpeech.asr(get_file_content(dir), 'wav', 16000, { 'lan': 'zh',})        #print t
        print t['result'][0]    except:        print 'error ,pass'

识别结果:

demo0.wav
没有,你除了关心这个还关心过什么人是肉长的,如果再这样下去也没有什么意思了,
demo1.wav
18012345678,
demo2.wav
中美数控,

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多