#!/usr/bin/env python
import requests
import json
import base64
import pyaudio
import wave
import os
import psutil
#首先配置必要的信息
def bat(voice_path):
baidu_server = 'https://aip.baidubce.com/oauth/2.0/token"wate_play"
#读取文件二进制内容
f_obj = open(FILE_NAME, 'rb')
content = base64.b64encode(f_obj.read()) # 百度语音识别需要base64编码格式
speech = content.decode("utf-8")
size = os.path.getsize(FILE_NAME)
#json封装
datas = json.dumps({
'format': FILE_TYPE,
'rate': VOICE_RATE,
'channel': 1,
'cuid': CUID,
'token': token,
'speech': speech,
'len': size,
"dev_pid":"1536"
})
return datas
#设置headers和请求地址url
def post(datas):
headers = {'Content-Type':'application/json'}
url = 'https://vop.baidu.com/server_api'
# url = "http://vop.baidu.com/server_api"
#用post方法传数据
request = requests.post(url, datas, headers)
result = json.loads(request.text)
text = result.get("result")
if result['err_no'] == 0:
return text
else:
return "Error"
def get_audio(filepath):
input("回车开始录音 >") #输出提示文本,input接收一个值,转为str,赋值给aa
CHUNK = 256 #定义数据流块
FORMAT = pyaudio.paInt16 #量化位数(音量级划分)
CHANNELS = 1 # 声道数;声道数:可以是单声道或者是双声道
RATE = 8000 # 采样率;采样率:一秒内对声音信号的采集次数,常用的有8kHz, 16kHz, 32kHz, 48kHz, 11.025kHz, 22.05kHz, 44.1kHz
RECORD_SECONDS = 5 #录音秒数
WAVE_OUTPUT_FILENAME = filepath #wav文件路径
p = pyaudio.PyAudio() #实例化
stream = p.open(format=FORMAT,
channels=CHANNELS,
rate=RATE,
input=True,
frames_per_buffer=CHUNK)
print("*"*10, "开始录音:请在5秒内输入语音")
frames = [] #定义一个列表
for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)): #循环,采样率11025 / 256 * 5
data = stream.read(CHUNK) #读取chunk个字节 保存到data中
frames.append(data) #向列表frames中添加数据data
# print(frames)
print("*" * 10, "录音结束\n")
stream.stop_stream()
stream.close() #关闭
p.terminate() #终结
wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb') #打开wav文件创建一个音频对象wf,开始写WAV文件
wf.setnchannels(CHANNELS) #配置声道数
wf.setsampwidth(p.get_sample_size(FORMAT)) #配置量化位数
wf.setframerate(RATE) #配置采样率
wf.writeframes(b''.join(frames)) #转换为二进制数据写入文件
wf.close() #关闭
return
def check_disk():
list_drive = psutil.disk_partitions() # 找出本地磁盘列表,保存的是结构体对象
list_disk = []
for drive in list_drive:
list_disk.append(drive.device)
return list_disk
if __name__ == '__main__':
list_disk = check_disk() # 检索本地磁盘
dirname_path = os.path.join(list_disk[0], "voice") # 设置语音文件存放路径,
(mac os下需要自己定存储路径)
if not os.path.exists(dirname_path):
os.makedirs(dirname_path)
filename = "voice.wav" # 定义语音文件名
in_path = os.path.join(dirname_path, filename)
get_audio(in_path) # 录音
datas = bat(in_path) # 封装百度语音识别需要的配置信息,返回请求头
res = post(datas) # 连接百度语音识别接口,得到识别结果
print("识别结果:",res[0])
实现效果:
在上述代码中,需要装到requests、psutil、pyaudio等库,其中pyaudio这个库在python3环境下装比较特殊,
windows环境下具体步骤如下:
第一步:下载whl文件支持
url:https://www.lfd.uci.edu/~gohlke/pythonlibs/#pyaudio
注意:
下载自己python解释器对应版本的
不要下载错了,资源很多
第二步:打开cmd,cd 进入下载的whl所在目录
执行命令:pip install Twisted-18.7.0-cp36-cp36m-win_amd64.whl # 下载的什么版本,后面就跟什么版本
第三步:执行命令:pip install pyaudio 安装
如果本地同时装有python2和python3,想装到python3里可以在cmd命令里把 pip 改成 pip3 即可
mac os 下安装pyaudio步骤如下:
到这里就结束啦!
以上就是python录音并调用百度语音识别接口的示例的详细内容,更多关于python 录音并调用语音识别接口的资料请关注其它相关文章!
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件!
如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
暂无“python录音并调用百度语音识别接口的示例”评论...
稳了!魔兽国服回归的3条重磅消息!官宣时间再确认!
昨天有一位朋友在大神群里分享,自己亚服账号被封号之后居然弹出了国服的封号信息对话框。
这里面让他访问的是一个国服的战网网址,com.cn和后面的zh都非常明白地表明这就是国服战网。
而他在复制这个网址并且进行登录之后,确实是网易的网址,也就是我们熟悉的停服之后国服发布的暴雪游戏产品运营到期开放退款的说明。这是一件比较奇怪的事情,因为以前都没有出现这样的情况,现在突然提示跳转到国服战网的网址,是不是说明了简体中文客户端已经开始进行更新了呢?
更新动态
2025年10月28日
2025年10月28日
- 小骆驼-《草原狼2(蓝光CD)》[原抓WAV+CUE]
- 群星《欢迎来到我身边 电影原声专辑》[320K/MP3][105.02MB]
- 群星《欢迎来到我身边 电影原声专辑》[FLAC/分轨][480.9MB]
- 雷婷《梦里蓝天HQⅡ》 2023头版限量编号低速原抓[WAV+CUE][463M]
- 群星《2024好听新歌42》AI调整音效【WAV分轨】
- 王思雨-《思念陪着鸿雁飞》WAV
- 王思雨《喜马拉雅HQ》头版限量编号[WAV+CUE]
- 李健《无时无刻》[WAV+CUE][590M]
- 陈奕迅《酝酿》[WAV分轨][502M]
- 卓依婷《化蝶》2CD[WAV+CUE][1.1G]
- 群星《吉他王(黑胶CD)》[WAV+CUE]
- 齐秦《穿乐(穿越)》[WAV+CUE]
- 发烧珍品《数位CD音响测试-动向效果(九)》【WAV+CUE】
- 邝美云《邝美云精装歌集》[DSF][1.6G]
- 吕方《爱一回伤一回》[WAV+CUE][454M]


