可实现本地电脑的音频转文字软件!双向转换,完全免费开源!支持 Windows、macOS、Linux
(目前界面只有英文的,但支持中文的转换)
特征
- 基于 DirectCompute 的供应商不可知的 GPGPU;该技术的另一个名称是“Direct3D 11 中的计算着色器”
- 纯 C++ 实现,除了基本的 OS 组件外没有运行时依赖性
- 比 OpenAI 的实现快得多。
- 混合 F16 / F32 精度:自 D3D 版本 10.0 起,Windows [color=var(--color-accent-fg)]需要缓冲区 的支持R16_FLOAT
- 内置性能分析器,可测量单个计算着色器的执行时间
- 内存使用率低
- 用于音频处理的媒体基础,支持大多数音频和视频格式(Ogg Vorbis 除外),以及大多数在 Windows 上运行的音频捕获设备(除了一些专业的,它们只实现 ASIO API [color=var(--color-accent-fg)]。
- 用于音频捕获的语音活动检测。
使用步骤:
下载 WhisperDesktop.zip、ggml-medium 语音模型(官方那里有好多规格如图一,作者推荐1.42G这个模型,下面百度云盘下载链接)
图一
解压WhisperDesktop.zip,打开WhisperDesktop.exe,首先选择要加载的语音模型
加载完成后,就可以进行语音转文了
转换的过程如下图:
结果以文本格式输入。
另外一个功能是允许从麦克风捕获和转录或翻译实时音频
gui-capture.png
ggml-medium 语音模型(官方):
https://huggingface.co/datasets/ggerganov/whisper.cpp/tree/main
作者推荐ggml-medium.bin(大小为 1.42GB)
链接:https://pan.baidu.com/s/1xcemqdg_H5OWMlDx4hzcuQ?pwd=fk2d
提取码:fk2d
蓝奏下载(最小的体验包):https://wwnn.lanzoue.com/iZVcM0wq5lvg 密码:7go1
Whisper :开源项目(官方)
https://github.com/Const-me/Whisper
蓝奏下载 :https://wwnn.lanzoue.com/iDT010wq4q6f 密码:57ko
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件!
如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
暂无“WhisperDesktop1.8音频转文字软件双向【免费开源】”评论...
RTX 5090要首发 性能要翻倍!三星展示GDDR7显存
三星在GTC上展示了专为下一代游戏GPU设计的GDDR7内存。
首次推出的GDDR7内存模块密度为16GB,每个模块容量为2GB。其速度预设为32 Gbps(PAM3),但也可以降至28 Gbps,以提高产量和初始阶段的整体性能和成本效益。
据三星表示,GDDR7内存的能效将提高20%,同时工作电压仅为1.1V,低于标准的1.2V。通过采用更新的封装材料和优化的电路设计,使得在高速运行时的发热量降低,GDDR7的热阻比GDDR6降低了70%。
更新动态
2024年05月04日
2024年05月04日
- StockfischRecords老虎鱼卡帕与和谐二重唱《远航-遥距的小岛》SACD-ISO
- 古璇《粤听粤好听》柏菲音乐[WAV]
- 李祥庭-幽居(古琴独奏)[正版CD原抓WAV+CUE]
- 谭艳《再度重相逢HQ》头版限量编号[低速原抓WAV+CUE]
- 群星《人声典范-金嗓子 DSD》[WAV+CUE][524M]
- 群星《旅途欢歌》2CD[WAV+CUE][1.3G]
- BlackWings Audio《女神异闻录 夜幕魅影-OST1》[320K/MP3][113.76MB]
- 海来阿木《西楼情歌》开盘母带[低速原抓WAV+CUE]
- 陈百强.2003-完全陈百强5CD【华纳】【WAV+CUE】
- 群星.2012-顾听生辉·乐坛大宗师经典半世纪3CD【环球】【WAV+CUE】
- BlackWings Audio《女神异闻录 夜幕魅影-OST1》[FLAC/分轨][332.91MB]
- 群星《音你而来 第2期》[320K/MP3][72.1MB]
- 群星《音你而来 第2期》[FLAC/分轨][197.58MB]
- 群星-中国新民乐(笛子)-戏竹4CD(DSD)[雨林唱片]WAV+CUE
- JacobCollier《DjesseVol.2》(2019)Hi-Res96kHz_24bit