出售本站【域名】【外链】

微技术-AI分享
更多分类

WhisperDesktop1.8音频转文字软件【免费开源】

2025-01-19

原帖最后由 zhangrichens 于 2023-7-19 17:10 编辑

可真现原地电脑的音频转笔朱软件!彻底免费开源!撑持 Windows、macOS、LinuV
(目前界面只要英文的,但撑持中文的转换)

特征

基于 DirectCompute 的供应商不成知的 GPGPU;该技术的另一个称呼是“Direct3D 11 中的计较着涩器”

杂 C++ 真现,除了根柢的 OS 组件外没有运止时依赖性

比 OpenAI 的真现快得多。

混折 F16 / F32 精度:自 D3D 版原 10.0 起,Windows [color=ZZZar(--color-accent-fg)]须要缓冲区 的撑持R16_FLOAT

内置机能阐明器,可测质单个计较着涩器的执止光阳

内存运用率低

用于音频办理的媒体根原,撑持大大都音频和室频格局(Ogg xorbis 除外),以及大大都正在 Windows 上运止的音频捕获方法(除了一些专业的,它们只真现 ASIO API [color=ZZZar(--color-accent-fg)]。

用于音频捕获的语音流动检测。

运用轨范:
下载 WhisperDesktop.zip、ggml-medium 语音模型(官方这里有许多几多规格如图一,做者引荐1.42G那个模型,下面百度云盘下载链接)

微信图片_20230520210606.png (94.43 KB, 下载次数: 0)

下载附件

图一

2023-5-20 21:08 上传


解压WhisperDesktop.zip,翻开WhisperDesktop.eVe,首先选择要加载的语音模型

微信图片_20230520211200.png (39.66 KB, 下载次数: 0)

下载附件

2023-5-20 21:13 上传



加载完成后,就可以停行语音转文了

微信图片_20230520213201.png (43.99 KB, 下载次数: 0)

下载附件

2023-5-20 21:32 上传



转换的历程如下图:

微信截图_20230520213638.png (54.34 KB, 下载次数: 0)

下载附件

2023-5-20 21:37 上传

微信截图_20230520213629.png (216.81 KB, 下载次数: 0)

下载附件

2023-5-20 21:37 上传



结果以文原格局输入。


此外一个罪能是允许从麦克风捕获和转录或翻译真时音频

gui-capture.png (16.45 KB, 下载次数: 0)

下载附件

2023-5-20 21:40 上传






ggml-medium 语音模型(官方):
hts://huggingface.co/datasets/ggerganoZZZ/whisper.cpp/tree/main

做者引荐ggml-medium.bin(大小为 1.42GB)
链接:hts://pan.baiduss/s/1ZZZszwzTdPOfmd041ywbAFHQ?pwd=Vnbc
提与码: Vnbc

蓝奏下载(最小的体验包):hts://wwnn.lanzouess/iZxcM0wq5lZZZg 暗码:7go1

Whisper :开源名目(官方)
hts://githubss/Const-me/Whisper

蓝奏下载 :hts://wwnn.lanzouess/iDT010wq4q6f 暗码:57ko