LiveASR

简介：本项目是基于 sherpa-onnx 搭建的一个实时语音识别系统。

系统安装步骤

git clone https://github.com/LJoson/LiveASR.git
# 首先安装必要的python库
cd ./LiveASR
pip3 install -r requirements.txt

系统运行步骤

在安装完必要的库之后，就可以运行了，主要的运行文件是 LiveASRGUI.py，运行该文件即可启动系统。（由于gpu部分功能未测试，所以暂时没有使用gpu）

python3 LiveASRGUI.py

实现原理

通信

项目中的通信主要使用的是 Websocket 模块实现
异步编程

项目中的异步编程主要使用的是 asyncio 模块实现，其中主要的异步任务包括：
- 语音识别任务：使用 sherpa-onnx 模块进行语音识别，并将识别结果动态刷新

致谢与引用

本项目在开发过程中参考和使用了以下开源项目和技术，在此表示诚挚的感谢：

核心语音识别引擎

sherpa-onnx - 基于 ONNX 的语音识别工具包，提供了高效的语音识别功能
Whisper - OpenAI 开发的开源语音识别模型，为语音识别技术提供了重要参考
speech-to-text - 基于 faster-whisper 的实时语音转文字项目，提供了优秀的实时转录功能

中文语音识别相关

FunASR - 阿里巴巴达摩院开源的中文语音识别工具包
PPASR - 基于 PaddlePaddle 的中文语音识别项目
RapidASR - 快速语音识别框架

语音识别 GUI 工具

faster-whisper-GUI - Faster Whisper 的图形界面实现
Whisper-WebUI - Whisper 的 Web 界面实现
WhisperGUI - Whisper 的桌面应用界面
asr-gui - 语音识别图形界面工具

其他相关项目

CapsWriter-Offline - 离线语音输入工具
buzz - 语音转文字工具
Const-me/Whisper - Whisper 的 C++ 实现

技术参考

51CTO 文章 - 关于语音识别技术的技术文章
IDC 帮助文档 - 语音识别相关技术文档

许可证

本项目遵循 GNU 通用公共许可证（GPL）。详情请参阅 LICENSE 文件。

欢迎贡献

我们非常欢迎任何形式的贡献，包括但不限于：

提交问题和建议
改进文档
添加新功能
修复 bug
优化性能

如果您想为项目做出贡献，请遵循以下步骤：

Fork 本仓库
创建您的特性分支 (git checkout -b feature/amazing-feature)
提交您的更改 (git commit -m 'Add some amazing feature')
推送到分支 (git push origin feature/amazing-feature)
开启一个 Pull Request

反馈与建议

如果您在使用过程中遇到任何问题，或有任何建议和意见，欢迎通过以下方式联系我们：

在 GitHub 上提交 Issue
发送邮件至：1250377062@qq.com

您的反馈对我们非常重要，将帮助我们不断改进和完善这个项目。

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
UI		UI
assets		assets
config		config
resource		resource
web		web
.gitignore		.gitignore
GUIConfig.json		GUIConfig.json
LICENSE		LICENSE
LiveASRGUI.py		LiveASRGUI.py
LiveASRGUI.spec		LiveASRGUI.spec
fix_qt_import_error.py		fix_qt_import_error.py
hotwords.txt		hotwords.txt
itn_zh_number.fst		itn_zh_number.fst
liveasr.log		liveasr.log
liveasrgui.log		liveasrgui.log
readme.md		readme.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

LiveASR

系统安装步骤

系统运行步骤

实现原理

致谢与引用

核心语音识别引擎

中文语音识别相关

语音识别 GUI 工具

其他相关项目

技术参考

许可证

欢迎贡献

反馈与建议

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

LiveASR

系统安装步骤

系统运行步骤

实现原理

致谢与引用

核心语音识别引擎

中文语音识别相关

语音识别 GUI 工具

其他相关项目

技术参考

许可证

欢迎贡献

反馈与建议

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages