Ziyang.Zhang
|
52a0fdfd89
|
[项目重构/说话人识别] 完成项目重构,基于Funasr、FastAPI、Websocket的具有VAD、ASR、SPK(说话人识别)功能的asr_server服务器;重构了基于Functor(功能模块)、Pipeline(处理流程)、Runner(单一Pipeline多用户并发管理)的三层实现层+FastAPI&Websocket用户接入层的服务器;使用uv进行项目依赖管理、支持docker一键部署。
|
2025-07-10 10:17:21 +08:00 |
|
Ziyang.Zhang
|
eff22cb33e
|
[Feature] 测试了后续的ASR、punc、spk效果; BUG:在调用funasr后,logger信息会被改变,导致格式变化,重复输出。
|
2025-04-16 14:30:11 +08:00 |
|
|
f7138dcb39
|
[Feature] 调整VAD工作流程,规范VAD产出数据规范为 models/audiobinary中的AudioBinary_Chunk;完整测试LogicTrager VAD online流程。
|
2025-04-15 17:15:13 +08:00 |
|
|
8b69ff195f
|
[Feature] Add /tests/modelsuse 测试实时VAD检测。
|
2025-04-15 13:53:06 +08:00 |
|
|
86e5425787
|
[Init] 初始化项目,基于funasr的实时语音识别
|
2025-04-14 11:04:36 +08:00 |
|