Ziyang.Zhang
|
eff22cb33e
|
[Feature] 测试了后续的ASR、punc、spk效果; BUG:在调用funasr后,logger信息会被改变,导致格式变化,重复输出。
|
2025-04-16 14:30:11 +08:00 |
|
Ziyang.Zhang
|
66c9477e4b
|
[Feature] 添加src/utils/logger文件控制程序日志输出,包括一个root配置器和logger生成器。
|
2025-04-16 10:46:09 +08:00 |
|
|
9d522fa137
|
Merge branch 'feature_vad' into dev
[项目结构变动] 分离了模型加载、功能实现、整体工作流等内容
[功能开发] 使用pydantic规范数据格式;开发VAD声音端点检测functor;
[测试] 完成了本地流式(online)的VAD检测,完成了 logic_traher(仅包含VAD与VAD检测结果)的工作流程测试
[未来内容] 1.完成ASR、时间戳、说话人识别;2.接入websocket服务。
|
2025-04-15 17:18:48 +08:00 |
|
|
f7138dcb39
|
[Feature] 调整VAD工作流程,规范VAD产出数据规范为 models/audiobinary中的AudioBinary_Chunk;完整测试LogicTrager VAD online流程。
|
2025-04-15 17:15:13 +08:00 |
|
|
8b69ff195f
|
[Feature] Add /tests/modelsuse 测试实时VAD检测。
|
2025-04-15 13:53:06 +08:00 |
|
|
86e5425787
|
[Init] 初始化项目,基于funasr的实时语音识别
|
2025-04-14 11:04:36 +08:00 |
|