STT_Server

8 Commits 4 Branches 0 Tags

Author	SHA1	Message	Date
Ziyang.Zhang	040fc57e02	[代码重构中]重构Functor下的函数定义，修改为一个BaseFunctor+ModelLoader+DataCache进行基底构建。	2025-05-21 11:49:28 +08:00
Ziyang.Zhang	1392168126	Merge branch 'feature_logger' into dev [Feature] 添加了logger用于管理日志，同时测试了ASR、PUNC、SPK模型效果； [BUG] 发现BUG：使用funasr的一些模块会导致logger被更改，这一点需要进一步讨论解决方案	2025-04-16 14:30:40 +08:00
Ziyang.Zhang	eff22cb33e	[Feature] 测试了后续的ASR、punc、spk效果； BUG：在调用funasr后，logger信息会被改变，导致格式变化，重复输出。	2025-04-16 14:30:11 +08:00
Ziyang.Zhang	66c9477e4b	[Feature] 添加src/utils/logger文件控制程序日志输出，包括一个root配置器和logger生成器。	2025-04-16 10:46:09 +08:00
Keeeer	9d522fa137	Merge branch 'feature_vad' into dev [项目结构变动] 分离了模型加载、功能实现、整体工作流等内容 [功能开发] 使用pydantic规范数据格式；开发VAD声音端点检测functor； [测试] 完成了本地流式（online）的VAD检测，完成了 logic_traher（仅包含VAD与VAD检测结果）的工作流程测试 [未来内容] 1.完成ASR、时间戳、说话人识别；2.接入websocket服务。	2025-04-15 17:18:48 +08:00
Keeeer	f7138dcb39	[Feature] 调整VAD工作流程，规范VAD产出数据规范为 models/audiobinary中的AudioBinary_Chunk；完整测试LogicTrager VAD online流程。	2025-04-15 17:15:13 +08:00
Keeeer	8b69ff195f	[Feature] Add /tests/modelsuse 测试实时VAD检测。	2025-04-15 13:53:06 +08:00
Keeeer	86e5425787	[Init] 初始化项目，基于funasr的实时语音识别	2025-04-14 11:04:36 +08:00