STT_Server

Author	SHA1	Message	Date
Ziyang.Zhang	5a820b49e4	[代码结构]black . 对所有文件格式调整，无功能变化。	2025-06-12 15:49:43 +08:00
Ziyang.Zhang	5b94c40016	[代码重构中]编写融合VAD,ASR,SPK(FAKE)的ASRPipeline并完成测试，正常运行。	2025-06-06 17:26:08 +08:00
Ziyang.Zhang	3d8bf9de25	[代码重构中]创建假的SPKFunctor以测试消息队列流程是否正确，无问题，待进一步实现说话人识别，此外，考虑将一些共有内容写入BaseFunctor中。	2025-06-05 17:08:42 +08:00
Ziyang.Zhang	ff9bd70039	[代码重构中]初步构建ASRFunctor，与VADFunctor在vad_test.py中进行联调无问题，数据衔接正常。	2025-06-05 15:57:11 +08:00
Ziyang.Zhang	4e9e94d8dc	[代码重构中]完善VADFunctor，测试持久化保存VAD片段的音频数据成功。	2025-06-05 13:43:23 +08:00
Ziyang.Zhang	b569b7e63d	[代码重构中]测试VADFuntor中，发现字节流推理问题，待进一步研究	2025-06-03 17:41:59 +08:00
Ziyang.Zhang	703a40e955	[代码重构中]重构model_loader与audio_chunk，全局单例模式管理模型加载与audiobinary数据存储单元类。删除readme中不需要的MIT许可证。	2025-05-28 10:35:35 +08:00
Ziyang.Zhang	eff22cb33e	[Feature] 测试了后续的ASR、punc、spk效果； BUG：在调用funasr后，logger信息会被改变，导致格式变化，重复输出。	2025-04-16 14:30:11 +08:00
Keeeer	f7138dcb39	[Feature] 调整VAD工作流程，规范VAD产出数据规范为 models/audiobinary中的AudioBinary_Chunk；完整测试LogicTrager VAD online流程。	2025-04-15 17:15:13 +08:00
Keeeer	8b69ff195f	[Feature] Add /tests/modelsuse 测试实时VAD检测。	2025-04-15 13:53:06 +08:00
Keeeer	86e5425787	[Init] 初始化项目，基于funasr的实时语音识别	2025-04-14 11:04:36 +08:00

11 Commits