11 Commits

Author SHA1 Message Date
Ziyang.Zhang
3083738db4 [fastAPI]完成fastAPI-websocket端口搭建与测试,接收float32的tobytes字节流。 2025-07-02 15:49:21 +08:00
Ziyang.Zhang
1a296d8309 [说话人认证]SPKFunctor完成本地说话人embs/wav加载。 2025-07-02 09:59:31 +08:00
Ziyang.Zhang
4e9dd83d55 [说话人认证]编写SPKFunctor,使用cam++提取embs,用余弦相似度判断得分。 2025-06-30 14:13:06 +08:00
Ziyang.Zhang
5dac718dee [Runner]完成ASRRunner的编写和测试,使用MockWebSocket完成虚拟网络连接。 2025-06-25 17:36:07 +08:00
Ziyang.Zhang
5a820b49e4 [代码结构]black . 对所有文件格式调整,无功能变化。 2025-06-12 15:49:43 +08:00
Ziyang.Zhang
5b94c40016 [代码重构中]编写融合VAD,ASR,SPK(FAKE)的ASRPipeline并完成测试,正常运行。 2025-06-06 17:26:08 +08:00
Ziyang.Zhang
b569b7e63d [代码重构中]测试VADFuntor中,发现字节流推理问题,待进一步研究 2025-06-03 17:41:59 +08:00
Ziyang.Zhang
eff22cb33e [Feature] 测试了后续的ASR、punc、spk效果; BUG:在调用funasr后,logger信息会被改变,导致格式变化,重复输出。 2025-04-16 14:30:11 +08:00
Ziyang.Zhang
66c9477e4b [Feature] 添加src/utils/logger文件控制程序日志输出,包括一个root配置器和logger生成器。 2025-04-16 10:46:09 +08:00
f7138dcb39 [Feature] 调整VAD工作流程,规范VAD产出数据规范为 models/audiobinary中的AudioBinary_Chunk;完整测试LogicTrager VAD online流程。 2025-04-15 17:15:13 +08:00
8b69ff195f [Feature] Add /tests/modelsuse 测试实时VAD检测。 2025-04-15 13:53:06 +08:00