Ziyang.Zhang
|
1a296d8309
|
[说话人认证]SPKFunctor完成本地说话人embs/wav加载。
|
2025-07-02 09:59:31 +08:00 |
|
Ziyang.Zhang
|
4e9dd83d55
|
[说话人认证]编写SPKFunctor,使用cam++提取embs,用余弦相似度判断得分。
|
2025-06-30 14:13:06 +08:00 |
|
Ziyang.Zhang
|
5dac718dee
|
[Runner]完成ASRRunner的编写和测试,使用MockWebSocket完成虚拟网络连接。
|
2025-06-25 17:36:07 +08:00 |
|
Ziyang.Zhang
|
5a820b49e4
|
[代码结构]black . 对所有文件格式调整,无功能变化。
|
2025-06-12 15:49:43 +08:00 |
|
Ziyang.Zhang
|
5b94c40016
|
[代码重构中]编写融合VAD,ASR,SPK(FAKE)的ASRPipeline并完成测试,正常运行。
|
2025-06-06 17:26:08 +08:00 |
|
Ziyang.Zhang
|
b569b7e63d
|
[代码重构中]测试VADFuntor中,发现字节流推理问题,待进一步研究
|
2025-06-03 17:41:59 +08:00 |
|
Ziyang.Zhang
|
eff22cb33e
|
[Feature] 测试了后续的ASR、punc、spk效果; BUG:在调用funasr后,logger信息会被改变,导致格式变化,重复输出。
|
2025-04-16 14:30:11 +08:00 |
|
Ziyang.Zhang
|
66c9477e4b
|
[Feature] 添加src/utils/logger文件控制程序日志输出,包括一个root配置器和logger生成器。
|
2025-04-16 10:46:09 +08:00 |
|
|
f7138dcb39
|
[Feature] 调整VAD工作流程,规范VAD产出数据规范为 models/audiobinary中的AudioBinary_Chunk;完整测试LogicTrager VAD online流程。
|
2025-04-15 17:15:13 +08:00 |
|
|
8b69ff195f
|
[Feature] Add /tests/modelsuse 测试实时VAD检测。
|
2025-04-15 13:53:06 +08:00 |
|