Github 23.3k Star！一款开源的前沿语音AI！

作者: 微信公众号发布于: 2026-04-03 阅读: 5 来源: 微信公众号

开源AI GitHub VibeVoice TTS ASR Qwen2.5 语音合成语音识别实时流处理深度学习

VibeVoice是一款集成了TTS、ASR和实时流式处理的开源语音AI框架。基于Qwen2.5模型与7.5Hz超低帧率Tokenizer，支持长文本多说话人合成、高精度识别及低延迟交互。

查看原文