VibeVoice — семейство open-source моделей TTS и ASR от Microsoft для обработки длинных аудио до 90 мин с поддержкой multi-speaker, timestamps и custom context.
источник ↗VibeVoice — семейство open-source моделей TTS и ASR от Microsoft для обработки длинных аудио до 90 мин с поддержкой multi-speaker, timestamps и custom context.
источник ↗