Открытая многоязычная TTS-модель с 0.1B параметров для реального времени на CPU от MOSI.AI и OpenMOSS.
источник ↗#tts
2 записейVibeVoice — семейство open-source моделей TTS и ASR от Microsoft для обработки длинных аудио до 90 мин с поддержкой multi-speaker, timestamps и custom context.
источник ↗