Инструмент для создания M4B-аудиокниг из EPUB-файлов с помощью нейросети Kokoro-82M.
источник ↗#text-to-speech
2 записейVibeVoice — семейство open-source моделей TTS и ASR от Microsoft для обработки длинных аудио до 90 мин с поддержкой multi-speaker, timestamps и custom context.
источник ↗