Каталог / heygen-com / hyperframes-media
hyperframes-media
heygen-com/hyperframes
1.6K
установок
#280
в рейтинге
Что делает
Генерируй речь, транскрибируй аудио с временными метками и удаляй фон видео для прозрачных оверлеев.
- Три CLI команды (tts, transcribe, remove-background), каждая из которых скачивает и кэширует собственную модель при первом запуске; API ключи не требуются
- Текст-в-речь поддерживает 54 многоязычных голоса (American, British, Spanish, French, Hindi, Italian, Japanese, Portuguese, Mandarin) с контролем скорости; авто-определяет язык из префикса голоса
- Транскрипция производит word-level временные метки в нормализованном JSON; поддерживает несколько форматов ввода (аудио, видео, SRT/VTT, OpenAI ответы) с настраиваемыми размерами Whisper модели и explicit выбор языка для предотвращения тихих ошибок перевода
- Удаление фона выводит VP9 WebM с альфа-каналом (или ProRes/PNG) для прозрачных оверлеев; опциональный флаг --background-output создаёт inverse слой вырезанной дырки для compositing текста или графики между субъектом и фоном
Установка
$ npx skills add heygen-com/hyperframes