Каталог / heygen-com / hyperframes-media

hyperframes-media

heygen-com/hyperframes
1.6K
установок
#280
в рейтинге

Что делает

Генерируй речь, транскрибируй аудио с временными метками и удаляй фон видео для прозрачных оверлеев.
  • Три CLI команды (tts, transcribe, remove-background), каждая из которых скачивает и кэширует собственную модель при первом запуске; API ключи не требуются
  • Текст-в-речь поддерживает 54 многоязычных голоса (American, British, Spanish, French, Hindi, Italian, Japanese, Portuguese, Mandarin) с контролем скорости; авто-определяет язык из префикса голоса
  • Транскрипция производит word-level временные метки в нормализованном JSON; поддерживает несколько форматов ввода (аудио, видео, SRT/VTT, OpenAI ответы) с настраиваемыми размерами Whisper модели и explicit выбор языка для предотвращения тихих ошибок перевода
  • Удаление фона выводит VP9 WebM с альфа-каналом (или ProRes/PNG) для прозрачных оверлеев; опциональный флаг --background-output создаёт inverse слой вырезанной дырки для compositing текста или графики между субъектом и фоном

Установка

$ npx skills add heygen-com/hyperframes