Озвучка через ElevenLabs (опційно)
Голосова озвучка зверху текстової карусель — це +30-50% retention. Глядач не просто читає, а слухає. ElevenLabs — найкраща платформа для AI-голосу зараз, і для нашого об'єму вистачає free tier.
Цей крок опційний — без озвучки відео теж працює, особливо якщо текст крупний і читабельний. Але якщо хочеш максимальну конверсію — додавай.
Free tier ElevenLabs — що отримуєш
10,000 символів на місяць+
Один скрипт озвучки 25-секундного відео = 70-90 слів = 400-600 символів. 10K символів = ≈20-25 готових озвучок на місяць.
Достатньо для трафера що публікує 1 відео на день.
Доступ до основних голосів+
Бібліотека: Rachel (жіночий експертний), Adam (чоловічий впевнений), Bella (жіночий дружній), Antoni (чоловічий молодий) та інші.
Пошук по тегах "casual" або "expert" — обирай під свою ЦА.
Українська мова — підтверджено+
ElevenLabs підтримує 30+ мов включно з українською. Якість висока — глядач не одразу розпізнає що це AI.
Що НЕ доступно у free+
Voice cloning (свого голосу), розширена бібліотека. Якщо потрібно — Pro $5/міс. Але для нашої задачі стандартні голоси працюють відмінно.
Як використовувати
- Зареєструйся на elevenlabs.io. Можна через Google. Підтвердження email.
- Зайди у Voices бібліотеку. Спробуй 3-5 голосів — натиснь Play на sample, обери той що найбільше підходить твоїй темі.
- Згенеруй текст для озвучки. НЕ копіюй слайди дослівно — потрібен природний розмовний текст. Використай промт нижче.
- Speech Synthesis → Voice → встав текст → Generate. 5-10 секунд — отримуєш MP3.
- Завантаж MP3. Збережи у папку "voice" на телефоні або Mac.
- Імпортуй у InShot/VN як audio track. Розмісти так щоб голос синхронізувався зі слайдами (один слайд = одне речення).
- Зменш гучність фонової музики до 15-20% поки голос говорить — щоб voice-over був чітко чутно.
Промт для генерації тексту озвучки
Промт: скрипт озвучки для ElevenLabs +
Перетворює сценарій слайдів на природний розмовний текст для AI-голосу. 70-90 слів.
Створи скрипт озвучки для короткого відео яке я генеруватиму через ElevenLabs. ВХІДНІ ДАНІ: - Сценарій відео (текст слайдів): [встав сюди свій сценарій] - Тривалість відео: ~25-30 секунд - Цільова мова: українська (або російська, англійська) - Голос ElevenLabs: [Rachel / Adam / Bella / інший] - Платформа: [TikTok / YouTube Shorts] ЩО ПОТРІБНО: 1. Перетвори текст слайдів у природну розмовну мову — НЕ дослівно 2. Додай природні паузи (короткі речення) 3. Уникай повторів і канцеляризмів 4. Розрахуй щоб уся озвучка вмістилась у 25-30 секунд (≈70-90 слів) 5. Додай фонетичні підказки де ElevenLabs може помилитись ФОРМАТ: - Один цілий текст без розбивки на слайди - 70-90 слів максимум - Без емодзі і спецсимволів (ElevenLabs читає буквально) - Якщо є англійські слова — транслітеруй ОБМЕЖЕННЯ FREE TIER: - 10,000 символів на місяць - Якість трохи нижча ніж у Pro, але достатня для TT/Shorts ПОРАДА: Перш ніж генерувати — прочитай вголос. Якщо звучить природно у твоєму голосі — згенерує природно і ElevenLabs. Створи 2 варіанти — більш експертний і більш дружній.
Поради для якісної озвучки
Обирай "Casual" а не "Professional"+
Casual звучить як живий блогер. Professional як диктор новин — холодно, видає що це AI.
Тестуй кілька голосів на одному скрипті+
Перш ніж витрачати символи на повний скрипт — згенеруй одне коротке речення на 3-4 голосах. Обери кращий → потім вже повний скрипт.
Speed і Stability налаштування+
Speed — 0.95-1.05× (трохи повільніше або швидше за дефолт). Stability 50-60% — достатньо емоційності, але не перебір.
Не використовуй один і той же голос на всі акаунти+
Якщо у тебе 3 акаунти — постав 3 різних голоси. Інакше алгоритм бачить однаковий audio-fingerprint і пов'язує акаунти.