Комментарии
Продолжаем эксперименты с текстом и голосом — в новом обзоре протестировали сервисы для озвучки текста
Text-to-Speech:
переводим текст в аудио
Продолжаем эксперименты с текстом и голосом — в новом обзоре протестировали сервисы для озвучки текста
Недавно мы проверили несколько инструментов для превращения диктофонных аудиозаписей в связный красивый текст. Получилось — не очень. Но бывает ведь и обратная задача, когда нужно превратить текст в аудио. Сегодня речь как раз об этом.

Все мы хотим читать больше книг, и при этом читать их совсем не хотим. Сервисы по озвучке текста в этом случае — какой-никакой выход: можно загрузить в них текст, включить на воспроизведение и слушать, параллельно занимаясь рутиной. И это — лишь один вариант: сервисы также пригодятся, когда нужно озвучить контент для слабовидящих на сайте и в приложениях. Ну и вообще озвучить что угодно — вдруг вы там фильм снимаете артхаусный.

Мы погуглили сервисы: от самых банальных до посерьезнее, и проверили каждый с помощью трёх отрывков текста. Первый — вводная одной из последних статей, в которой есть слово «е-коммерс» и несколько эмоциональных синтаксических конструкций. Два других отрывка — стихи: классический Александр Сергеевич Пушкин и немного рваный и ритмичный Борис Пастернак.
Текст 1
Прошлогоднее интервью с техлидом проекта Яндекс.Здоровье показало, что все мы по-прежнему боимся идти к врачу и сделаем всё, чтобы этот поход оттянуть. До последнего, конечно же. А если под рукой есть аптечный е-коммерс, где можно самому выбрать и «прописать» себе таблеточки — так вообще красота. Мы, конечно, утрируем, но вы и сами по себе всё знаете :)
Текст 2
У лукоморья дуб зелёный;
Златая цепь на дубе том:
И днём и ночью кот учёный
Всё ходит по цепи кругом;
Идёт направо — песнь заводит,
Налево — сказку говорит.
Текст 3
Ночь.

Идет без проволочек
И тает ночь, пока
Над спящим миром летчик
Уходит в облака.

Он потонул в тумане,
Исчез в его струе,
Став крестиком на ткани
И меткой на белье.
Мы записали результаты прочтения каждого отрывка в каждом сервисе на видео — чтобы вы сами могли оценить качество звука и произношения.
Сначала — самое банальное
Если вам нужен голос робота, который объелся антидепрессантов — добро пожаловать в Гугл или Яндекс переводчик. Гугловская роботесса без проблем начитает вам 5000 символов, проговаривая каждое слово с неестественной интонацией и замедленным темпом (но при этом с улыбкой в голосе). Конечно, куда торопиться, когда ты машина :) Яндексовская леди с железным голосом так утруждаться не станет — не более 300 символов, и баста.

С текстом из статьи — более-менее, хотя прослушку такой озвучки можно приравнять к изощренной пытке: дикторшу Гугла хочется ударить, чтобы она заговорила энергичнее. У Яндекса чуть получше с паузами в стихах и выделением голосом конструкций вроде «конечно же», хотя голос кажется более синтетическим. И у него, и у Гугла проблемы с «проволОчек» и «бельЕ» в стихотворении Пастернака.
Скачать такое аудио не получится — придётся идти на хитрости с параллельной записью какой-нибудь программкой, вроде Audacity.
Yandex SpeechKit
У Яндекса, правда, есть отдельный сервис для распознавания и синтеза речи — Yandex SpeechKit. На его основе работает голосовой помощник Алиса.

Три языка (русский, английский, турецкий), естественное звучание и возможность влиять на ударения спецсимволами, есть API. Подходит для озвучки сервисов и приложений, обзвона клиентов и озвучки курсов и вебинаров. Стоимость формируется, исходя из количества символов в месяц: за 10 000 символов вы заплатите всего 1,83 рубля. В демо-версии ограничение на символы — 5000. Запись можно скачать.
На выбор — три интонации, 6 дикторов, бегунок скорости
Онлайн-решения
Text-to-Speech

Здесь для русского языка доступен только женский голос. Со стихотворениями диктор справилась почти отлично: поставила верные ударения и у Пушкина, и у Пастернака (кроме сомнительного «бьелье» на французский манер), а вот в тексте статьи некоторые слова выдавали робо-диктора: вроде бы, сказано всё чётко, а есть какой-то неуловимый железный отзвук в голосе. Да и голос у дикторши сам по себе «железный»: прочитала так, будто отчитала слушателя, как суровая школьная учительница.
Чтобы скачать получившееся аудио, достаточно кликнуть на него правой кнопкой. Файл сохранится в формате WAV.
ВАЖНО: у сервиса нет SSL-сертификата, так что поосторожнее с ним.
Озвучка текста онлайн

Онлайн-сервис с бесхитростным названием — российская разработка. Сейчас собирает деньги на развитие фич: нормальной мобильной версии, редактора озвучки диалогов и скорости воспроизведения — можно поддержать.

Языка всего 4 (русский, украинский, английский и почему-то турецкий). Дикторов — куча: мужчины и женщины с разными тембрами, и даже есть стилизация под советского диктора Левитана :) Дополнительные настройки — окрас: может быть нейтральным, дружеским или раздраженным.

Субъективно, текст статьи дикторы из этого сервиса читают лучше остальных — нет ощущения синтетичности в голосе, верно расставляют акценты (особенно заметно на обороте «конечно же» и «так вообще красота»). С Пушкиным почти никаких проблем, кроме «по цЕпи» вместо «пО цепИ». Левитан звучит очень забавно, читая Пастернака, — не слишком похоже на настоящего советского диктора, и ударения ставит неверные («прОволочек», «бельЁ»).
Ограничений по количеству символов, вроде бы, нет — мы вставили текст почти в 25 000 символов, но озвучка зависла надолго (мы честно подождали 10 минут и бросили это гиблое дело). Мораль такова: делите гигантские тексты на кусочки, господа.

Круто, что аудиофайл можно скачать — если нажать на кнопку, на странице появится аудиофайл, который можно сохранить через Ctrl+S. Формат аудио — WAV.
ВАЖНО: у сервиса нет SSL-сертификата, так что поосторожнее с ним.
From Text To Speech

Похожий на предыдущий, но зарубежный сервис. Ограничение по символам — 50 000. Для русского языка единственный диктор — Валентина. Можно регулировать скорость чтения (медленно, умеренно, быстро и очень быстро) — вот только эти настройки не работают :)

Странно, но для текста получить результат не удаётся — сайт пишет об ошибке (будто бы поле для ввода пустое). При этом со стихами всё ок. Дикция хорошая, почти не как у живого человека, но есть акцент — очень мягкие «л» во всех словах, как у итальянцев, например :)
Получившийся файл тоже можно скачать — в формате MP3.
ВАЖНО: у сервиса нет SSL-сертификата, так что поосторожнее с ним.
Платные решения
У этих сервисов на сайте есть демо-версия. Если её результат понравится — покупайте тариф либо платите за API/плагин для сайта.


iSpeech

В этом сервисе вы тоже можете проявить гендерные предпочтения: доступен и мужской, и женский голос, да ещё и три скорости чтения. Но какого бы пола ни был диктор, слышно, что каждое слово произносится будто отдельно, а не целым предложением — звучит неестественно. Вдобавок слова «съедаются», есть какой-то акцент (напоминающий японский), а в конце чтения любого фрагмента текста добавляется непереводимая игра слов. Ещё один минус — ограничение по символам (350).
Чтобы скачать получившееся аудио, сайт просит зарегистрироваться. Делаем, и … ничего не получаем. Вместо этого очередное демо с более расширенными опциями, но даже прослушать аудио теперь не получается — какой-то конфликт плагинов.
Acapela Box

Чтобы начать пользоваться сервисом, придётся зарегистрироваться. Но эта процедура не поможет вам скачать получившийся файл (а ведь доступны варианты MP3 и 4 формата WAV) — эту опцию нужно оплатить (аудио длиной 47 секунд стоит 5 евро, полуторачасовое — 500 евро). Ограничение по вводу символов — 9950.

У Acapela для русского языка доступна только диктор Алёна. С текстом статьи она более-менее справляется, хотя запинается на «е-коммерс», не очень естественно произносит слова и делает большие паузы на запятых (ничего нового). Со стихами тоже неплохо: Пушкина вычитывает почти отлично (кроме «по цепи кругом» — неверное ударение на «цепи»), у Пастернака верно читает «летчика» с «ё», но из-за этого и «белье» у неё превращается в «бельёоу».
Oddcast

Сервис пошёл чуть дальше остальных — предлагает не просто озвучку, а ещё и визуальное проговаривание текста 3D-диктором. Тот вертит головой, моргает и шевелится по наведению мышки (хотя степень его визуализации в духе компьютерных игр из 2005-го). Для русского языка — три диктора: Дмитрий, Милена и Ольга. Ограничение по символам — 600. Также есть 10 эффектов — шёпот из них, пожалуй, самый жуткий (прямо как в фильмах ужасов).

Дикторы некоторые вполне обычные слова произносят странно: «послеЭднее», «обЪлака», «креЭстиком». С текстом статьи Дмитрий справился неплохо, но звучал неестественно из-за вот этого странного произношения. Милена отлично прочитала Пушкина. Ольга потеряла «ё» в слове «летчик», зато «бельЕ» сказала верно. И даже у «проволОчек» поставила верное ударение.
Скачать аудио не предлагают. Вместо этого можно попробовать прикрутить к сайту сервис озвучки через API. Первые 15 дней и 1000 потоков (1 поток = аудиозапись длиной 60 секунд) — бесплатно. Далее — $ 99,5 за 40 тысяч потоков (пока не кончатся).
ВАЖНО: у сервиса нет SSL-сертификата, так что поосторожнее с ним.
Linguatec

Немецкий сервис. На сайте доступна только демо-версия с ограничением в 250 символов и тремя вариантами голосов на русском — двумя женскими и одним мужским. Тембры узнаваемые. С произношением — не всё гладко.

В тесте — кое-где неестественные ударения. У диктора Милены, которая читает стихи Пушкина, небольшой акцент и какой-то взвинченный тон. У Юрия приятный голос, но есть какие-то почти неуловимые огрехи, вроде «потоньюл» вместо «потонул», ну и по классике уже — «на бельЁ»
Скачать результат демки не получится. Можно только купить один из пакетов: для домашнего использования программа обойдётся в 49 евро, для студийного — уже в 5 тысяч (на эти деньги можно купить 350+ часов хорошего диктора-фрилансера).
Для сравнения — в федеральной базе дикторов за голос Скарлетт Йохансон и яндексовской Алисы берут от 9 000 рублей
Решения для ПК
Говорилка

Голос Ольги из «Говорилки» — один-в-один голос женщины-диктора из Text-to-Speech. Та же суровая интонация, те же проблемы с произношением. Из плюсов — аудио можно сохранить, нет ограничений по объёму текста (и даже есть 8 разных окон для удобства).
TalkerPro

Почему-то установились не все варианты голосов дикторов: доступна Ирина (один-в-один голос Яндекс-переводчика), и суровая Ольга (как в Text-to-Speech и Говорилке). Ограничений по длине текста так же нет. А вот как сохранить в виде аудиофайла — непонятно.
Loquendo

В приложении можно выбрать уже знакомую нам Ольгу с железным голосом или итальянца Людовико с забавным итальянским же произношением. Файл сохраняется в формате WAV. Примечательно, что при установке приложения в языковую пару на компьютере внезапно вклинивается греческий. При перезагрузке баг исчезает :)
Ещё мы посмотрели Nuance и Upsales. У первого в демо-версии те же голоса, что и Oddcast, у второго нельзя ничего протестировать, не заплатив денег.
Если вы хотели озвучить с помощью какого-то из этих сервисов книгу и добавить её в iTunes, то мы нашли для вас готовую инструкцию :)
Что выбрать
Решения для ПК выигрывают тем, что могут озвучивать большие куски текста. Из онлайн-сервисов нам больше других понравились «Озвучка текста онлайн» из-за вариантов голосов и простого скачивания, а также Text-to-Speech за сносное произношение и тоже за возможность скачать результат. С платными решениями — вопрос неоднозначный: скорее, они пригодятся тем, кому реально нужна озвучка на сайте (через API, как у Oddcast), или тем, кому нужен серьёзный софт на ПК для работы или развлечения.