субтитры YouTube
В основе автоматического создания субтитров лежит технология распознавания речи с помощью алгоритмов машинного обучения — из-за этого качество субтитров бывает разным.
Специалисты Ютуба совершенствуют технологию, но порой речь всё же распознается неверно. Обычно ошибки связаны с неправильным произношением, акцентом или диалектом говорящего, а также с посторонними шумами. Хорошая новость: субтитры к вашему видео можно просмотреть и отредактировать.
Субтитры доступны не для всех видео — вот несколько причин их отсутствия:
- звуковая дорожка сложная и долго обрабатывается;
- для выбранного языка нет функции автоматического создания субтитров;
- видео слишком длинное;
- у видео низкое качество звука или оно содержит речь, не распознаваемую YouTube;
- видео начинается с длительного эпизода без звука;
- говорят сразу несколько человек.
- Владимир Завертайлов читает лекцию о хвостовых рисках, звук — микрофон-петличка;
- Владимир Завертайлов рассказывает о микропереключениях на планерке — звук и видео с мобильного телефона;
- Технический директор Иван рассказывает о технических премудростях — много непонятных слов, а звук с микрофона-петлички.
Чтобы включить субтитры у видео Ютуба, нажмите сюда:
анекдот приходит мужик в баню забыл
полотенца шарик глазами по бане чем бой
теряться видит висит табличка
занавесками не потеряться облике геи
будет то что мы сейчас с вами разберем
это к тому как надо не делать, а не так
как надо делать и та вещь которую мы с
вами посмотрим за нее больно больно бьют
вот тем не менее она в природе
существует из-за нее собственно
произошел прошлый экономический кризис и
наверное будущий случится еще ни один из
за нее случается очень очень много много
дерьма и поэтому
поскольку это явление в природе
существуют нужно его знать нужно его
иметь ввиду и нужно с ним бороться
как вы думаете про что речь системное
зависание прощались
они там дальновидность такая там
дальновидности очень хорошо очень хорошо
дальновидность очень прям прям на уровне
хвостовые риски
И та вещь, которую мы с вами посмотрим, за нее больно-больно бьют. Вот. Тем не менее, она в природе существует. Из-за нее, собственно, произошел прошлый экономический кризис и, наверное, будущий случится еще ни один. Из-за нее случается очень-очень много-много дерьма. И поэтому, поскольку это явление в природе существует, нужно его знать, нужно его иметь в виду и нужно с ним бороться.
Как вы думаете, про что речь? Упс, системное зависание. Про что речь? [Голос из зала: недальновидность?]. О, не, там дальновидность такая, там дальновидности очень хорошо, очень хорошо с дальновидностью, очень прям, прям на уровне. Хвостовые риски.
То, как вы говорите, и то, как вы пишете, сильно разнится: появляются конструкции-связки, вы задаете вопросы аудитории, повторяете фразы для смысловых акцентов. Здесь они тоже есть. Но при этом многие адекватные предложения превращаются в очень забавные.
Мы тут активно обсуждаем MVP, скоупы и ещё бог весть что на своём специфическом сленге, а Ютуб это видит по-своему (надо сказать, кое-что расшифровать верно ему порой удается).
Спикеры любят задавать вопросы в зал. Ладно, когда они потом сами же на них отвечают — это полбеды. Но бывает, что замечания кого-то из зала нужно добавить в статью. И здесь приходится включать активное слушание, потому что Ютуб считает, что голос этого человека — музыка.
когда вы там на своей стороне запустите…»
Проблема 4 — нет знаков препинания и обозначения пауз
Может быть, мы слишком многого хотим от бездушной машины, но читать куском сгенерированный Ютубом текст не очень-то просто. Да, по ходу редактуры добавить запятые, точки, тире и прочий синтаксис несложно. Но минуте на 20-й начинает казаться, что проще было бы переписать всё предложение сразу и полностью, чем перемещаться между словами и ставить знаки пунктуации, а какие-то слова править с большой буквы.
Проблема 5 — это не так быстро, как кажется
Лекция о хвостовых рисках ради эксперимента была преобразована нами в статью (ждите в блоге). Но трудозатраты колоссальны: при длине видео в 1 час 16 минут мы потратили на доведение материала до чистового варианта 8 часов. 8, Карл! Да, там пришлось рисовать кое-какие схемы по ходу дела. Отнимите 1,5 часа. Но останется 6,5. Почему так?
- итерация 1: скопировать текст из субтитров и разбить на предложения (не нравится ручками — в помощь сервис DownSub);
- итерация 2: переслушать куски со странными словами (а по факту — переслушать всё видео) на 2−3 раза;
- итерация 3: избавиться от фраз-связок, риторических вопросов и прочего словесного мусора;
- итерация 4: добавить редакторской магии, чтобы у материала появилась структура — заголовки, подзаголовки и врезки;
- итерация 5: вычитать на 2−3 раза и отшлифовать, чтобы было круто.
Очень много времени уходит на редактирование, особенно, когда у спикера масса сорняков в речи, оговорок, или он плохо подготовился к выступлению и заговаривается. Приходится поток сознания превращать в очищенную и отфильтрованную мысль.
Иногда спикер забывает проговаривать свои действия — тогда приходится как-то дописывать ручками то, что он забывает озвучивать (например, он переходит между диалоговыми окнами, что-то там пишет, задает команды — зрители это видят, а читатели нет).
Плюс, когда текст более или менее сформировался — его надо правильно разметить и наложить на него навигацию, иначе будет простыня. Надо, чтобы текстом было удобно пользоваться: а значит, нужны заголовки, ключевые слова, оглавление, перекрестные ссылки (в т.ч. и на рекламируемые заказчиком продукты). Если это программный код — значит, еще и вставки кода надо разметить с учетом языка программирования, добавить скриншоты и не забыть придумать к ним подписи.
Другой важный момент: нужно, чтобы транскрибатор хорошо понимал предмет выступления, иначе он может перепутать, например, server с service или java с jabber — такие прецеденты были.
А в остальном — ничего сложного :)
- неряшливые скриншоты;
- жирный шрифт там, где не нужно;
- ошибки в пунктуации;
- витиеватые формулировки;
- слепое доверие автосубтитрам;
- отсутствие сверок с видео;
- запись бесполезных слов и действий.
а «Или запустить, господи, 1С-ку, выставить счёт…» стало «…процесс либо господи один с кулачок выстоять…».
Свои видео с канала Runetlex Tv я сначала отдаю транскрибаторам, а потом вношу в расшифрованный и адаптированный вариант правки самостоятельно, потому что какие-то моменты транскрибатор может упустить/не понять/неправильно истолковать.