Программы и способы для транскрибации аудио и видео в текст. Часть 2

На раскрытой тетради стоят монитор и колонка, лежат клавиатура, наушники, динамик, телефон, ручка и листы бумаги с изображением микрофона
Обновлено:

Здравствуйте мои друзья и подписчики! Надеюсь, что в первой части заметки, вы уже успели познакомиться с общими понятиями о транскрибации, заказчиках, биржах и основных личных навыках, необходимых при осваивании профессии транскрибатора.

Начиная с 1952 года, когда впервые в мире произошла первая попытка распознавания речи, востребованность этой услуги не только не стала меньше, а напротив, непрестанно растёт.

Лучшие «умы человечества» бьются с тех пор над глобальной задачей – научить «искусственный интеллект» чётко распознавать человеческую речь. Частично, им удалось это сделать в 2011 году, так как именно в этом году, Google представила функцию распознавания речи, а Apple свою, ныне известную программу, Siri.

За восемь лет, количество автоматических и полуавтоматических программ для преобразования речи в текст, увеличилось в разы. Но этого, по-прежнему, недостаточно для качественной транскрибации.

Извечная проблема — это нечёткая речь, посторонние шумы и звучание нескольких голосов. Поэтому, друзья мои, «транскрибаторы нужны, транскрибаторы важны». 👍 А коли так, то смело осваивайте профессию и вперёд «через тернии к звёздам, т.е. к заработку!!!

Виды форматов

Расшифровывать чаще всего приходится форматы двух видов:

  • Аудиофайлы.
  • Видеофайлы.

Набираем в поисковике Google «форматы аудио» и видим следующую картину.

Три группы аудио форматов: без сжатия, со сжатием без потерь и с потерями

Все аудио форматы выделяют в три группы: без сжатия, со сжатием без потерь и с потерями.

На биржах заказы, чаще всего, даются в двух форматах – это WAV и MP3. Отличить их на слух, даже если вы музыкант, у вас вряд ли получится.

Но, далеко, не все программы поддерживают все форматы, поэтому перед использованием нужно всё внимательно проверять.

Видео форматы – это AVI, MP4, MOV, FLV, DVD, MPEG2 и прочие. Каждый формат имеет ещё несколько расширений.

Дам маленький совет: когда будете подбирать себе заказы, то очень важно, чтобы выбранные форматы проигрывались на бытовых устройствах, т.е. проигрывателях, телевизоре и т.д., иначе он может не залиться в программу, которой вы пользуетесь, а перекодировать один видео формат в другой, для новичка, очень сложно.

Сделать это сразу правильно, избежав ошибок, у вас вряд ли получится.

Но, чаще всего используются файлы, залитые на Ютуб. Предлагается два варианта действий:

  • Сразу указывается ссылка, которую нужно просто скопировать и вставить в свою программу.
  • Для начала необходимо скачать расширение, которое позволяет использовать популярные и наиболее часто используемые видео форматы. Например, SaveFrom.net.

Расширение удобно тем, что можно использовать сразу два формата - видео и аудио.

Поиск по ссылкам в расширении SaveFrom.net

Программы и способы транскрибации

Все программы, условно, можно разделить на два вида:

  • Которые скачиваются на компьютер.
  • Которые не нужно скачивать, т.е. онлайн-сервисы.

И одни, и другие, могут быть платными и бесплатными.

Огромный минус бесплатных программ в том, что они частенько любят «выделываться» при работе.

Некоторые платные программы и сервисы предоставляют демоверсии. Штука очень удобная, так как можно, некоторое время, попробовать поработать бесплатно и уже по ходу работы окончательно определиться с покупкой.

Ну, а теперь перейду непосредственно к способам и программам:

  1. Транскрибация вручную.
  2. Тут всё просто и понятно.

    • Берёте аудиофайл и прослушиваете до определённого момента (ровно столько, сколько вы в состоянии запомнить).
    • Набираете в текстовом редакторе прослушанный участок.
    • Потом отматываете назад, снова прослушиваете, сверяете и, в случае необходимости, правите текст. И так до окончания всего аудиофайла.

    Так как работа очень трудоёмкая, то профессиональными транскрибаторами почти не используется, за исключением единичных случаев. К примеру, попался сложный и непонятный участок текста, который без прослушки никак, по-другому, «не одолеть».

    Ручную транскрибацию можно делать в любом аудиоредакторе, например, в Audacity.

  3. Субтитры Ютуб.
  4. Если у вас есть свой канал на Ютуб, то его также прекрасно можно использовать при транскрибации. Просто берёте и заливаете видео файл, без публикации, с целью просмотра субтитров (1).

    Так как на Ютуб достаточно хорошая и понятная расшифровка, то многие начинающие транскрибаторы поступают именно так. Единственная проблема – это отсутствие собственного канала.

    А открывать его или нет, это уже «дело хозяйское» и зависит от ваших знаний и умений.

    Если вы пока не знаете, как это делать, то это не проблема, так как в инете имеется огромное количество бесплатного и доступного материала на эту тему.

    Главный плюс этого способа в том, что тут уже имеются готовые тайм коды (2).

    Если они требуются заказчику, то этот способ с экономит вам массу времени.

    Субтитры Ютуб. Расшифровка видео

    Есть, конечно, и свои минусы:

    • Можно загрузить только видео ролик.
    • Уж очень много возни со знаками препинания.
  5. Программа Express Scribe.
  6. Это, пожалуй, самая популярная программа-плеер у транскрибаторов, предназначенная для профессионального перевода. Скачивается на жёсткий диск Windows.

    Основные её плюсы:

    • Поддерживает воспроизведение аудио и видео файлов почти всех основных форматов.
    • Есть возможность набирать текст прямо в плеере.
    • Имеются «горячие клавиши»: воспроизведения, паузы, перемотки вперёд-назад и остановки записи.
    • Улучшает качество звука при помощи эквалайзера, убирая фоновые шумы и лишние звуки.
    • В определённых местах аудиофайла можно делать закладки.
    • Присутствует ножная педаль, совместимая с программой.
    • Имеются подробные обучающие ролики и скриншоты для пользования плеером, правда на английском языке. Но с нынешними переводчиками, это, по сути, не проблема.

    В интернете, при необходимости, также можно найти подробные видеоуроки и видео инструкции.

    Программа платная, но имеет в наличии тестовый период, так что нет необходимости покупать её сразу. Можно сначала скачать и протестировать «в деле». Если понравится, то тогда можно попробовать приурочить покупку, к какой-либо, акции. Скидки у них бывают частенько, так что долго ждать не придётся.

    Программа-плеер для транскрибации  Express Scribe

    Бесплатная версия, правда не поддерживает формат видеофайлов, поэтому придётся извлекать отдельно звуковую дорожку.

    Для этих целей существуют специальные программы:

    • Adobe Audition – профессиональный аудио редактор. Программа, просто супер! У неё колоссальные возможности, поэтому со звуком можно творить практически чудеса. Она платная, но имеется бесплатный пробный период.
    • Freemake Video Converter – бесплатный видео конвертер. Хорош тем, что поддерживает огромное количество форматов и много чего умеет делать, в том числе извлекать из видеофайлов звуковые дорожки.
    • Мне, тем не менее, привычней для этих целей пользоваться Audacity:

    Загружаем свой видеофайл.

    Заходим в программу, жмём «файл» - «открыть», вставляем ссылку на видеофайл – «открыть» - «файл» - «Export» - «экспортировать как mp3» - «сохранить». Всё готово!!!

    Звуковая дорожка в программе Audacity

  7. Программа LossРlay.

Наши ребята транскрибаторы тоже стараются не отставать от западных разработчиков, поэтому создали программу LossРlay, за которую им отдельное спасибо.

Это плеер для расшифровщиков голоса, в котором собрано много классных функций. Например, автоматическая вставка цифрового сигнала, в которой указывается точное время записи.

И это далеко не единственная «примочка»! У него маленький вес и быстрый запуск на компьютере, поддержка многих форматов аудио и видео, наличие отдельных плейлистов с возможностью их переключения и т.д.

Но самое главное, что она бесплатная, правда с трансляцией рекламы. Если у вас появится желание её убрать, тогда придётся покупать лицензионный ключ.

Программа пользуется немалым спросом, поэтому по работе с нею в интернете имеется масса уроков и инструкций.

Программа для транскрибации LossРlay

Использование онлайн-сервисов

  1. Блокнот для речевого ввода Speechpad.
  2. Это российская разработка изначально создавалась для распознавания речи и её перевода в текстовый формат, т.е. достаточно говорить в микрофон, а текст будет набираться самостоятельно.

    Качество, конечно, «не ахти какое», так как много получается ошибок.

    Сервис также частенько «любит глючить», в этом случае нужно зайти в «Поддержку» и сделать интеграцию программы.

    Если не получится сделать её самостоятельно, тогда придётся обращаться к специалистам.

    В панель для транскрибации можно залить аудио или видеофайлы, но желательно хорошего качества, иначе это не сработает.

    Также для транскрибирования аудио необходимо установить виртуальный кабель. Как это правильно сделать, подробно показано в видео уроках на сайте.

  3. Онлайн сервис dietation.io.
  4. Это зарубежный сервис, поддерживающий, помимо русского, ещё 30 языков. Никакие аудио и видеофайлы заливать нельзя. Используется только микрофон и голос, но зато распознаёт сервис практически без ошибок.

    Функций для форматирования текста здесь немного, так что лучше пользоваться текстовыми редакторами.

  5. Google Docs.

Гугл Документы – популярный сервис от Google. Он бесплатный.

Здесь имеется функция «голосовой ввод», которым любят пользоваться некоторые транскрибаторы для упрощения работы.

Принцип действий простейший – слушаешь в наушниках запись, потом надиктовываешь в микрофон. А сервис уже сам и речь расшифрует, и текст наберёт.

Правда результат здесь непредсказуем - «фифти-фифти». Иной раз отменный, а иногда ошибок столько, что быстрее было бы набрать вручную.

Для работы:

  • Заходим на страницу Google Docs через свой аккаунт.
  • Создаём новый документ (1).
  • Подключаем голосовой ввод. Нажимаем «Инструменты» (2) – «Голосовой ввод» или же «Ctrl+Shift+S».
  • Появляется кнопка записи (3). Если её активировать она станет красной.

Работа с популярным сервисом от Google - Google Docs

Внимание! Нельзя, ни в ком случае, переходить на другие вкладки во время записи, иначе сервис перестаёт работать.

Плюсы сервиса:

  • Автоматическое сохранение набранного текста, при любом раскладе, даже при внезапном отключении электричества.
  • Редактирование полученного текста можно осуществлять прямо на сервисе, так как для этого имеется весь набор функций.

Есть, конечно, и другие программы, но особой необходимости, как дополнение к вышеперечисленным, в них нет. В общем, это уже «чисто на любителя».

Перечислю только названия, так как практических навыков работы с ними не имею:

  1. Онлайн-сервис RealSpeaker. На нём можно до 1,5 минут транскрибировать бесплатно. Только для аудиофайлов.
  2. Профессиональная программа Transcriber-pro. По отзывам очень интересная и с широкими возможностями. Демо версии нет. Для её приобретения нужно обращаться в техподдержку и решать вопрос с ними лично.
  3. Программа RSplayer. Очень многие её хвалят. Плеер бесплатный и поддерживает очень многие аудио и видео форматы. Он прост, эффективен и понятен в использовании.
  4. Программа Windows-VOCO. Тоже классная программа, которая позволяет подключать словари. Чтобы получить пробную версию, нужно также предварительно отправить запрос разработчикам.

Подведение итогов

Во второй части заметки вы познакомились с основными программами, без которых не обходится ни один транскрибатор.

Но это только начало, потому что со временем, когда вы войдёте «во вкус», то непременно изъявите желание облегчить и ускорить работу, при помощи дополнительных программ, для ещё большего заработка.

И таких программ тоже немало, например:

  • Punto Switcher – предназначена для автоматического переключения раскладки клавиатуры.
  • AutoHotkey – используется для создания мощных скриптов.

И многие, многие другие.

Итак, для того чтобы стать транскрибатором и начать зарабатывать свои первые деньги, информации, предоставленной в двух частях заметки, вполне достаточно.

Но, я хочу ещё немного вас порадовать, поэтому приглашаю в третью часть заметки (надеюсь последней) 😉, в которой расскажу о секретах, «фишках» и «примочках» в работе транскрибатора.

Если вам понравилась заметка, подписывайтесь на мои обновления, чтобы первыми получать новые заметки.

И не забывайте делиться своими отзывами!

Всегда буду вам рада на страницах своего блога, у себя «дома». Ваша Л.Г.

Сделай репост – выиграй ноутбук!

Каждого 1 и 15 числа iBook.pro разыгрывает подарки.

  • Нажми на одну из кнопок соц. сетей
  • Получи персональный купон
  • Выиграй ноутбук LENOVO или HP

Подробно: ibook.pro/konkurs

LENOVO или HP от 40-50 т.р., 8-16ГБ DDR4, SSD, экран 15.6", Windows 10

6 комментариев

  • Аватар комментатора Галина Галина
    Интересная информация. В этой теме я новичок и поэтому пока изучаю и пробую.
    Ответить
    1. Аватар комментатора Лариса Лариса

      Галина, так и должно быть.. сначала "новичок", а через годик глядишь и уже "профи".. Спасибо вам за комментарий))

      Ответить
  • Аватар комментатора Алексей Алексей
    Благодарю за очень познавательную статью и богатый выбор программ для транскрибации. Сейчас я чаще использую блокнот для речевого ввода speechpad.ru, привык уже к нему и знаю все его заскоки, думаю правильнее будет перейти и использовать то, что есть получше.
    Ответить
    1. Аватар комментатора Лариса Лариса
      Алексей, спасибо за комментарий)) По большому счёту, это дело привычки.. Я пыталась использовать в своей работе программы, которые получше, но всё равно периодически возвращаюсь к чему привыкла.. Но пробовать однозначно нужно))
      Ответить
  • Аватар комментатора Светлана Д. Светлана Д.
    Лариса, очень подробный полезный материал, интересен не только новичкам, но и тем, кто зарабатывает на транскрибации. Спасибо!
    Ответить
    1. Аватар комментатора Лариса Лариса
      Светлана, спасибо за ваш комментарий)) Буду только рада, если советы в заметке окажутся полезными и востребованными))
      Ответить

Добавить комментарий

Отправить комментарий Отменить

Сообщение