Транскрибация востребованная услуга, но занимает много времени и усилий, поэтому программы перевода аудио в текст помогают получить качественный результат гораздо быстрее. Распознавание голоса невозможно без участия человека и профессиональные софты облегчают его трудоёмкий, монотонный процесс.
В заметке расскажу, какие программы для транскрибации используют в своей работе опытные транскрибаторы, их плюсы и минусы. Нельзя однозначно выделить наилучшие сервисы, поскольку каждый индивидуально подбирает программы «под себя», в зависимости от уровня подготовки, удобства, привычек и предпочтений.
Программы перевода аудио в текст: виды форматов для расшифровок
Чаще всего транскрибатору приходится расшифровывать форматы двух видов:
- аудиофайлы;
- видеофайлы.
Если в поисковике Google набрать запрос «форматы аудио», то откроется следующая запись. Это означает, что все аудиоформаты делятся на три группы:
- Без сжатия.
- Со сжатием без потерь.
- С потерями.
Три группы аудиоформатов: без сжатия, со сжатием без потерь, с потерями
Заказы на биржах по большей части, предоставляются в двух форматах – WAV и MP3. Отличить их на слух сложно даже музыканту, поэтому приходится использовать программы перевода аудио в текст. Многие программы для транскрибации поддерживают не все форматы, так что перед применением необходимо убедиться в присутствии нужного вам аудиоформата.
Видеоформаты – AVI, MP4, MOV, FLV, DVD, MPEG2 и прочие имеют различные расширения.
Перекодировать видеоформаты для новичка непросто, поэтому избежать ошибок вряд ли получится.
Однако, чаще других используются файлы, залитые на Ютуб. Предлагается два варианта действий:
- Если указывается ссылка с подходящим расширением, то нужно её скопировать и вставить в программу.
- Если же требуется переформатирование, то необходимо скачать расширение с наиболее популярными видеоформатами. Подойдём расширение SaveFrom.net, так как в нём можно использовать два формата – видео и аудио.
Страница для скачивания расширения SaveFrom.net
Распознавание голоса
Все программы перевода аудио в текст делятся на два вида. Те, что:
- скачиваются на компьютер;
- не нужно скачивать, т. е. онлайн-сервисы.
Любые программы для транскрибации бывают платными и бесплатными. Большой минус бесплатных программ в том, что они часто «глючат» при работе.
Некоторые платные программы и сервисы предоставляют демоверсии. Это подходящий вариант для новичков, позволяющий бесплатно опробовать перевод аудио в текст и по ходу работы определиться с имеющимися плюсами и минусами.
Способы распознавания голосовых файлов. Транскрибация вручную:
- берёте аудиофайл и прослушиваете до определённого момента, т. е. столько, сколько в состоянии запомнить;
- прослушанный участок набираете в текстовом редакторе;
- отматываете назад, снова прослушиваете и сверяете. В случае необходимости правите текст. И так до окончания всего аудиофайла.
Поскольку ручная транскрибация является очень трудоёмким процессом, то профессиональными транскрибиторами используется редко, только в исключительных случаях. Делать её можно в любом аудиоредакторе, например, Audacity.
При транскрибации можно использовать собственный Ютуб канал. Берёте видеофайл и заливаете его на YouTube с целью просмотра субтитров, без публикации (1).
Поскольку на Ютубе хорошая и понятная расшифровка, многие начинающие транскрибаторы поступают именно так. Главный плюс этого способа – наличие готовых тайм-кодов (2), позволяющих сэкономить массу времени.
Единственная проблема – это отсутствие собственного канала. Но завести его несложно, так как в интернете имеется большое количество бесплатного материала по данной тематике.
Расшифровка видео на Ютубе с готовыми тайм-кодами
Есть определённые минусы:
- Можно загрузить только видеоролик.
- Много возни со знаками препинания.
Пожалуй, самая популярная у транскрибаторов программа-плеер Express Scribe, предназначенная для профессионального перевода. Скачивается на жёсткий диск Windows.
Основные плюсы:
- Поддерживает воспроизведение аудио и видео файлов почти всех основных форматов.
- Улучшает качество звука при помощи эквалайзера, убирая фоновые шумы и лишние звуки.
- Присутствует ножная педаль, совместимая с программой.
- Имеется возможность набирать текст прямо в плеере.
- Содержит «горячие клавиши»: воспроизведения, паузы, перемотки вперёд, назад и остановки записи.
- В определённых местах аудиофайла можно делать закладки.
- Имеются подробные обучающие ролики и скриншоты для пользования плеером на английском языке. На Ютуб канале можно найти качественные видеоуроки на русском языке.
Программа платная, но есть тестовый период, поэтому нет необходимости покупать её сразу. Можно скачать и протестировать. Если понравится, то попробовать приурочить покупку к какой-либо акции.
Страница официального сайта для скачивания программы Express Scribe
Бесплатная версия не поддерживает формат видеофайлов, поэтому звуковую дорожку придётся извлекать отдельно.
Для этой цели существуют специальные программы:
- Adobe Audition – профессиональный аудиоредактор. Отличная программа, имеющая широкие возможности. Платная, но имеет бесплатный пробный период.
- Freemake Video Converter – бесплатный видеоконвертер. Хорош тем, что поддерживает большое количество форматов и легко извлекает звуковые дорожки из видеофайлов.
- Audacity. Проста в использовании.
Заходите в программу, нажимаете «файл» - «открыть», вставляете ссылку на видеофайл – «открыть» - «файл» - «Export» - «экспортировать как mp3» - «сохранить».
Как пользоваться программой Audacity
Отечественные транскрибаторы, стараясь не отставать от западных разработчиков, создали программу LossРlay. Для корректной работы нужно установить кодеки.
Это плеер для распознавания голоса, в котором собрано много нужных функций:
- имеет автоматическую вставку цифрового сигнала, указывающую точное время записи;
- обладает маленьким весом и быстрым запуском на компьютере;
- поддерживает все популярные аудио и видеоформаты;
- располагает отдельными плейлистами с возможностью их переключения;
- осуществляет управление через горячие клавиши;
- можно добавлять тайм-коды.
Программа бесплатная, но с трансляцией рекламы. При желании её можно убрать, купив лицензионный ключ. Поскольку она пользуется немалым спросом, то в интернете имеется масса видеоуроков и инструкций по использованию.
Программа перевода аудио в текст LossРlay
VOCO отличная платная программа, позволяющая подключать словари. Для получения пробной версии необходимо отправить предварительный запрос разработчикам.
К плюсам можно отнести:
- распознавание голоса с аудиозаписей;
- голосовой ввод текста с микрофона;
- расстановка знаков препинания с помощью устных команд.
К недостаткам:
- отсутствие вставок временных кодов.
Использование онлайн-сервисов
Онлайн-сервисы удобны в использовании, поскольку не требуют установки на ПК. Но одновременно, это и их минус, так как без интернета программы не функциональны.
Блокнот для речевого ввода Speechpad. Российская разработка создавалась для распознавания речи и её перевода в текстовый формат. Наговаривая текст в микрофон, он набирается автоматически, но с большим количеством ошибок.
Сервис часто барахлит, поэтому нужно зайти в «Поддержку» и сделать интеграцию программы. Если не получится выполнить самостоятельно, то придётся обращаться к специалистам.
В панель для транскрибации можно заливать аудио и видеофайлы, но только хорошего качества, иначе Speechpad даст сбой, и расшифровка получится неполной. Программа имеет функцию редактирования текста и инструкции по работе с сервисом.
При транскрибировании необходимо установить виртуальный кабель – программу Virtual Audio Cable, для прямой передачи аудиофайла в систему распознавания аудио, минуя микрофон. Как это осуществить правильно, показано в видеоуроках на сайте.
Стоимость Блокнота – от ста рублей в месяц, а бесплатный период составляет 15 минут.
Dictation – бесплатный зарубежный сервис, поддерживающий помимо русского, ещё 30 языков и десятки команд. Никакие аудио и видеофайлы заливать нельзя. Используется только микрофон и голос, зато распознавание происходит практически без ошибок.
Если же запись была некачественной (посторонние шумы, слабый микрофон), то сервис не справится с поставленной задачей.
Несмотря на наличие встроенного редактора, функций для полного форматирования текста недостаточно, поэтому лучше пользоваться текстовыми редакторами.
Гугл Документы – популярный бесплатный сервис от Google.
Имеется функция «голосовой ввод», которым любят пользоваться некоторые транскрибаторы для упрощения работы.
Принцип действий простой – слушаете в наушниках запись и надиктовываете в микрофон. Сервис сам расшифровывает речь и набирает текст. Результат, однако, непредсказуем. Иной раз получается отменным, а иногда допускает неимоверное количество ошибок.
Для того чтобы начать работу необходимо:
- зайти на страницу Google Docs через свой аккаунт;
- создать новый документ (1);
- подключить голосовой ввод, нажав «Инструменты» (2) – «Голосовой ввод» или «Ctrl+Shift+S»;
- появляется кнопка записи (3). Если её активировать, она станет красной.
Как начать работу в Google Docs
Внимание! Нельзя переходить на другие вкладки во время записи, иначе онлайн-сервис перестаёт работать.
Плюсы сервиса:
- автоматическое сохранение набранного текста, при любом раскладе, даже при внезапном отключении электричества;
- редактирование полученного текста можно осуществлять прямо на сервисе, поскольку для этого имеется весь набор функций.
Из минусов:
Медленно расшифровывает текст и распознаёт не все слова, поэтому необходима чёткая диктовка.
Бесплатный сервис Google Keep, имеющий ряд достоинств и некоторые недостатки:
- Он умеет распознавать текст с изображений и вставлять заголовки, но не подходит для объёмных записей.
- С лёгкостью переводит голосовую запись через микрофон и точно расшифровывает аудио.
- Могут возникнуть затруднения из-за отсутствия возможности записывать аудио с паузами.
Бесплатное веб-приложение oTranscribe, позволяющее использовать все форматы: аудиофайлы, видеофайлы и видео с Ютуба.
Имеется управление горячими клавишами, автоматическая вставка временных кодов и сохранение результатов в локальном хранилище в формате HTML.
Отсутствует автоматическая транскрибация записей. Редактор текста обладает минимальным набором функций.
Хороший платный сервис Transcribe, но для работы необходима регистрация. В течение семи дней можно расшифровывать аудиозаписи до 30 минут бесплатно.
Имеет множество возможностей:
- прост в управлении;
- имеет горячие клавиши;
- создаёт тайм-коды;
- поддерживает ссылки с Ютуба;
- осуществляет загрузку файлов с ПК и облачных хранилищ;
- создаёт субтитры к видео;
- замедляет скорость прослушивания для удобства в исправлении ошибок.
Сервис RealSpeaker платный: восемь рублей стоит одна минута записи. Первые полторы минуты – бесплатно.
Из достоинств:
- прост в использовании;
- имеет встроенный текстовый редактор;
- максимальная длительность дорожки составляет 180 минут.
Из недостатков:
- отсутствует возможность надиктовывать текст в микрофон;
- применим только для аудиофайлов.
Есть и другие программы, но особой необходимости в дополнение к вышеперечисленным, в них нет. Практических навыков работы с нижеприведёнными сервисами не имею, поэтому перечислю только названия, без подробного описания и принципов использования.
- Англоязычный сервис Otter. Необходим в работе с английскими источниками. Хорошо распознаёт аудио и видеоформаты, способен запоминать голос диктора, обладает бесплатным функционалом.
- Профессиональная программа Transcriber-pro. По отзывам удобная и интересная, с широкими возможностями. Имеются горячие клавиши. Нет демоверсии и отсутствует функция распознавания речи. Для приобретения нужно обращаться в техподдержку и решать вопрос лично с ними.
- Программа RSplayer. Многие её хвалят. Плеер бесплатный, поддерживает все востребованные видео и аудиоформаты. Прост, эффективен и понятен в использовании.
- Vocalmatic – сервис платный, но имеет бесплатные минуты для перевода аудио в текст в количестве 30 минут. Интерфейс простой, имеет встроенный редактор.
Облегчить работу транскрибатора можно не только при помощи программы для транскрибации, но и других сервисов, предназначенных для более быстрого набора текста и редактирования файлов.
- Punto Switcher – используется для автоматического переключения раскладки клавиатуры.
- AutoHotkey – применяется для создания мощных скриптов, значительно влияющих на ускорение работы.
- Click2Text – употребляется для быстрой вставки предустановленного текста.
- CheckTK – необходима для проверки правильной последовательности тайм-кодов.
Основные выводы
Программы перевода аудио в текст разнообразны по своему функционалу и стоимости. Если вы начинающий транскрибатор, то нет смысла использовать сразу платные сервисы. Попробуйте поработать и поэкспериментировать, используя разные способы и программы для транскрибации.
Правильный выбор напрямую связан с вашими навыками. При низкой скорости печати больше подойдёт автоматическая расшифровка с последующим ручным редактированием текста или голосовой ввод.
При владении слепой печатью отлично подойдёт программа LossPlay и другие, не менее полезные сервисы. Получить хороший результат при транскрибации несложно, если предоставлены качественные исходные файлы, а если запись проблемная, то к выбору нужно подходить более осмотрительно.
Если вам понравилась заметка, подписывайтесь на мои обновления, чтобы иметь возможность получать их одними из первых. И, конечно же, делитесь своими отзывами, мнениями и историями!
Друзья мои, всегда рада видеть вас на страницах своего блога, у себя «дома». Ваша Л.Г.
Оставить комментарий