Программы для транскрибации, которые помогут расшифровать речь в текст
Содержание:
- Использование микшера
- Заказ перевода аудио в текст у специалистов
- Как выполнить транскрибацию?
- Боты для голосовых сообщений
- Звуковые переводчики онлайн
- Топ-5: Аудио переводчики с английского на русский
- Приложения для мобильных систем
- Топ-5: Аудио переводчики с английского на русский
- ОБЩИЕ ПОНЯТИЯ О ТРАНСКРИБАЦИИ
- Голосовой набор текста
- Программа ABoo, скачивание, установка и настройка
- Программы для перевода аудио в текст
Использование микшера
23.08.2014. Неожиданно обнаружил, что могу использовать для транскрибирования скрытые возможности в windows 7 и 8. Возможно это работает не всегда, но на двух моих компьютерах — старом нотбуке и новом моноблоке сработало. Последовательность действий следующая — открываем контрольную панель, затем выбираем звук и в ней вкладку записывающие устройства. Там нажимаем правую кнопку мыши и в появившемся контекстном меня выбираем — показать скрытые устройства.
Появится скрытый миксер звука. Делаем его доступным и затем устройстом записи по умолчанию.
После этого напротив миксера появится столбик, означающий, что он используется для записи. И вроде все — можно приступать к переводу аудио в текст в модуле транскрибирования, при этом мы слышим звук из колонок и не нужно никаких повторителей.
Пользователь Виктор поделился опытом в случае если его нет в системе.
Заказ перевода аудио в текст у специалистов
Вообще, мне достаточно часто нужна услуга по расшифровке аудиозаписей в текст. Нужно переводить в текст мои видеоуроки. Иногда я сначала наговариваю мысли для статьи на диктофон, а потом транскрибирую. Можно конечно заниматься этим самостоятельно с помощью программ, но это отнимает много времени. Почему? Потому что программы для транскрибации не всегда верно расшифровывают слова и приходится долго править полученный текст, форматировать его, вставлять знаки препинания и таймкоды.
Поэтому я нанимаю фрилансеров. Но.. И тут есть “засады”! Очень сложно найти “правильного” фрилансера, который бы делал все четко и в срок. И особенная проблема в том, что фрилансеры (особенно молодые) плохо дружат с русским языком. И часто делают еще больше ошибок, чем программы 🙁 Поэтому я стал искать специализированный сервис, который занимается ручным переводом аудио в текст. И чтобы качественно и недорого. И… Я похоже, нашел такую фирму.
Сервис расшифровки аудиозаписей в текст Zapisano.org
Сейчас я расскажу, чем мне приглянулся данный сервис. Итак, смотрим. Кстати, Все картинки увеличиваются по клику…
Это пока единственный российский сервис по транскрибации аудио с личными кабинетами, который “заточен” под бизнесменов, журналистов, юристов и т.п. То есть, для тех людей, для которых качество и скорость расшифровки аудиофайлов являются самыми важными факторами.
Из “приятных плюшек” хочу отметить еще три, особо мне понравившихся.
- Тестовый заказ. Бесплатный. Для проверки качества работы этого сервиса. Можете попробовать, если не уверены в качестве расшифровки.
- Работа с PayPal. Это означает, что с сервисом могут работать “забугорные” люди. Кстати, проблема с платежами, нередка в случае когда пытаются оплатить услуги российского сервиса из-за рубежа. Ну и PayPal дополнительно защищает Ваши покупки.
- Работа с аудиозаписями из судов. Для меня это ничего не говорит, но мой друг, юрист, говорит, что это крутая фишка..
Короче, не буду навязывать Вам этот сервис. Лучше сами посмотрите и решите, стоит ли с ним работать.
Как выполнить транскрибацию?
Как сделать транскрибацию? Самый время затратный способ – сделать все самостоятельно. Для этого необходимо включить звук, запомнить фразу, поставить аудио на паузу и напечатать услышанное в текстовом документе. Причем часто звук уступает по качеству и с первого раза понять речь может не получаться. Тогда приходиться прослушивать одно и то же дважды, а то и трижды и при этом каждый раз переходить из одной программы в другую.
Значительно облегчить процесс можно с помощью специальных программ для транскрибации:
Express Scribe Transcription Software – подходит для операционных систем Mac OS X и Windows. Есть как бесплатная, так и платная версия, но обе они на английском языке. Функции: замедляет скорость воспроизведения звука, поддерживает формат файлов и видео и аудио, работает с Microsoft Word, что дает возможность не тратить время на переключение между программами, так как все будет находиться на одном экране.
LossPlay – простой, бесплатный и русскоязычный плейер для новичков в сфере транскрибации с минимальным количеством настроек, подходящий только для операционной системы Windows. Он поддерживает все популярные форматы аудио, регулирует скорость воспроизведения и работает с Microsoft Word.
Speechpad – это голосовой блокнот, позволяющий конвертировать звук аудио в текст. Устанавливать на компьютер его не нужно, он работает онлайн. Для того, чтобы им воспользоваться потребуется Google Chrome и микрофон. После включения микрофона нужно начинать надиктовывать текст. Программа автоматически все расшифрует и отобразит в текстовом документе. Для конвертирования видео в текст необходимо в строку вставить ссылку с Ютуба и нажать на кнопку запись.
Transcriber-pro – приложение для Windows на русском языке, с помощью которой можно и прослушивать аудио и просматривать видео. С помощью встроенного текстового редактора проставляются временные метки и имена участников диалога. Из готового текста можно делать «интерактивные стенограммы». Воспользоваться этим приложением можно только при годовой подписке, стоимость которой составляет 689 рублей.
RSplayer V1.4 – несложная программа, позволяющая обрабатывать и расшифровывать аудиофайлы с поддержкой горячих клавиш. Работает совместно с Microsoft Word. Скачать ее можно бесплатно и подойдет она только для Windows. Однако, на новых версиях отмечено, что она иногда тормозит.
Voco – профессиональное приложение для операционной системы Windows, позволяющее преобразовывать речь в текстовый формат, а также предоставляет возможность голосового набора в любом тестовом браузере. Для распознавании речи подключение к интернету не требуется и в ней есть большая коллекция тематических словарей. Еще можно купить две расширенные версии: Voco.Professional и Voco.Enterprise. Они работают с уже готовыми аудио файлам. Единственный минус их – высокий ценник.
Dragon Dictation – это приложение для современного мобильного телефона (смартфона), которое распознает надиктованную речь. Причем распознает оно не только русский язык, но и еще 39 иностранных всех разновидностей. Набранный текст можно редактировать, пересылать электронным письмом и в аккаунты социальных сетей или копировать в буфер обмена.
RealSpeaker – это самое уникальное приложение, которое умеет не просто распознавать аудио формат речи, но и живую, которая наговаривается на камеру. Встроенное видеорасширение RealSpeaker позволяет даже считывать движение губ, что положительно сказывается на распознавании речи (увеличивает качество на 30-40%). Также приложение, кроме русского поддерживает еще 10 языков. Воспользоваться приложением можно бесплатно, но это условно на определенный период времени, бессрочная версия обойдется в 2 тыс. руб.
И последний вариант выполнения транскрибации – воспользоваться помощью профессионала, который этим занимается уже давно. Но в таком случае нужно учитывать конечную стоимость работы и во сколько обойдутся услуги исполнителя.
Боты для голосовых сообщений
Бот в ВКонтакте
Бот «Что тут сказано?» расшифровывает голосовые сообщения. Войс нужно переслать в переписку с ботом, он пришлет текст в ответ. Если надиктовать аудио напрямую в диалог с ботом, он не справится.
Бот расшифровывает войсы
Бота можно пригласить в беседу, тогда он будет автоматически расшифровывать сообщения в чате. Для этого на странице группы кликаем «Пригласить в беседу».
Приглашаем бота в беседу
Дальше выбираем нужный чат, куда добавим бота в качестве участника.
Выбираем чат
В настройках чата находим среди участников бота и даем ему доступ к переписке.
Даем доступ к сообщениям
Теперь если кто-то из участников записывает войс, следующим сообщением бот пришлет расшифровку.
Протестировать другие боты для перевода голосовых сообщений в текст не удалось, группы заброшены, а боты не реагируют на команды.
Бот в Телеграме
Бот Voicy переводит аудиосообщения или аудиофайлы в текст. Можно писать или присылать аудиофайлы боту напрямую или добавить его в чат, тогда на каждую реплику он будет отвечать ее текстовой расшифровкой.
Бот присылает расшифровку сразу после сообщения
Бота нужно настроить. Команда /language вызывает выбор языка, на котором будут записываться голосовые, /engine дает выбрать движок:
- стандартный wit.ai хорошо распознает слова, но не справляется с сообщениями длиннее 50 секунд;
- Yandex.SpeechKit работает без ограничений, но распознает слова хуже;
- Google Speech хорошо распознает голос, работает с любой длиной, но требует оплаты.
Команда /silent отключит уведомления о том, что бот приступил к работе над войсом.
Для отключения бота в чате нужно набрать команду /files.
Сервис Zapisano.org
Иногда нужна точная расшифровка аудиозаписи, но на внесение правок в распознанные тексты или самостоятельный набор с нуля нет времени. В этом случае пока единственный выход — делегировать ручную расшифровку кому-то другому.
За помощью можно обратиться к фрилансерам или в специализирующиеся на транскрибации фирмы. Однако в первом случае придется потратить дополнительное время на поиск ответственного исполнителя и согласование условий, а во втором — на общение с менеджерами по почте.
Для того, чтобы сэкономить время на всех этапах работы, можно воспользоваться сервисом Zapisano.org. Пока это единственный в России сервис расшифровки с личным кабинетом, куда можно быстро загрузить аудиофайлы, оплатить заказ, а после его выполнения хранить исходные аудио и стенограммы.
Интерфейс простой и понятный. После регистрации загрузите файлы или скопируйте ссылку на запись:
Загрузка аудиозаписей для расшифровки
Сервис автоматически подсчитает длительность и спросит, какой тип расшифровки нужен — стандартный, для суда или перевод с иностранного языка. Вам нужно будет только выбрать тариф в зависимости от срочности работы:
Выбор формата тарифа для расшифровки
Прогресс по задачам удобно отслеживать в личном кабинете. Там вы увидите подробности по каждой:
Личный кабинет с прогрессом по задачам
Интерфейс также оптимизирован под мобильные устройства, поэтому в кабинет удобно загружать записи, сделанные на телефон.
Тестовый перевод можно сделать бесплатно, так что у вас будет возможность оценить сервис.
Сервисы из подборки помогут сделать расшифровку интервью на аудио или видео, быстро узнать содержание голосового сообщения и упростят работу с надиктованным текстом. Качество расшифровки сильно зависит от дикции и скорости речи, поэтому всегда требует правок. Если нужно быстро получить точный текст без ошибок распознавания, единственный выход пока — делегировать ручной труд фрилансерам или специализированным сервисам.
Звуковые переводчики онлайн
Готовы учиться переводить иностранные аудиозаписи? Тогда, приступим.
Топ-5: Аудио переводчики с английского на русский
- Использование Гугл Переводчика или Яндекс Переводчика. Этот способ хорош тем, что вы одновременно можете получить, как английский текст, так и его перевод. Настройте переводчик – над левым окном установите исходный язык аудио (английский), а над правым – язык, на который необходимо перевести (русский). Под левым окном переводчика нажмите на микрофон, разрешите использование микрофона, поднесите микрофон к колонкам, включите аудио и наслаждайтесь Подобным образом вы можете работать и с переводчиком от Яндекса:
- Еще один очень удобный сервис для распознавания речи и мгновенного перевода — speechlogger.appspot.com. Выставьте настройки – исходный язык, авто пунктуация, язык, далее также нужно поднести микрофон к колонкам, включить аудио и нажать на иконку “Микрофона”.
- С использованием speechpad.ru По работе с этим сервисом много инструкций в интернете. Особенно часто его используют для перевода речи в текст. Мы же будем использовать его для автоперевода. Перейдите на сервис speechpad, нажмите на кнопку +перевод, как показано на скриншоте ниже: Теперь выставьте настройки, как у меня на скриншоте: 1. Включите микрофон, 2. разрешите использование микрофона на сайте spechpad, 3. поднесите микрофон к колонкам, 4. Включите аудио (или видео) с иностранной речью.
- Второй вариант перевода английского аудио в текст – онлайн сервис dictation.io. Поднесите микрофон к колонкам, включите аудиозапись на английском языке и нажмите на сервисе кнопку “Start dictation”. После завершения записи нажмите “stop dictation”. Сохранить текст можно, нажав на кнопку “save”. Запись сохраниться в текстовом файле txt.
- Больше всего мне нравится третий вариант преобразования английской речи в текст. Перейти на сервис онлайн speech-to-text-demo. Он хорош тем, что не обязательно нужно проигрывать аудиофайл, хотя такая функция в сервисе тоже имеется. Благодаря этому, вы можете переводить аудио в текст в абсолютной тишине, если это требуется, например, если вы привыкли работать по ночам. Вторым вариантом является простая загрузка аудиофайла на сервис, где он автоматически распознается и будет переведен в текстовый файл. Однако не любой аудиофайл можно загрузить на сервис. Поддерживаются только расширения .wav, .flac, или .opus. Файл mp3 загрузить не получится, но и здесь есть выход – вам нужно всего лишь воспользоваться любым аудио конвертером, можно тоже онлайн. Рекомендую для конвертации аудио в другой формат сервис — online-audio-converter.com.Итак, теперь рассмотрим поэтапно процесс преобразования английской речи в текст при помощи указанного сервиса. Предположим, что у вас файл mp3. Значит, вам сначала нужно сконвертировать файл при помощи сервиса online-audio-converter.com. Вам нужно открыть аудиофайл, выбрать расширение, в которое необходимо сконвертировать (wav) и нажать кнопку “Конвертировать”. после завершения конвертации скачайте файл: Второй шаг – собственно перевод английского аудио в текст на сервисе speech-to-text-demo. Перейдите на этот сервис, нажмите на кнопку “Upload audio file” (загрузить аудио файл) и выберите из папки вашего компьютера сконвертированный в wav, flac или opus аудио файл. Через некоторое время в окне появится текст аудио. Пример:
Приложения для мобильных систем
Для смартфонов разработано достаточно много систем распознавания голоса. Это связано с тем, что набирать текст вручную на мобильном сложно. Я иногда использую приложения для распознавания на своем планшете.
Назову три самых популярных системы для конвертации устной речи в текст.
Приложение Speechnotes
Можно установить на Android. Шустро преобразует устную речь в письменную и ничем особым не выделяется среди аналогов. Разве что стоит отметить достаточно удобный интерфейс. Из минусов – работает только при наличии интернета.
Speechnotes
Приложение ListNote
ListNote также создан для Android. Есть поддержка русского языка, работает программа совершенно стандартно. Запускаем приложение, начинаем говорить – получаем текст. Большой плюс – может функционировать в режиме офлайн.
Приложение Dragon Dictation
Для порядка приведу программу для iOS, хотя я сама использую только Android-системы. Работа в ней вполне стандартна. Установите ее на свой смартфон – и пользуйтесь на здоровье. Текст, получивший в результате конвертации, можно отправить в социальные сети, например, в Facebook или Twitter. Для работы программы нужен интернет.
Топ-5: Аудио переводчики с английского на русский
- Использование Гугл Переводчика или Яндекс Переводчика. Этот способ хорош тем, что вы одновременно можете получить, как английский текст, так и его перевод. Настройте переводчик – над левым окном установите исходный язык аудио (английский), а над правым – язык, на который необходимо перевести (русский). Под левым окном переводчика нажмите на микрофон, разрешите использование микрофона, поднесите микрофон к колонкам, включите аудио и наслаждайтесь Подобным образом вы можете работать и с переводчиком от Яндекса:
- Еще один очень удобный сервис для распознавания речи и мгновенного перевода — speechlogger.appspot.com. Выставьте настройки – исходный язык, авто пунктуация, язык, далее также нужно поднести микрофон к колонкам, включить аудио и нажать на иконку “Микрофона”.
- С использованием speechpad.ru По работе с этим сервисом много инструкций в интернете. Особенно часто его используют для перевода речи в текст. Мы же будем использовать его для автоперевода. Перейдите на сервис speechpad, нажмите на кнопку +перевод, как показано на скриншоте ниже: Теперь выставьте настройки, как у меня на скриншоте: 1. Включите микрофон, 2. разрешите использование микрофона на сайте spechpad, 3. поднесите микрофон к колонкам, 4. Включите аудио (или видео) с иностранной речью.
- Второй вариант перевода английского аудио в текст – онлайн сервис dictation.io. Поднесите микрофон к колонкам, включите аудиозапись на английском языке и нажмите на сервисе кнопку “Start dictation”. После завершения записи нажмите “stop dictation”. Сохранить текст можно, нажав на кнопку “save”. Запись сохраниться в текстовом файле txt.
- Больше всего мне нравится третий вариант преобразования английской речи в текст. Перейти на сервис онлайн speech-to-text-demo. Он хорош тем, что не обязательно нужно проигрывать аудиофайл, хотя такая функция в сервисе тоже имеется. Благодаря этому, вы можете переводить аудио в текст в абсолютной тишине, если это требуется, например, если вы привыкли работать по ночам. Вторым вариантом является простая загрузка аудиофайла на сервис, где он автоматически распознается и будет переведен в текстовый файл. Однако не любой аудиофайл можно загрузить на сервис. Поддерживаются только расширения .wav, .flac, или .opus. Файл mp3 загрузить не получится, но и здесь есть выход – вам нужно всего лишь воспользоваться любым аудио конвертером, можно тоже онлайн. Рекомендую для конвертации аудио в другой формат сервис — online-audio-converter.com.Итак, теперь рассмотрим поэтапно процесс преобразования английской речи в текст при помощи указанного сервиса. Предположим, что у вас файл mp3. Значит, вам сначала нужно сконвертировать файл при помощи сервиса online-audio-converter.com. Вам нужно открыть аудиофайл, выбрать расширение, в которое необходимо сконвертировать (wav) и нажать кнопку “Конвертировать”. после завершения конвертации скачайте файл: Второй шаг – собственно перевод английского аудио в текст на сервисе speech-to-text-demo. Перейдите на этот сервис, нажмите на кнопку “Upload audio file” (загрузить аудио файл) и выберите из папки вашего компьютера сконвертированный в wav, flac или opus аудио файл. Через некоторое время в окне появится текст аудио. Пример:
ОБЩИЕ ПОНЯТИЯ О ТРАНСКРИБАЦИИ
Рассказать о ней в
«двух словах» проще «пареной репы», но результата от такого рассказа вы не
получите. Поэтому, я расскажу о транскрибации много, но, по существу.
Транскрибация — это
перевод аудио или видео форматов в текст. Чем-то отдалённо напоминает
стенографию. В настоящее время услуга очень востребована.
Транскрибация делится
на три вида:
Первый – это просто
голос.
Например, журналист
наговаривает себе на диктофон запись или студент записывает на диктофон лекцию,
которую впоследствии нужно будет перевести в текст.
Если есть возможность
подключить к микрофону программу для автоматической транскрибации, то тогда она
будет сразу же переводить голос в текст, который после небольшой правки будет
полностью готов к дальнейшему использованию.
Но если такой
возможности нет, то тогда используют сначала диктофон, а потом с диктофона
через микрофон наговаривают текст с использованием программы. Используется этот
вид довольно редко и у заказчиков особой популярностью не пользуется.
Второй – аудиофайлы.
Они позволяют
производить расшифровку полностью или частично, в зависимости от качества
аудиозаписи. После некоторой правки результат можно сразу отправлять заказчику.
Огромный плюс этого
вида — все программы по автоматической или полуавтоматической транскрибации
имеют широкий набор типов аудиофайлов и расширений.
Но имеются и минусы:
не видно действий, места, времени, количество участников, событий. Совершенно
непонятна суть происходящего.
Если запись чёткая, то
ещё полбеды, а если плохая, да к тому с несколькими участниками, то над
переводом придётся изрядно попотеть.
Третий – видеофайлы.
Начну сразу с плюсов.
При плохой записи звука, можно без труда догадаться о сути происходящих
событий, по артикуляции и жестикуляции действий героев.
Но один серьёзный
недостаток сразу портит всю картину — не все программы для автоматической
транскрибации имеют возможность принимать видеофайлы.
В большинстве случаев
требуется разделять файлы на два отдельных формата: аудио и видео, т.е.
разделять дорожки, а это уже дополнительная проблема, так как для этого
требуется дополнительное время.
От того, в каком
формате получен первоначальный файл от заказчика и в каком виде его нужно
предоставить ему обратно зависит:
- Объём выполняемой работы.
- Время, потраченное на его выполнение.
- Уровень сложности.
- Требование к корректуре.
- Ваше итоговое вознаграждение.
Иногда, корректировка
текста может занимать гораздо больше времени, чем непосредственная расшифровка
самой записи.
Рассмотрим три
основных формата корректировки:
Без корректуры, т.е. сразу после расшифровки файла программой текст «один в
один» передаётся заказчику. Этот вид считается самым простым, поэтому и
оплачивается очень дёшево.
Для примера, возьмём
первый попавшийся ролик на Ютуб.
Помимо видео просмотра
в любой момент можно посмотреть текст. Для этого достаточно нажать на (1),
далее на (2) и тут же открывается сам текст (3).
Базовая корректировка, т.е. требуется привести текст к читабельному виду:
строчки должны быть расположены на всю ширину листа и проставлены все
необходимые знаки препинания. Для выполнений такой корректировки нужно
потратить n-е количество времени, следовательно, оплата уже идёт выше, чем за
«голую» расшифровку.
Улучшенная корректировка, т.е. требуется добавить форматирование. Какое
именно, заказчик указывает сам. Это могут быть заголовки, шрифты, таблицы,
абзацы и т.д. Соответственно и стоимость за этот формат самая высокая.
Называться эти форматы
могут, абсолютно, по-разному, поэтому очень важно уточнять у заказчика
скрупулёзно все детали, вплоть до самых незначительных мелочей. Если изначально упустить этот
момент из виду, то придётся переделывать работу до «колючих ёжиков»
Ведь,
исходя из объёма и сложности работы, зависит окончательная цена
Если изначально упустить этот
момент из виду, то придётся переделывать работу до «колючих ёжиков». Ведь,
исходя из объёма и сложности работы, зависит окончательная цена.
Очень часто заказчики
пытаются обмануть своих исполнителей, не договаривая того, что они хотят
получить в итоге, а потом просто не оплачивают работу до тех пор, пока не
выполнишь все их требования.
Например, вы в «общих
чертах» договорились с заказчиком о базовой корректировки текста, а он стал
требовать от вас, за те же деньги, с форматированием. И так бывает «часто и
густо».
Так что будьте
внимательны.
Голосовой набор текста
Нажмите кнопку «включить запись». При первом посещении сайта вверху браузера возникнет панелька с просьбой разрешить доступ к микрофону. Нажмите там кнопку «Разрешить»
Говорите в микрофон
Кнопка A/a меняет регистр первой буквы слова, рядом с которым находится курсор
Кнопка Отменить удаляет из результирующего поля последний введенный фрагмент
Кнопки пунктуации служат для ввода знаков с помощью мыши
Текст в результирующее поле добавляется после последней позиции курсора. Если был выделен фрагмент текста в результирующем поле, то введенный текст будет его заменять
Установка флажка Отключить управление заглавными буквами Google отменяет простановку заглавных букв анализатором Google.
Если отмечен флажок Заменять слова пунктуации, то слова в голосовом вводе, совпадающие со знаками препинания, будут заменяться на эти знаки. Соответствующие слова можно увидеть, если навести мышь на кнопку знака.
*В настоящее время Google самостоятельно заменяет слова: точка, запятая, вопросительный и восклицательный знаки, поэтому при отключении флажка замена все равно может проводиться.
Смена языка для голосового ввода осуществляется выбором соответствующего языка в выпадающем списке. Если языка нет в списке, но он поддерживается для голосового ввода, то его можно добавить в кабинете пользователя (доступен после регистрации)
Если отмечен флажок Выполнять команды, то во время ввода текста можно давать команды голосом.
Если отмечен флажок Вывод в буфер обмена, то текст будет поступать не в результирующее поле, а в буфер обмена. Флажок работает только при установленном расширении блокнота.
Поле Уровень распознавания отображает качество распознавания речи или вид ошибки, если она возникла.
Программа ABoo, скачивание, установка и настройка
Давайте приступим к установке нашей программы, нажимаем скачать ABoo, в открывшемся окне браузера нажимаем скачать
автоматически определится ваша версия операционной системы windows и снова нажимаем скачать
наш установочный файл скачался
Открываем папку со скачанным файлом, нажимаем дважды левой кнопкой мыши на aboosetup090.exe
в открывшемся окошке выбираем куда устанавливаем, нажав на обзор, по умолчанию, будет установлена на диск C в Program files и нажимаем установить
установка длится 1-2 секунды, нажимаем закрыть
Программа ABoo установлена, теперь давайте приступим к настройке, нажимаем левой кнопкой мыши дважды на иконку программы на рабочем столе.
В открывшейся программе нажимаем настройки
откроется дополнительное поле с настройками и настраиваем под себя
- нажимаем на динамик и прослушиваем вариант озвучки
настраиваем скорость, тон и громкость
выбираем голос из трёх предложенных вариантов
если хотим послушать текст без записи, ставим отметку — читать текст вслух без записи
если же будем преобразовывать, то отмечаем — голосовая нумерация блоков, чтобы текст был разбит на блоки, также отмечаем запись блоками
сами выбираем какой длины по времени звучания будут блоки и какая пауза между ними
После того, как всё настроили под себя, можно приступать к использованию.
Программы для перевода аудио в текст
Да, сервисы и которые могут автоматически переводить аудио в текст, кажутся привлекательным решением, но идеально такой сервис ещё не придумали. Все равно они допускают ошибки, не проставляют знаки препинания и т.д. Переделывать такие текста иногда значительно труднее и занимают дольше времени. Да и подумайте сами. Если бы существовали такие онлайн-сервисы, то зачем бы заказчик платил вам деньги?
Поэтому программистами созданы программы, способные если не переводить идеально аудио в текст, то хотя бы значительно упростить вам эту задачу. Давайте рассмотрим лучшие из них.
Express Scribe
Самая популярная работа для помощи в расшифровки аудиофайлов в текст. Сама она распознавать не умеет, но позволяет значительно упростить тайпистам* работу.
Express Scribe позволяет загрузить аудиофайл, прослушивать его на удобной скорости и одновременно набирать текст в собственном текстовом редакторе. Свой редактор программы не умеет проверять правописание, но программа интегрируется с Microsoft Word. Есть поддержка горячих клавиш, что позволяет быстро переключаться между операциями не притрагиваясь к мыши.
Имеет как платную, так и бесплатную версии. Поддерживает ОС Windows и Mac
Transcriber-pro
Русскоязычный аналог Express Scribe с возможностью прослушивать не только аудиофайлы, но и воспроизводить видео. Имеет инструмент группового редактирования, если вы работаете не один, а группой: наборщик, корректор, редактор и т.д. Программа платная и лицензия стоит 640 рублей в год, можно отбить одним заказом. Работает только на компьютерах под управлением операционной системы Windows.
Раньше программа назвалась Slovomol Editor
LossPlay
С виду это обычный аудиоплеер как Winamp или AIMP, но создавался он с привлечением профессиональных транскрибаторов и заточен он именно для расшифровки аудио в текст. Поддержка горячих клавиш и глубокая интеграция с Word поможет упростить сложный процесс перевода аудиофайла в текст. Можно регулировать скорость воспроизведения. Умеет воспроизводить как аудио, так и видео файлы. Бесплатна и имеет русскоязычный интерфейс
VOCO
Профессиональное приложение для Windows позволяющее преобразовывать начитанный текст в готовый текстовый документ. Версии Voco.Professional и Voco.Enterprise позволяют преобразовывать в текст уже готовые аудиофайлы. Увы, стоимость данной программы достаточно велика. Voco.basic обойдется вам в 1690 рублей, а вот Voco.Professional уже в 13 900. Корпоративная стоит так под все 50 тысяч рублей.
RealSpeaker
Уникальный инструмент для преобразования голосовой речи в текст. В отличие от своих конкурентов данная программа умеет не только «слушать» речь, но и следить за движением губ диктора, улучшая результат расшифровки аудио в текст. С августа 2016 года авторы тестируют инструмент транскрибации, где вы можете загрузить файл и получить текстовый результат. Опробовать его можно на этому адресу. Пока идет тестирование, делать этом можно абсолютно бесплатно. Далее, думаю, будет платно.