Запись речи в текстовый файл. Как перевести аудио звук или видео ролик в печатный текст

Дата публикации: 30-09-2018 5722

Добрый день, уважаемые фрилансеры!

Что из себя представляет транскрибация и как на ней зарабатывать мы уже проходили в прошлой статье. Теперь мы коснемся другого аспекта данного явления: такого, как аудио программа для транскрибации .

Есть целый ряд программ для транкрибации аудио в текст и множество способов перевода текста из аудио и видео формата в письменный текст.

Способы эффективной транскрибации мы с вами разберем уже в следующей статье, а пока давайте рассмотрим ключевые программы для этого процесса.

Транскрибация аудио в текст бесплатные программы

Думаю, что стоит начать с наиболее известной программы в данной области.

Express Scribe

Увы, но данная программа идет лишь с английским языком, но она настолько простая и понятная, что с ней сможет справиться абсолютно любой, плюс ко всему - это яркий представитель бесплатной .

Ключевые достоинства:

  • Очень легко вводить текст и не нужно метаться между самим полем и проигрывателем.
  • Есть возможность менять скорость воспроизведения текста, чтобы было удобно набирать текст.
  • Есть возможность закрепить "горячие" клавиши для удобства работы с проигрывателем.
  • Прекрасно подходит для Word.
  • Имеются тайм-коды.
  • Только английский язык, хоть это и не особо затрудняет работу.

В другой статье мы подробно разберем все аспекты работы с данной программой и как правильно пользоваться горячими клавишами.

LossPlay

Удобный софт для транскрибации текста, плюс ко всему эту программу для транскрибации можно скачать бесплатно.

Ключевые достоинства:

  • Наличие горячих клавиш.
  • Работа с аудио и видео форматами.
  • Возможность менять скорость записи.
  • Наличие тайм-кодов.
  • Возможность регулировать откат после паузы.
  • Прекрасно подходит для Word.
  • Вам придется порой переключать окна программы.

Данный софт способен заменить рядовые приложения в том же сервисе Google, где у вас есть также возможность вводить текст через запись по микрофону.

Как видите, есть ряд полезных программ для успешной транкрибации. Кроме всего прочего, есть также множество и видео программ для транскрибации. Ниже вы можете в комментариях написать свое мнение о той или иной программе или любой другой, которую используйте. Всего вам доброго. Встретимся в следующей статье.

Существует множество профессий, о которых слышали лишь единицы. Немногие могут сказать, чем занимается транскрибатор. Этот пробел может восполнить статья, представленная ниже. Она будет интересна каждому, кто хочет найти легкую удаленную работу.

Что это такое?

Транскрибация — это перевод речи из аудио или видеоформата в текстовый. Иначе говоря, так называется создание напечатанного, логически связанного текста, пригодного для последующей редакции из аудио- или видеозаписи. Кстати, с примерами транскрибации знакомы все. Наверняка каждый хотя бы раз видел видеоматериал, сопровождающийся субтитрами.

Главное, что требуется тем, кто решил зарабатывать транскрибацией — хороший слух, позволяющий четко разбирать русскую или иностранную речь. Кроме того, необходимо умение набирать текст на клавиатуре компьютера. Таким образом, чтобы заниматься оказанием услуг «расшифровки» аудио- или видеофайлов, не требуется никаких особых навыков и знаний, особенно если речь идет о работе с материалом на родном языке.

Единственное, что может помешать зарабатывать деньги, оказывая услуги транскрибации, — медленный набор текста. Помните, что скорость и мастерство быстро приходят вместе с практикой.

Транскрибация аудио в текст: преимущества

Это занятие выбирают, если появилась необходимость подзаработать, но нет возможности устроиться на подходящую работу, а также отсутствует образование. Кроме того, транскрибация помогает:

  • научиться быстрее печатать на клавиатуре вслепую;
  • развить память, так как приходится кратковременно запоминать большие аудиофрагменты;
  • стать внимательнее, усидчивее, терпеливее;
  • научиться грамотно писать.

Еще один плюс, который присущ транскрибации, — это возможность работать удаленно, то есть в удобное для вас время и без необходимости ежедневно ездить на работу, тратя на дорогу деньги и время. Именно последнее обстоятельство делает это занятие крайне привлекательным для мам в декрете и для студентов очной формы обучения.

Минусы

Главный недостаток работы транскрибатором — сравнительно невысокая стоимость услуги. Однако в любом случае при серьезном подходе можно будет получать неплохие деньги, если учесть, что вам не придется работать вне дома.

К минусам относится необходимость долгое время сидеть на одном месте и то, что в таком занятии нет места творчеству.

Кто заказывает

Транскрибацию аудио в текст обычно выбирают те, кто берет интервью, организует конференции, занимается обзвоном клиентов, инфобизнесом и прочее. При этом качество записи аудио или видео у заказчика может быть как хорошего, так и очень плохого качества.

Транскрибация требуется для аудиозаписей, сделанных в ходе:

  • телефонных разговоров;
  • семинаров/вебинаров;
  • интервью;
  • аудиоподкастов;
  • телепередач.

Кроме того, есть много людей разных профессий, которым проще записать мысли на диктофон, а затем попросить транскрибатора сделать из аудио статью или книгу.

Чего хотят заказчики?

У тех, кому необходима транскрибация разговоров, лекций или другого аудио в текст, могут быть разные требования, в зависимости от поставленных перед ними задач.

В самом простом случае нужно печатать услышанные фразы, разбивая текст на предложения, правильно расставлять знаки препинания.

Если транскрибируется диалог или разговор нескольких людей, нужно будет указывать, кто говорит. Обычно это делается путем выставления пометок типа «первый (второй) голос», «мужчина», «женщина» и других.

Если вас заинтересовал заработок на транскрибации, то для поиска работы лучшим местом являются биржи фриланса. Там практически ежедневно встречаются заказы на перевод видео и аудиофайлов в текст.

А еще начинающий фрилансер может размещать в Интернете объявления о своих услугах на тематических сайтах. Это не самый быстрый способ, но, возможно, так вам удастся заполучить клиентов для постоянной работы. Самое главное - это не писать в объявлении, что вы работаете по договорной цене. Лучше четко обозначить, какие услуги вы готовы оказать и их стоимость.

Со временем вы можете обратиться в специальные компании и предложить им свои услуги. Если вы им подойдете, у вас отпадет необходимость искать заказы. Кроме того, в таких компаниях расценки, как правило, даже больше, чем стоимость услуг, заказываемых через биржи фриланса.

Сколько можно заработать?

Не напрягаясь, в день можно траскрибировать 2 часа аудио, даже если оно самого плохого качества. На данный момент на рынке фриланс-услуг средняя цена 1 минуты перевода звука в текст составляет около 10 рублей.

При больших объемах заказа опытные транскрибаторы советуют соглашаться на более низкий тариф. Восемь рублей за 1 минуту обработки аудио при постоянной работе — вполне допустимо. Однако за заказы ниже этой ценовой планки браться не стоит, так как полученная сумма не сможет окупить затраченное время.

Предположим, вы нашли постоянного заказчика. Тогда ваш заработок, даже при цене 8 рублей за минуту транскрибации — это около 1000 рублей в день, если вы будете работать всего 2 часа. А это совсем неплохо, особенно для жителей провинции.

От чего зависит цена

Стоимость заказа на транскрибацию аудио будет выше обычной, если:

  • очень плохое качество записи и присутствуют помехи;
  • нужно «расшифровать» разговор нескольких человек, причем сложно понять, кто говорит;
  • фразы длинные и присутствуют термины, которые трудно разобрать непосвященному человеку;
  • нужно «расшифровать» текст на иностранном языке без или одновременно с его переводом (в последнем случае оплата бывает достаточно высокой);
  • требуется оформить текст специальным образом (расставить тайм-коды, сделать и другое);
  • нужно сделать работу срочно.

Как не стать жертвой недобросовестных заказчиков

Главный риск занятия транскрибацией — это недобросовестные заказчики.

К сожалению, во все времена были аферисты, желающие воспользоваться плодами чужого труда бесплатно. Особенно много их развелось в Интернете, где легко «потеряться», как только фрилансер вышлет заказ.

Выявить таких заказчиков-мошенников достаточно сложно, так как они крайне учтивы и не предъявляют завышенных требований. Основной признак «халявщика» — это высокая цена и недавняя регистрация на фриланс-бирже.

Дело в том, что горе-заказчики любят создавать аккаунты на 1-2 мошеннических заказа, которые больше никогда не используются. Что делать? Работать только с теми клиентами, которые давно на бирже фриланса, не стесняться просить предоплату. Можно также высылать заказ частями, с отдельной оплатой каждой из них. В некоторых случаях лучше поступить следующим образом: транскрибатор сначала высылает заказчику скриншот получившегося текста, а сам текст — только после получения оплаты.

Кому подходит

Прежде всего транскрибация — это хороший вариант для начинающих фрилансеров. Такой вид онлайн-заработка идеально подходит студентам и школьникам, которые ничего другого пока не имеют. Он не требует вложений и позволяет быстро начать зарабатывать.

Программы для транскрибации

Конечно, можно начать работу транскрибатором, используя любой медиапроигрыватель и текстовый редактор Word. Однако как уже было сказано, ваш доход будет напрямую связан со скоростью выполнения заказа, поэтому рекомендуется использовать специальные программы, например Express Scribe. Хотя она не имеет русскоязычной версии, разобраться с интерфейсом может каждый, кто владеет самыми примитивными навыками работы с компьютерным софтом.

К основным преимуществам программы Express Scribe относятся:

  • наличие поля для набора текста, что избавляет от необходимости постоянно переключаться между окном проигрывателя и текстовым документом;
  • возможность изменения скорости проигрывания аудиофайла;
  • наличие настраиваемых горячих клавиш, позволяющих останавливать, воспроизводить и перематывать аудиозапись.
  • адаптированность для работы с офисным редактором Word.

Неплохих результатов можно достичь, если использовать LossPlay. Эту программу, как и предыдущий софт для транскрибации, можно скачать бесплатно. Достоинства у нее почти такие же, как у Express Scribe, однако иногда вам придется переключаться между окнами, что не всегда удобно.

Теперь вы знаете, что такое транскрибация, и разбираетесь в особенностях этого

В «Фейсбуке» нам задали вопрос:
«Для работы с текстом мне нужно расшифровать 3 часа диктофонной записи. Пробовал загрузить аудиофайл с картинкой в YouTube и воспользоваться их расшифровщиком текста, но получается какая-то абракадабра. Подскажите, как можно решить это технически? Спасибо!
Александр Коновалов»

Александр, простое техническое решение есть – но результат будет зависеть исключительно от качества вашей записи. Поясню, о каком качестве речь.

За последние годы технологии распознавания русской речи сильно продвинулись вперед. Процент ошибок распознавания снизился до такого уровня, что иной текст стало проще «наговорить» в специальном мобильном приложении или интернет-сервисе, откорректировав вручную отдельные «очепятки» – чем целиком набирать весь текст на клавиатуре.

Но, чтобы искусственный интеллект системы распознавания смог проделать свою работу – пользователь должен проделать свою. А именно: говорить в микрофон четко и размеренно, избегать сильных фоновых шумов, по возможности использовать стереогарнитуру или выносной микрофон, прикрепленный к петлице (для качества распознавания важно, чтобы микрофон все время находился на одном расстоянии от губ, а вы сами говорили с одинаковой громкостью). Естественно, чем выше класс аудиоустройства – тем лучше.

Несложно придерживаться этих условий, если вы, вместо того, чтобы обращаться к интернет-сервису распознавания речи напрямую, применяете в качестве промежуточного устройства-посредника диктофон. К слову, такой «персональный секретарь» особенно незаменим, когда у вас нет доступа к онлайну. Естественно, лучше использовать хотя бы недорогой профессиональный диктофон, нежели записывающее устройство, встроенное в дешевый mp3-плеер или смартфон. Это даст гораздо больше шансов «скормить» полученные записи сервису распознавания речи.

Сложно, но можно уговорить соблюдать эти правила собеседника, у которого вы берете интервью (еще один совет: если у вас нет в комплекте выносного микрофона на прищепке – хотя бы держите диктофон рядом с собеседником, а не с собой).

А вот «законспектировать» на нужном уровне в автоматическом режиме конференцию или семинар – дело, на мой взгляд, практически нереальное (ведь вы не сможете контролировать речь спикеров и реакцию слушателей). Хотя достаточно интересный вариант: превращение в текст профессионально записанных аудиолекций и аудиокниг (если на них не накладывалась фоновая музыка и шумы).

Будем надеяться, что качество вашей диктофонной записи – достаточно высокое, чтобы ее удалось расшифровать в автоматическом режиме .

Если же нет – практически при любом качестве записи вы сможете провести расшифровку в полуавтоматическом режиме .

Кроме того, в ряде ситуаций наибольшую экономию времени и сил вам принесет, как ни парадоксально, расшифровка в ручном режиме . Точнее, тот ее вариант, который сам я использую уже с десяток лет. 🙂

Итак, по порядку.

1. Автоматическое распознавание речи

Многие советуют расшифровывать диктофонные записи на YouTube. Но этот метод заставляет пользователя тратить время на этапе загрузки аудиофайла и фоновой картинки, а затем – в ходе очистки итогового текста от меток времени. Между тем, это время несложно сэкономить. 🙂

Вы можете распознавать аудиозаписи прямо со своего компьютера, воспользовавшись возможностями одного из интернет-сервисов, работающих на движке распознавания Google (рекомендую Speechpad.ru или Speechlogger.com). Все, что нужно – проделать маленький трюк: вместо вашего голоса, воспроизводимого с микрофона, перенаправить на сервис аудиопоток, воспроизводимый вашим компьютерным проигрывателем.

Этот трюк называется программным стерео микшером (его обычно применяют для записи музыки на компьютере или ее трансляции с компьютера в интернет).

Стерео микшер входил в состав Windows XP – но был удален разработчиками из более поздних версий этой операционной системы (говорят, в целях защиты авторских прав: чтобы геймеры не воровали музыку из игр и т.п.). Однако стерео микшер нередко поставляется вместе с драйверами аудиокарт (например, карт Realtec, встраиваемых в материнскую плату). Если вы не найдете стерео микшер на своем ПК с помощью предлагаемых ниже скриншотов – попробуйте переустановить аудиодрайверы с CD-диска, который шел в комплекте с материнской платой – либо с сайта ее производителя.

Если и это не поможет – установите на компьютер альтернативную программу. Например – бесплатный VB-CABLE Virtual Audio Device : использовать его рекомендует владелец вышеупомянутого сервиса Speechpad.ru.

Первым шагом вы должны отключить для использования в режиме записи микрофон и включить вместо него стерео микшер (либо виртуальный VB-CABLE).

Для этого нажмите по иконке громкоговорителя в правом нижнем углу (возле часов) – либо выберите раздел «Звук» в «Панели управления». Во вкладке «Запись» открывшегося окна щелкните правой кнопкой мыши и поставьте птички напротив пунктов «Показать отключенные устройства» и «Показать отсоединенные устройства». Нажмите правой кнопкой по иконке микрофона и выберите пункт «Отключить» (вообще, отключите все устройства, отмеченные зеленым значком).

Нажмите правой кнопкой по иконке стерео микшера и выберите пункт «Включить». На иконке появится зеленый значок, что будет означать, что стерео микшер стал устройством по умолчанию.

Если вы решили использовать VB-CABLE – то тем же способом включите его во вкладке «Запись».

А также – во вкладке «Воспроизведение».

Второй шаг. Включите аудиозапись в любом проигрывателе (если нужно расшифровать аудиодорожку видеоролика – можно запустить и видеопроигрыватель). Параллельно загрузите в браузере Chrome сервис Speechpad.ru и нажмите в нем кнопку «Включить запись». Если запись достаточно высокого качества, вы увидите, как сервис на глазах превращает речь в осмысленный и близкий к оригиналу текст. Правда, без знаков препинания, которые вам придется расставить самостоятельно.

В качестве аудиопроигрывателя советую использовать AIMP, о котором будет подробнее рассказано в третьей подглавке. Сейчас лишь отмечу, что этот плеер позволяет замедлить запись без искажений речи, а также исправить некоторые другие погрешности. Это может несколько улучшить распознавание не слишком качественной записи. (Иногда даже советуют предварительно подвергать плохие записи обработке в профессиональных программах редактирования звука. Однако, на мой взгляд, это слишком трудоемкая задача для большинства пользователей, которые гораздо быстрее наберут текст вручную. 🙂)

2. Полуавтоматическое распознавание речи

Тут все просто. Если запись некачественная и распознавание «захлебывается» либо сервис выдает слишком много ошибок – помогите делу сами, «встроившись» в цепочку: «аудиоплеер – диктор – система распознавания».

Ваша задача: прослушивать в наушниках записанную речь – и параллельно надиктовывать ее через микрофон интернет-сервису распознавания. (Естественно, вам не нужно, как в предыдущем разделе, переключаться в списке записывающих устройств с микрофона на стерео микшер или виртуальный кабель). А в качестве альтернативы упоминавшимся выше интернет-сервисам можете использовать смартфонные приложения вроде бесплатной «Яндекс.Диктовки» либо функцию диктовки в iPhone с операционной системой iOS 8 и выше.

Отмечу, что в полуавтоматическом режиме вы имеете возможность сразу диктовать знаки препинания, расставлять которые в автоматическом режиме сервисы пока не способны.

Если у вас получится диктовать синхронно с воспроизведением записи на плеере – предварительная расшифровка займет практически столько же времени, сколько и сама запись (не считая последующих затрат времени на исправление орфографических и грамматических ошибок). Но даже работа по схеме: «прослушать фразу – надиктовать – прослушать фразу – надиктовать», – может вам дать неплохую экономию времени по сравнению с традиционным набором текста.

В качестве аудиоплеера рекомендую использовать тот же AIMP. Во-первых, с его помощью вы можете замедлить воспроизведение до скорости, на которой вам будет комфортно работать в режиме синхронной диктовки. Во-вторых, этот плеер умеет возвращать запись на заданное количество секунд: это бывает необходимо, чтобы лучше расслышать неразборчивую фразу.

3. Расшифровка диктофонной записи в ручном режиме

Вы можете установить на практике, что слишком быстро устаете от диктовки в полуавтоматическом режиме. Или делаете вместе с сервисом слишком много ошибок. Или, благодаря навыкам быстрого набора, гораздо легче создаете готовый исправленный текст на клавиатуре, чем с помощью диктовки. Или ваш диктофон, микрофон на стереогарнитуре, аудиокарта не обеспечивают приемлемое для сервиса качество звука. А может, у вас просто нет возможности диктовать вслух в своем рабочем или домашнем офисе.

Во всех этих случаях вам поможет мой фирменный способ расшифровки вручную (прослушиваете запись в AIMP – набираете текст в Word). С его помощью вы превратите запись в текст быстрее, чем это сделают многие профессиональные журналисты, чья скорость набора на клавиатуре аналогична вашей! При этом вы потратите гораздо меньше, чем они, сил и нервов. 🙂

Из-за чего, в основном, теряются силы и время в ходе расшифровки аудиозаписей традиционным способом? Из-за того, что пользователь совершает очень много лишних движений.

Пользователь постоянно протягивает руку то к диктофону, то к клавиатуре компьютера. Остановил воспроизведение – набрал прослушанный отрывок в текстовом редакторе – снова включил воспроизведение – отмотал неразборчивую запись назад – и т.д., и т.п.

Использование обычного программного плеера на компьютере мало облегчает процесс: пользователю приходится постоянно сворачивать/разворачивать Word, останавливать/запускать плеер, да еще елозить туда-сюда слайдером плеера, чтобы найти неразборчивый фрагмент, а затем вернуться к последнему прослушанному месту в записи.

Чтобы сократить эти и другие потери времени, специализированные IT-компании разрабатывают программные и аппаратные транскрайберы. Это достаточно дорогие решения для профессионалов – тех же журналистов, судебных стенографистов, следователей и т.д. Но, собственно, для наших целей требуются только две функции:

  • возможность замедлить воспроизведение диктофонной записи без ее искажения и понижения тона (замедлить скорость воспроизведения позволяют многие плееры – но, увы, при этом человеческий голос превращается в монструозный голос робота, который сложно воспринимать на слух продолжительное время);
  • возможность остановить запись или откатить ее на заданное количество секунд и вернуть обратно, не останавливая набор текста и не сворачивая окно текстового редактора.

В свое время я протестировал десятки аудиопрограмм – и нашел лишь два доступных платных приложения, отвечающих этим требованиям. Приобрел одно из них. Поискал еще немного для своих дорогих читателей 🙂 – и нашел замечательное бесплатное решение – проигрыватель AIMP , которым сам пользуюсь до сих пор.

«Войдя в настройки AIMP, найдите раздел Глобальные клавиши и перенастройте Стоп/Пуск на клавишу Эскейп (Esc). Поверьте, это наиболее удобно, поскольку не придется задумываться и палец не попадет случайно на другие клавиши. Пункты «Немного перейти назад» и «Немного перейти вперед» настройте, соответственно, на клавиши Ctrl + клавиши курсора назад/вперед (у вас на клавиатуре есть четыре клавиши со стрелками – выберите две из них). Эта функция нужна, чтобы заново прослушать последний фрагмент или перейти немного вперед.

Затем, вызвав эквалайзер, вы можете уменьшить значения «Скорость» и «Темп» – и увеличить значение «Питч». При этом Вы заметите, что скорость воспроизведения замедлится, но высота голоса (если хорошо подберете значение «Питч») – не изменится. Подберите эти два параметра так, чтобы вы практически синхронно успевали набирать текст, лишь изредка останавливая его.

Когда все будет настроено, набор будет занимать у вас меньше времени, и руки будут уставать меньше. Вы сможете расшифровывать аудиозапись спокойно и комфортно, практически не отрывая пальцев от набора текста на клавиатуре».

Могу только добавить к сказанному, что, если запись не очень качественная – вы можете попытаться улучшить ее воспроизведение, экспериментируя с другими настройками в «Менеджере звуковых эффектов» AIMP.

А количество секунд, на которое вам будет наиболее удобно перемещаться по записи назад или вперед с помощью горячих клавиш – установите в разделе «Плеер» окна «Настройки» (которое можно вызвать нажатием горячих клавиш «Ctrl + P»).

Желаю сэкономить побольше времени на рутинных задачах – и плодотворно использовать его для главных дел! 🙂 И не забудьте включить микрофон в списке записывающих устройств, когда соберетесь поговорить по скайпу! 😉

3 способа расшифровки диктофонной записи: распознавание речи, диктовка, ручной режим

Привет друзья. В данной статье я хочу рассказать про заработок на транскрибации. Освоив этот навык, за первые три дня (8 часов времени было потрачено на работу) я заработал 1440 рублей, что считаю совсем не плохо для новичка.

Что такое транскрибация и как на этом заработать

1. Что такое транскрибация

Транскрибация – это перевод аудио или видео в текст. Проигрывается аудио или видеофайл и вы набираете текстом то, о чем там говорят. Программы для качественного автоматического перевода еще не придумали, так что услуги транскрибаторов еще востребованы.

Какие файлы присылают, когда обращаются к транскрибаторам:

  • аудиоподкасты;
  • вебинары;
  • интервью;
  • телефонные разговоры;
  • и пр.

В дальнейшем эти материалы используются как статьи на блог/сайт, отчетность, создание платных/бесплатных материалов для маркетинга, письма в рассылку и пр.

Совет! По моему опыту, выгоднее всего брать в работу телефонные разговоры, так как много секунд уходит на телефонные гудки.

2. Какие расценки

В среднем стоимость перевода 1 минуты аудио в текст стоит 10 рублей. Получается один час аудио будет стоить 600 рублей . Но это среднее значение, цена может быть выше или ниже, в зависимости от того, как договоритесь с заказчиком.

Давайте немного посчитаем, если брать один часовой заказ в день, это 600 р./день. 600 р. х 30 дней = 18000 рублей в месяц. Конечно в реальности вы можете заработать меньше, можете и больше, но в общем это не плохая такая подработка!

Цена может быть больше, если:

  • Заказ срочный. Обычно время на выполнение исполнитель берет с запасом, чтобы сделать перевод в удобное для себя время, но бывает что заказчику нужно сделать «еще вчера» и приходится начинать выполнение незамедлительно, особенно если ночное время и приходится не спать. За такую срочность можно взять подороже.

Однажды на Work-zilla был наплыв заказчиков, все проходили обучение на каком-то тренинге и им срочно нужно было сделать транскрибацию, чтобы сдать отчет. Предложений было больше чем исполнителей, была уже ночь, мне хотелось спать, но заказы по 600 рублей за 20 минут аудио меня мотивировали работать до последнего) Но такое бывает не часто.

  • Плохое качество записи. Чем хуже слышно голос, тем больше времени вам придется расшифровывать запись, соответственно это может стоить больше.
  • Несколько голосов. Если на записи идет диалог и нужно в документе подписать каждого из участников.
  • Нужна редактура. Если после транскрибации вы еще можете отредактировать документ, убрать лишнее, выделить абзацы и правильно расставить пунктуацию, то вы сбережете время заказчика и это может дополнительно оплачиваться.
  • Другой язык. Если вы владеете не одним языком, то перевод текста например с английского на английский или с английского на русский будет намного дороже.

Цена может быть меньше, если:

  • Вы новичок и хотите взять первые заказы. Да, это хороший метод стартовать, я именно так и делал. Первый мой заказ был транскрибировать 40 минут записи за 200 рублей. Я сам предложил такую цену, чтобы начать зарабатывать первый рейтинг и это сработало. О том, как увеличить шанс получить заказ мы еще поговорим дальше.

Хотите зарабатывать большие деньги на написании крутых текстов? Пройдите курс «Копирайтинг с нуля» и освойте одну из самых востребованных профессий - ссылка на курс (первые 3 занятия бесплано)

3. Сколько времени на это нужно и как транскрибировать в 3 раза быстрее?

В начале на один час аудио тратится примерно 8 часов реального времени, с опытом можно сократить до 3 часов.

Время обработки записи на прямую зависит от скорости вашей печати на клавиатуре и использовании дополнительных программ. Если с первым вариантом все понятно, чем быстрее вы печатаете тем лучше и этот навык будет развиваться с каждой сделанной вами расшифровкой, то на втором факторе давайте остановимся подробнее.

Я начинал расшифровку просто слушая запись в проигрывателе и набирал текст в Ворд. Это очень не удобно, потому что нужно:

  1. прослушать 3-5 секунды записи
  2. мышкой поставить паузу
  3. мышкой переключить окно с плеера на документ
  4. написать три-пять слова
  5. опять мышкой переключиться на окно с проигрывателем
  6. и повторить все заново

Когда я нашел специальный плеер для транскрибации, время обработки сократилось в 3 раза.

4. Программа для транскрибации аудио в текст — Express Scribe

Чтобы быстрее транскрибировать, есть крутая программа Express Scribe, она бесплатная. Скачать ее можете с официального сайта .

Функции программы Express Scribe:

  • прослушивание файла и набор текста происходит в одном окне программы, не нужно переключаться между окнами;
  • возможность использовать горячие клавиши для Stop и Play;
  • умеет замедлять или увеличивать скорость проигрываемого файла;
  • удобная функция перемотки, если не поняли фразу, можно быстро горячими клавишами перемотать на несколько секунд;

Видео по работе с программой Express Scribe. Видео записал еще в 2015 году, но информация там еще актуальна.

5. Плюсы и минусы заработка на транскрибации

Плюсы:

  • Изучаете метод слепой печати. Тут без комментариев, больше пишите, быстрее начинаете печатать.

Так получилось что я начал подрабатывать этим методом в первом путешествии по Тайланду, там сломался наш ноутбук, мы купили новый с клавиатурой на Английском/Тайском языке. Мне хочешь-не хочешь пришлось изучать метод слепой печати))

  • Улучшаете свою грамотность. Круто прокачивается пунктуация и орфография.
  • Развиваете память. С каждым разом вы начнете запоминать все больше слов и предложений за один интервал.
  • Обучение. Часто вам присылают на расшифровку интересные выступления или лекции, которые вам могут быть полезны, но вы еще и деньги за это получите. Двойная выгода!

Минусы:

  • Уходит много времени. И это правда, особо не оптимизируешь процесс.
  • Не большие деньги. В целом, если сравнивать с другими профессиями во фрилансе, здесь ценник один из самых маленьких, но это и понятно, потому что не нужно специальных навыков.

6. Где брать заказы

Специальной биржи транскрибации пока что не придумали, поэтому обратимся к общим фриланс биржам. Я перепробовал много вариантов, самые лучшие, где больше всего заказов, это Work-zilla и Кwork . Давайте вкратце разберем каждый вариант.


Work-zilla . Я брал заказы только здесь, потому что вторая биржа не была еще настолько популярна. Чтобы начать брать задания в работу вы должны после регистрации пройти тест и оплатить подписку, 100 р. (30 дней), 250 р. (90 дней), 400 р. (10 дней). Не переживайте, это не обман, как я понимаю, такие меры это некий фильтр, чтобы отсеять некачественных исполнителей. 100 рублей вы отобьете уже с первого заказа. На других биржах плата намного выше и заказ взять труднее.


Kwork . Здесь принцип работы устроен по другому. Если на Ворк-зилле заказчики делают заказ и вы отправляете на него заявку, то здесь вы создаете кворк (свое предложение) и уже заказчики, заходя на сайт, предлагают вам свою работу. На этой бирже ничего платить не нужно, просто регистрируетесь и размещаете кворки.

Зайдите на оба сайта и сами посмотрите как все выглядит изнутри.

7. Где найти транскрибатора

  • посмотреть профиль исполнителя, отзывы;
  • уточнять все детали перед тем как отдать в работу файл;
  • если изначально исполнитель вам покажется неадекватным, лучше сразу с таким не работайте, сбережете время и нервы;
  • можете попросить примеры работ. Понятно что текст можно откуда-то скопировать и выдать за свою работу, но если в итоге вам сделают некачественно и с ошибками, вы сможете лучше отстаивать свои права и не заплатить за некачественную работу, если покажете что исполнитель обещал и что вы получили по итогу.

8. 5 фишек, чтобы получать больше заказов

1. Первый заказ можете взять и не очень дорогой. Главное выполнить первое задание, чтобы ваш рейтинг поднялся и не был нулевым. Заказчики на него тоже смотрят.

2. В профиле, в дополнительной информации, пропишите, что вы занимаетесь транскрибацией и имеете опыт. Потому что заказчики чаще всего смотрят профили кандидатов, и это нужно для того, чтобы они понимали, что вы не просто так в первый раз решили этим заняться, а имеете уже какой-то опыт.

3. После сдачи заказа пробуйте договориться на дальнейшее сотрудничество. Работать с постоянными клиентами проще, чем каждый раз искать новых. Это проще и заказчикам, т.к. адекватного исполнителя тоже не просто найти.

4. Чтобы к вам еще обращались и ставили плюсик за задание, нужно не косячить. А чтобы не косячить перед подтверждением задания обговорите все детали с заказчиком. Обговорить нужно такие моменты, как:

Так же несколько раз перечитайте требования заказчика, чтобы понять и сделать, так как ему нужно.

5. Самый важный пункт! Пишите оригинальные комментарии к заявке. Пока я его не начал соблюдать, у меня вообще не было заказов.

Когда берете заказ можно оставлять комментарий для заказчика, и большинство фрилансеров, в том числе и я по началу писал: «Готов выполнить» , «Предлагаю свою кандидатуру» и другие шаблонные фразы в таком ключе. И не мог понять, почему написал 15-ти заказчикам и все игнорируют.

Потом просто начал писать оригинальнее, и заказы начали мне отдавать, хотя рейтинг был ниже чем у других исполнителей.

И еще много чего можно придумать, включайте фантазию и оригинальность!

Нужно понимать, что главное заказчикам это экономия времени и высокое качество, на это и делайте упор.

Давайте подведем итог:

  1. Транскрибация на данный момент, востребованная деятельность на фрилансе, которая не требует каких-либо специальных знаний.
  2. Используйте программу Express Scribe, чтобы транскрибировать в 3 раза быстрее.
  3. На один час записи уходит порядка 4-6 часов реального времени, так что рассчитывайте время правильно.
  4. Один час записи переведенной в текст стоит в среднем 600 рублей.
  5. Чтобы получать больше заказов используйте фишки из последней главы.

Дополнение спустя 1,5 года после публикации первой версии статьи:

Прошло 1,5 года с момента написания данной статьи. Все это время я работал удаленно, в основном на Work-zilla . Вот скрин с моего аккаунта. Выполнено более 100 проектов.

Недавно передо мной встала задача: Перевести аудио и видео файлы в текст. Так как я никогда не занимался этим вопросом, то как всегда — залез в интернет и начал гуглить как же люди это делают. Ведь ни для кого ни секрет, что транскрибацией/транскрибированием занимаются многие люди и даже профессиональные компании, которые построили на этом бизнес.

Википедия нам выдает: Действие по записи транскрипции называется транскрибированием.

В каком то смысле передача звука и написание его это та же транскрипция, но нас здесь интересует не что такое транскрибирование, а как этим пользоваться в практических целях.

Для чего может понадобиться транскрибирование в печатный текст

Допустим у вас есть аудио запись семинара или аудиокнига, которую вы хотите сохранить в текстовом виде для более удобного поиска информации. Ведь в тексте всегда можно воспользоваться поиском и текст занимает значительно меньше места, чем аудио и видео.

У вас есть несколько путей:

  • обратиться в компанию и заплатить примерно 16 руб за минуту файла;
  • найти фрилансера, который вам все это сделает дешевле;
  • сделать самому вручную, прослушивая и печатая;
  • сделать самому, прослушивая и надиктовывая;
  • сделать самому с помощью специальных программ.

Так как делегировать другому вы не захотели, а оказались на этой странице, то я могу сделать вывод, что вам интересно подробно разобраться в процессе и сделать все самому. Каждый знает, что если хочешь сделать хорошо, сделай это сам.

Кстати, если вы все же выберете надиктовывать текст голосом, то в этой статье я как раз дам ответ как это лучше всего делать.

Какие способы существуют и какой лучше выбрать

Программные средства транскрибирования онлайн

Virtual Audio Cable

Я перерыл интернет и везде в основном советуют воспользоваться программой Virtual Audio Cable (инструкция как ей пользоваться ниже)

А что же предлагает нам данная программа и почему ее советуют? Ну вот представьте, что для того, чтобы голос был распознан, вам нужно сначала его воспроизвести, а потом в реальном времени передать в специальные транскрибаторы, которые и преобразуют звук в текст. Так вот если вы начнете включать звук через колонки и пытаться его передавать через микрофон, то будут огромные потери в качестве, так как у вас в комнате присутствуют шумы, вам нужно включать колонки на большую громкость. Микрофон может быть не самым лучшим. В итоге вы получите низкое качество из-за всех этих искажений. Качество будет идеальным, если вы сможете передать напрямую аудио или видео прямо в компьютере в транскрибатор. Как раз для этой цели и нужна программа Virtual Audio Cable.

Смысл ее работы в том, что она создает виртуальный кабель, с помощью которого, напрямую передает данные. Что нам и нужно!

Я попробовал сделать так как говорится в самом ролике и у меня получилось скачать программу, установить ее и сделать необходимые настройки. При включении всех настроек я понял, что у меня идет жуткое эхо и я целый час пытался разобраться почему у меня выдается дополнительный аудио канал.

Как сделать эмуляцию виртуального кабеля без программок

Сразу здесь выложу инструкцию как это сделать. Вам даже не потребуется устанавливать Virtual Audio Cable, так как можно обойтись простыми манипуляциями в настройках громкости. Сам я попробовал и мне понравилось, поэтому остановился на этом способе, так как он самый простой.

Нужно в настройках звука во вкладке запись включить стерео микшер и сделать его устройством записи по умолчанию. Таким образом звук сразу будет передаваться в компьютер и все так же останется воспроизведение через колонки. То есть вы сможете спокойненько слушать ваш файл и работать с ним. В видео много рассказывается о работе с сервисом «Блокнот для речевого ввода», о котором речь пойдет далее. Смотрите и обучайтесь.

Speechpad «Блокнот для речевого ввода» — сервис для надиктовки (транскрибирования текста)

Очень сильно хвалят вот этот сайт speechpad.ru так как он хорошо поддерживается, в нем есть все необходимые настройки.

В принципе разобраться с ним сможет любой за 10 минут, тем более, что там есть много инструкций. Хочу сказать свое мнение — мне он не подошел, так как когда идет транскрибация видео ролика, то существует буфер. Он длится примерно 20-30 секунд и видеоролик как бы перезагружается по истечение этого времени. И все было бы прекрасно, если бы перезагружаясь, ролик начинался с того места, на котором закончился, но он загружается на 1-2 секунды раньше и происходит повторение слов. Возможно это и не плохо, так как при перезагрузке может оборваться часть фразы, а потом она повторится и пойдет логично дальше, но для редактирования это ужасно неудобно. Нужно удалять повторы слов каждые 20 секунд и это отнимает много времени. Еще мне не понравилось качество. Конечно, в 95% сервис понимает речь, но вот эти 5% ошибок исправлять ой как не хочется. Порой даже не понимаешь что за слова он вставляет и откуда он их берет. Еще один минус в том, что если не успел сохранить текст или страница случайно перезагрузилась, то можно потерять весь результат, а если текст длинный, то придется начинать сначала и это ооочень раздражает.

В целом очень хороший сервис, многие пользуются и многие остаются довольны, особенно если речь четкая, так вообще никаких проблем не будет. Сервис бесплатный и внутри есть много инструментов, думаю, что вам понравится. Я попробовал этот сервис и продолжил искать дальше, более удобный инструмент.

Realspeaker — программа для транскрибирования и расшифровки

Нашел еще такую программу realspeaker почитал что о ней пишут, и подумал, что это скорее для тех, кто профессионально надиктовывает тексты. Программа для перевода звука в текст пригодится, если вы работаете транскрибатором и зарабатываете на этом.

Что она умеет:

  • Голос в текст может обработать любой длины;
  • Транскрибирует аудио и видео в текст;
  • Большой объем данных и глубокое обучение;
  • Облачные вычисления и API по запросу;
  • Ввод данных в любой редактор или сайт;
  • Мульти-платформенность и мультиязычность;
  • Расшифровка с учетом акцентов и диалектов;
  • Простая и доступная система оплаты.

Из всего этого перечня следует, что если вы зарабатываете на текстах, то она вам возможно поможет. Ну а для меня она не подходит, так как платная и я пошел искать дальше.

Google Translate — просто переводчик и не только

Этого монстра знают если не все, то почти все! Находится он по адресу translate.google.ru . Все очень просто, заходите на сайт, нажимаете на микрофон и запись и мгновенная транскрибация пошла. Далее можно просто копировать и вставлять куда нужно. Вот такой вот переводчик на английский или переводчик звука в текст.

Как известно Гугл — очень хорош. Это компания, которая постоянно совершенствует свои технологии в создании интернет-поиска, облачных вычислений и дополнительные сервисы. Совсем недавно они анонсировали сервис по переводу голоса в текст, а сегодня он уже является самым популярным. Почему? Потому что все телефоны — андроиды начали использовать голосовые команды и вообще это очень удобно. А гугл изначально уже встроен во телефоны.

И вот еще почему, потому, что гугл делает свои продукты на высоком уровне. Что все это значит? Да то, что при нажатии на одну кнопку вы получаете максимально продуманный и качественный сервис без лишнего мусора. Гугл вложил огромные деньги в свои распознаватели голоса и вывел свой продукт на мировой рынок, и теперь на всех языках (в том числе русский язык) можно транскрибировать свой голос и переводить в любой другой язык.

В общем Google Translate наиболее качественно захватывает речь из звука и этим уже можно пользоваться, расставив знаки препинания. Пользуйтесь на здоровье, к хорошему быстро привыкаешь.

Из минусов могу отметить, что на данный момент можно записывать текстовый документ только 5000 символов длиной. Если вам необходимо надиктовать или распознать несколько предложений, то вам этот инструмент подойдет из-за своей простоты. Но если у вас более длинные тексты и вы хотите иметь возможность с Гугловской точностью транскрибировать текст любой длины то вам больше подойдет следующий инструмент.

Google Docs — самый универсальный инструмент перевода звука в текст онлайн

Почему этот инструмент лучше? Это же просто онлайн документ. Или не просто?


Вся фишка в том что он:

  • позволяет сохранять текст моментально и он никуда не исчезнет;
  • может записывать бесконечно, хоть на ночь поставьте аудиокнигу, на утро проснетесь и все будет ок;
  • использует голосовой модуль google, а он хорош (про это уже говорилось выше);
  • позволяет прямо там отредактировать и сохранить;
  • работает онлайн на любых устройствах.

В связи со всем вышеперечисленным, на мой взгляд это самый адекватный и удобный инструмент, который можно использовать для транскрибации звука в текст.

Как им пользоваться?

  1. Заходите в docs.google.com
  2. перед вами открывается список документов
  3. создаете новый документ
  4. жмете инструменты -> голосовой ввод или Ctrl+Shift+S
  5. нажимаете на микрофон

Всё! Транскрибация аудио в текст пошла! Из всех инструментов мне этот понравился больше всего. Никаких отвлекающих штуковин, там просто и понятно.

Чтобы сделать перевод в текст аудио файла или видео с youtube, просто сначала запустите файл, а потом перейдите в окошко документа и нажмите запись. Ждите и смотрите, как на ваших глазах происходит чудо. Потом останется отредактировать и оформить и текст готов!

Чтобы добавить в текст знаки препинания, используйте эти команды:

  • «точка»;
  • «запятая»;
  • «восклицательный знак»;
  • «вопросительный знак»;
  • «новая строка»;
  • «новый абзац».

Примечание. Ввод знаков препинания поддерживается на английском, испанском, итальянском, немецком, русском и французском языках.

Как и чем пользоваться если нужно надиктовывать голосом?

Рассмотренные выше варианты программных средств абсолютно так же подойдут для голосового ввода. Единственное отличие будет в том, что нужно будет вместо микшера использовать запись через микрофон.

  • Можно просто надиктовывать свои мысли, чтобы не терять времени на писанину и потом быстренько отформатировать;
  • Можно надеть наушники и слушая, воспроизводить так как вам больше нравится в микрофон;
  • Можно пользоваться специальными приложениями на телефоне.

Нужно надиктовать быстро, а под рукой только мобильный телефон?

Если у вас iPhone

Можете скачать бесплатно приложение Dragon Dictation

Очень удобно, когда нет под рукой компьютера и вам в голову пришли мысли, которые кровь из носа нужно записать, иначе пройдет 2 минуты и вы забудете, что хотели сказать. К сожалению это бывает очень часто и как хорошо, что мы теперь можем носить сотик вездеи с легкостью перевести голос в текст. Пришла мысль — запиши аудио. Это быстро и удобно.

Если у вас Android

Можете скачать бесплатно приложение Speechlogger

Хорошее приложение, которое поможет андроид-манам. Если вы журналист, домохозяйка, писатель и просто развивающийся человек, то обязательно используйте дополнительные возможности, чтобы сократить время и не забыть самое важное, пользуйтесь мобильными приложениями для записи текста голосом.

Кстати там еще можно знаки препинания расставлять, что облегчит дальнейшее редактирование. Все приложения отлично понимают русский язык.

Выводы:

  • Для того, чтобы передавать звук в компьютер лучше всего пользоваться настройками windows и встроенным микшером.
  • Для того, чтобы транскрибировать более качественно лучше всего пользоваться Google Docs с включенной настройкой голосовой ввод.
  • Для того, чтобы делать переведение с мобильника — скачайте приложения

Хорошей вам транскрибации, надеюсь вам поможет мой опыт. Кстати, напишите в комментариях, что вы об этом думаете, какие средства сами используете. Может есть еще лучше способ затранскрибировать и если вы о нем знаете, то обязательно расскажите, чтобы помочь тем, кто ищет решение этого вопроса.