Включение и выключение автоматического распознавания речи. Руководство по распознованию речи в Windows

В этом документе описывается предварительная версия программного обеспечения Microsoft® Windows Vista™.

Сведения, содержащиеся в документе, отражают позицию корпорации Майкрософт в отношении обсуждаемых вопросов на момент публикации. Поскольку корпорация Майкрософт должна реагировать на изменение рыночных условий, данный документ не может рассматриваться как обязательство с ее стороны, и корпорация Майкрософт не гарантирует точности представленных сведений. Данный документ носит исключительно информационный характер. КОРПОРАЦИЯ МАЙКРОСОФТ НЕ ПРЕДОСТАВЛЯЕТ В ДАННОМ ДОКУМЕНТЕ НИКАКИХ ГАРАНТИЙ, ЯВНЫХ ИЛИ ПОДРАЗУМЕВАЕМЫХ.

Аннотация

С помощью средств распознавания речи в операционной системе Microsoft® Windows Vista™ можно диктовать сообщения электронной почты и документы, а также использовать голосовые команды для управления работой программ и отображением веб-страниц. Точность распознавания мирового уровня, адаптация программы к произношению пользователя и используемой лексике заметно ускоряют создание документов. Новейшие средства речевого управления в Windows Vista помогает пользователю освоить речевой ввод быстрее, чем когда бы то ни было. Данное руководство содержит системные требования, инструкции по установке и пошаговое руководство к использованию средств распознавания речи в Windows Vista.

Пошаговое руководство по использованию средств распознавания речи в Windows Vista

Средства распознавания речи в Windows Vista являются результатом новейших разработок в этой области. С помощью средств распознавания речи можно диктовать сообщения электронной почты и документы, а также пользоваться голосовыми командами для управления работой программ и отображением веб-страниц. Средства распознавания речи в Windows Vista позволяют ускорить работу, а также снизить риск возникновения травм от постоянного напряжения. Усовершенствованная реализация средств распознавания речи в Windows Vista предоставляет пользователю широкие возможности управления и позволяет освоить голосовой ввод быстрее, чем это было возможно раньше.

Что такое распознавание речи

Технология распознавания речи позволяет взаимодействовать с компьютером с помощью голоса. Программа определяет, следует ли интерпретировать произносимые слова как текст (например, создаваемого документа или сообщения электронной почты) либо как команду, требующую выполнения определенного действия.

Новые возможности средств распознавания речи в Windows Vista

Средства распознавания речи в Windows Vista ориентированы не только на обеспечение наивысшей точности распознавания, но и на формирование наиболее удобного пользователю механизма взаимодействия с компьютером. Сделана попытка устранить основные проблемы и неудобства, с которыми сталкиваются пользователи существующих продуктов аналогичного назначения. Эффективность выполнения работы с помощью средств распознавания речи в Windows Vista сочетается с удовольствием от их применения. Это достигается благодаря таким особенностям, как:

    Сокращенный период обучения системы, позволяющий сразу начинать работу;

    Обновленный пользовательский интерфейс предоставляет простые, но эффективные способы диктовки и редактирования текста, а также исправления ошибок;

    Интерактивный курс обучения работе со средствами распознавания речи, в процессе которого компьютер адаптируется к особенностям голоса и произношения пользователя;

    Значительное повышение точности распознавания речи благодаря самообучению системы в процессе работы с ней;

    Новые средства управления, предоставляющие пользователю полный контроль над приложениями;

    Усовершенствованные средства интерпретации. Если озвученная команда не может быть истолкована однозначно, система запросит уточнение действия к выполнению.

Кому будет полезно использование средств распознавания речи

Данное руководство предназначено для следующих категорий пользователей:

    Планировщиков ИТ-отделов и отделов управления персоналом, работающих со вспомогательными технологиями для работников с травмами от постоянного напряжения, ограничениями подвижности или ослабленным зрением.

    ИТ-специалистов, выполняющих планирование для обучающих отделов.

    Ранних пользователей продукта.

Примечание переводчика. Средства распознавания речи доступны только в английской версии Windows Vista. Для их использования необходимо знание английского языка.

Средства распознавания речи в первую очередь ориентированы на запросы пользователей, работающих преимущественно с электронной почтой, текстовыми редакторами и браузерами.

Использование средств распознавания речи Windows Vista будет наименее эффективным для следующих категорий пользователей:

    Пользователей, работающих с текстами не на естественных языках (программистов, составителей электронных таблиц, системные администраторы).

    Пользователей, которым нужна программа, сочетающая в себе функции экранного диктора и средств распознавания речи.

Преимущества использования средств распознавания речи

С помощью средств распознавания речи пользователи могут:

    Значительно сократить использование клавиатуры и мыши, выполняя задачи с помощью голосовых команд.

    Полностью создавать документы, пользуясь только речью.

    Управлять компьютером, в том числе запускать приложения и переключаться между ними, а также осуществлять выбор пунктов меню и нажатие кнопок.

Основные варианты использования средств распознавания речи

В данном руководстве рассматривается простой пример диктовки документа и выполнения голосовых команд.

В Speech Tutorial, входящем в состав Windows Vista, содержится больше примеров, которые можно изучить в случае необходимости.

Необходимые условия

Для выполнения этой задачи необходимо:

    Использование качественного микрофона, например:

    • Гарнитуры, подключаемой через порт USB

      Микрофона с технологией Array microphone

    Завершение интерактивного курса обучения работе со средствами распознавания речи. Это позволит компьютеру получить базовую информацию для точного распознавания речи пользователя, а пользователю познакомиться с голосовыми командами, необходимыми для выполнения различных задач.

Диктовка документа

Одной из задач, наиболее часто выполняемых с помощью средств распознавания речи, является диктовка документа. Выполнение этой задачи проходит в три этапа:

    Открытие текстового редактора

    Диктовка текста документа

    Сохранение документа

Последовательность действий при диктовке документа

Пройдите полностью курс обучения Speech Tutorial

Создание, диктовка и сохранение документа

Известные проблемы
Диктовка

При работе с распознаванием речи необходимо учитывать следующие особенности.

    Диктовка при работе с распознаванием речи работает только с ограниченным набором приложений, поддерживающих технологию Text Services Framework. К этим приложениям относятся:

    • Microsoft Word и Outlook

      Практически все приложения, входящие в состав Windows Vista.

    Распознавание речи при диктовке не будет работать в некоторых приложениях, в том числе:

    • Microsoft PowerPoint

Неточное распознавание речевых команд

Наиболее вероятной причиной возникновения проблем при управлении компьютером с помощью речи являются не ошибки компьютера в распознавании слов, а произнесение неверных команд.

Обратитесь к Speech Reference Card, чтобы увидеть список доступных команд. Speech Reference Card открывается после щелчка правой кнопкой мыши по панели управления микрофоном.

Отчеты об ошибках и обратная связь

Чтобы отправить отчет об ошибке, воспользуйтесь инструкциями на веб-странице Microsoft Beta Web site. Мы также ждем предложений о полезных функциях и заинтересованы в обратной связи с пользователями средств распознавания речи.

Запросы дополнительной поддержки при использовании средств распознавания речи направляйте непосредственно в службу поддержки средств распознавания речи, по электронному адресу [email protected].

Дополнительные ресурсы

Бета-тестеры, участвующие в программе технологической адаптации (Technology Adoption Program, TAP), могут также обращаться за поддержкой к прикрепленному участнику команды разработчиков корпорации Microsoft.

И Windows 7 64 и SpeechPlatformRuntime для 64 установил. В поле поиска введите текст распознавание речи, а затем нажмите клавишу или выберите пункт Распознавание речи Windows. У меня Windows 7 x64. В панели задач все установилось (и русский голос, и распознавание речи),а в программе “Балаболка” нет в списке русского языка (настройки>голос). Панель Поиск также можно открыть при помощи клавиатуры, нажав клавиши с логотипом Windows+Q.

Голосовые файлы используют множество программ – читалки, говорилки, синтезаторы речи и т. п. программы. Парень, который платил за проезд, кричит в ответ: Это я так ДАЛ, за себя и за девушку! При выполнении команды комп также скажет, какого он пола. И в заключение ещё пару слов о голосовых файлах.

Для того, чтобы диктовать текст с помощью распознавания речи Windows 8.1

Начнем с распознавания речи. Как утверждают психологи, восприятие речи-одно из самых загадочных проявлений человеческого интеллекта. Совершенно непонятно, каким образом дети учатся понимать устную речь и говорить. Задача машинного распознавания речи привлекает внимание специалистов в области computer science уже очень давно. Тем не менее, продвинуться в этом направлении пока удалось относительно недалеко.

Во-первых, человек обычно не делает паузы между словами, а при слитном произнесении к задаче распознавания прибавляется еще и задача выделения слов из потока речи, что заведомо более сложно. Именно из-за этих и многих других проблем до полного решения задачи распознавания речи по-прежнему весьма далеко. Существует два существенно различающихся режима работы: с настройкой на голос определенного человека и без такой настройки.

Процедура настройки на голос выглядит следующим образом: человек читает некий специальным образом составленный текст, компьютер распознает слова и выдает вариант распознавания человеку. Это наводит на мысль использовать рисунок речи человека для построения различных охранных систем.

Использование распознавания речи

Как обучить компьютер распознаванию речи

Например, стандартная плата распознавания речи VR/160, выпускаемая Dialogic, может «обслужить» до 16 каналов одновременно, а возможности VRSoft ограничены четырьмя каналами. В компьютерной телефонии применяются все три режима распознавания речи. Распознавание речи с настройкой на голос используется в различных системах, имеющих конкретного хозяина (хозяев).

Разработка →Поиск оптимальной системы аудио распознавания речи с закрытым исходным кодом, но имеющими открытые API, для возможности интеграции

Защитные голосовые системы, в которых интонационный рисунок речи используется как пароль, применяются для защиты от несанкционированного доступа к данным. Эти словари построены также для многих языков — от английского (с разными акцентами) до иврита и японского, однако с русским языком работать в таком режиме пока нельзя.

Словари для распознавания слитной речи имеются только для небольшого количества языков — английского, французского, немецкого, испанского, корейского и еще нескольких. Другой пример системы, работающей с распознаванием речи на русском языке — система подбора кадров, продукт компании Артикс.

Перевод аудио в текст

Произнесенный номер распознается системой и заносится в базу данных. Обратная операция по отношению к распознаванию речи — преобразование текст-речь. Так называется технология, позволяющая генерировать речь по тексту. В качестве аппаратной базы для реализации подобных систем можно применять любую компьютерную аппаратуру для воспроизведения оцифрованной речи. В частности, для этого подойдет и Sound Blaster.

Русский голос для Windows

В последнее время, однако, все большее распространение получают программы, основанные на гораздо более мощной и универсальной технике синтеза голосовых сообщений по произвольному тексту. В настоящее время существуют два принципиально различных способа смоделировать человеческую речь. Первый из них предполагает моделирование собственно голосового сигнала. Во-вторых (что, наверное, еще сложнее) надо «снабдить» искусственную речь естественными интонациями и ударениями в словах.

Как включить Cortana на Windows 10 в России

Разумеется, эта система работает только с английским языком. Кроме того, поскольку речь идет о связи через Internet, в разговоре неизбежно возникают паузы продолжительностью в доли секунды — примерно как при использовании спутникового телефона.

Поле Уровень распознавания отображает качество распознавания речи или вид ошибки, если она возникла. Прежде чем можно будет использовать распознавание речи, вы должны выполнить несколько действий.

Перед настройкой распознавания речи, убедитесь, что микрофон подключен к компьютеру. Функция распознавания речи используется специальный профиль, чтобы распознать Ваш голос и голосовые команды. Чем чаще вы используете распознавания речи, тем более детальным становится Ваш профиль голосовых команд, благодаря чему компьютер лучше Вас понимает. Следуйте инструкциям, появляющимся в процессе обучения распознаванию голоса.

Чтобы добавить или изменить слова в Словаре

Эта функция позволяет убедиться, что Ваша команда распознана системой и готова для выполнения. Библиотека распознавания голосовых команд VoiceCom составляет ядро описанных выше программ VoiceNavigator и Truffaldino. При этом связь текста и речи устанавливается автоматически. И хотя они не позволяют выполнять эту работу без клавиатуры и мыши, все же их применение может ускорить набор текста, особенно для людей с ограниченными возможностями.

Система будет выполнять распознавание в фоновом режиме. Можно выделить фрагменты текста и голосом. Другие примеры Вы найдете в документации к пакету MicrosoftOfficeXP и в справочной системе. Это компьютерный транскрайбер, а также системы Нестор и Аллегро. Evernote не преобразует аудиозаписи в текст и не позволяет искать аудиозаметки по словам записи. Самые современные устройства поддерживают преобразование речи в текст, если вы включите эту функцию.

Благодаря распознаванию речи в Windows использование клавиатуры и мыши не является обязательным. В пункте распознавания языка выберите английский. Средства распознавания речи, поставляющиеся в составе MicrosoftOfficeXP, можно использовать со всеми приложениями пакета, такими как MicrosoftWord, MicrosoftExcel и т.д. Именно эту технику, как правило, и имеют в виду, говоря о преобразовании текст-речь.

Операционная система Windows 7 оснащена многими опциями, которые дают все больше возможностей пользователям данной системы. В нее смогли внедрить весьма интересную функцию, которая носит название «распознование речи». Но что представляет собой данная система? Об этом и пойдет разговор.

Опция, о которой идет речь, позволяет применять в приложениях всей системы абсолютно новый способ взаимодействия пользователя с компьютером. Именно система «Распознавание речи Windows 7» допускает возможность управления компьютером, не используя при этом клавиатуру, мышь и другие средства.

Хочется отметить, что данная инновация будет доступна и в других продуктах Microsoft. Эта функция была замечена немного ранее, то есть ее попытались внедрить в Windows Vista, но в седьмой версии операционной системы компании Microsoft голосовое управление выполнено на более высоком уровне по сравнению с предшественником. Если сказать проще, такая опция, как распознавание речи Windows 7 стала еще более функциональной.

Кроме всего сказанного, хочется отметить, что она имеет довольно широкий спектр применения. Пользователи Windows 7 с функцией распознания речи имеют возможность запускать программы и конвертировать все звуковые фрагменты в текст, выполнять всевозможные команды на компьютере, используя всего лишь свой голос и необходимые приспособления. Но что же нужно для того, чтобы распознавание речи Windows 7 стало реальным?

В первую очередь, вам понадобится микрофон, который следует подключить к компьютеру. Кроме этого, необходимо приобрести специальное приложение или программу, которая издается самим производителем, то есть компанией Microsoft. После того как все необходимые компоненты будут установлены, а микрофон подключен к компьютеру, следует осуществить еще определенный план работы:

  • Необходимо выполнить тестовые голосовые команды и конвертировать их в текст.
  • После того как вы проведете обучение программы распознания, нужно будет создать шаблоны разных команд своим голосом. Именно на основе данной работы компьютер сможет принимать и выполнять все заданные вами команды.

Функция распознавание речи Windows 7 используется в текстовом редакторе компании Microsoft - WordPad. Она безотказно функционирует при заполнении различных форм, а также хорошо себя проявляет в работе в Internet Explorer и при

Кроме этого, данная опция без труда отредактирует записанный ранее текст, определив специальные голосовые команды. Конечно, в процессе распознавания той или иной задачи случаются типичные ошибки (когда происходит ошибочное распознавание некоторых звуков). На этот случай в программе предусмотрен список соответствий тех или иных слов.

Функция, конечно, феноменальная, но все же здесь есть одно «но». Все дело в том, что распознавание русской речи сейчас, в принципе, недоступно. Имеются отличные версии программы для английского, французского, немецкого и японского языка. Существуют также версии для китайской, испанской и итальянской речи.

Но вот данная новинка не совсем адаптирована для русской речи. Ваш компьютер не сможет воспринимать поставленные перед ним задачи, а значит, вам будет проще написать что-то при помощи клавиатуры или же выполнить определенные задачи с помощью мыши.

Конечно, вы можете попробовать поработать с подобными русскоязычными программами или же отдать свое предпочтение английскому языку, но все же остается надеяться, что в скором времени распознавание речи на русском языке тоже будет доступно в качественном режиме. И именно тогда вы сможете опробовать на практике такую уникальную функцию. Ведь она, без сомнения, явно упрощает работу на персональном компьютере и является огромным прорывом в сфере программирования. Так что остается лишь ждать.

Управление с помощью сенсорного экрана - это уже стандарт. Новейшие системы, такие как Windows 8 «понимают» голосовые команды.Распознавание речи должно привести к тому, что наша связь с компьютером будет еще проще, интуитивнее и… естественнее. Я расскажу как это выглядит на сегодняшний момент.

НЕМНОГО ИСТОРИИ - КАК РАЗВИВАЛОСЬ ОБЩЕНИЕ С МАШИНОЙ

Способы общения с компьютером развивались на протяжении многих лет. Первым интерфейсом, через который человек мог давать команды были перфокарты, которые восходят к 1832 году. Они использовались в машинах для производства ткани. Клавиатуру же начали использовать в 1960 году. Два десятилетия спустя присоединилась стандартная мышь и используется по сей день. Хотя мышь поделилась полномочиями с трекпадом, но она все еще самый популярный вид управления. Благодаря смарфонам и планшетам стал очень популярным сенсорный интерфейс и жесты, которые используются, в частности,для управление Xbox 360 Kinect. После сенсорных экранов и жестов, идет голосовое управление, но это решение до сих пор было так слаборазвито, что порой о ней и не услышишь.

НАСТРОЙКА РАСПОЗНАВАНИЯ РЕЧИ В WINDOWS 8

К сожалению, голосовое управление пока не доступно на русском языке. Поддерживаются пока английский, французский, немецкий, японский, корейский, китайсий и испанский языки. Microsoft решила сосредоточиться на крупнейших и наиболее развитых странах, но не исключено, что в течение некоторого времени он добавит эту функции и для нашей страны. Если попробовать запустить, вот так ругается

Если вы все еще хотите протестировать это решение, необходимо настроить систему(изменить язык) и выучить пару слов на английском. Чтобы сделать это, необходимо перейти в панель управления, и выбрать пункт Язык. Если у вас нет другого языка, кроме русского, необходимо нажать кнопку «Добавить язык», а затем выбрать один из поддерживаемых языков. В нашем случае это «Английский (США)». Видим, что доступна только раскладка на этом языке, два раза кликаем, пойдет проверка доступности языка для интерфейса, после проверки нажимаем «Загрузить и установить языковой пакет», и пойдет процесс, терпеливо ждем когда загрузится. Как только этот процесс завершится, установите английский языком по умолчанию

Теперь нужно перейти на начальный экран Windows 8 (плиточный), в поиск ввести «Windows Speech Recognition» и нажать Enter.

Таким образом, вы можете запустить инструмент распознавания голоса. При первом запуске он предложит настроить микрофон, после выбора, что нибудь скажите, чтобы проверить.

Далее предложить пройти обучающие уроки. Они длятся до 15-20 минут, но очень полезны и содержат основные сведения об использовании функций. Но если вы в английском не сильны, я думаю не стоит тратить время, трудно будет что-либо разобрать, сразу в бой

КАК РАБОТАТЬ

Для того чтобы компьютер начал распознавать вашу речь необходимо сказать «start listening» (что означает начать слушать), или нажмите кнопку микрофона для запуска режима прослушивания. Теперь можно открыть приложение или просто диктовать слова в текстовый редактор, строку браузера или поиска

ЧТО МЫ МОЖЕМ ДЕЛАТЬ

В принципе возможности огромны, кроме стандартных слов можно создавать свои команды. Основные возможности приведены в таблице

Действие Что сказать
Выберите любой элемент по его имени Click File,Start,View
Выберите любой элемент или значок Click Recycle Bin,Click Computer,Click(название файла)
Дважды нажмите или дважды щелкните любой элемент Double-clickRecycle Bin,Double-click Computer
Переключение между открытыми приложениями Switch to Paint,Switch to WordPad

Прокрутка

Scroll up; Scroll down;
Scroll left; Scroll right

Включить новый пункт или новую строку в документе

New paragraph; New line

Выберите слово в документе

Корректировка слова

Correct word

Выберите и удалите определенные слова

Показать перечень применимых команд

Refresh speech commands

Включите режим прослушивания

Отключите режим прослушивания

Свернуть микрофон

Minimize speech recognition

Посмотреть Windows, справки и поддержку

How do I do something?
Например:How do I install a printer?

Если вы не знаете, как произносится фраза, я предлагаю вам использовать Google Translate или http://училочка.рф (этого сайта он лучше понимал)

Было у меня желание записать свои команды состоящих из простых буржуйских слов. Которые я могу выговорить. Так он мне и не дал этого сделать, не сумел запустить редактор команд. В итоге он отлично понимал мое произношение слов One, Two и Open. Этим набором можно запустить приложение по номеру в начальном экране. Сначала сказать номер, потом сказать OPEN. Не густо конечно, но я считаю эксперимент удавшимся. Было бы не плохо, если бы Microsoft ввел русский язык, хорошая замена пульту дистанционного управления.



Просмотров