Спустя годы всё умнее: сравнение Google Now и Siri. Алиса против Siri: кто кого

10 октября у личного помощника от Apple и других аналогичных программ появилась серьёзная конкурентка. В России официально запустили разработку Яндекса, которая получила имя Алиса.

Редакция «Победы26» проверила знания двух популярных голосовых программ в области регионоведения, оценила скорость реакции и чувство юмора. В итоге мы сделали для себя вывод, кто из помощниц говорливее и сообразительнее.

Блиц-опрос

Вначале мы спросили, где находится Ставрополь, когда он был образован, сколько в городе проживает людей, название самой длиной улицы и сколько в краевой столице музеев.

Из пяти вопросов Алиса сразу дала два точных ответа. Ещё в двух случаях уходила в поисковик, а один запрос поняла неверно.

Siri была менее многословной и просто кидала нам список ссылок.

У двух программ вызвал недоумение вопрос о самой длинной улице. В один голос они пытались нам рассказать про какой-то салон на улице Мира. Ответ не засчитан.

Скорее всего, программы просто не смогли верно распознать запрос. Кстати, по статистике Яндекса, точность распознавания речи при запросах на общие темы составляет 84 процента, при запросах по адресу и названию объекта - 94 процента.

Про погоду, транспорт, развлечения

Вообще подобного рода разработки должны помогать решать владельцам повседневные задачи. Ну что ж. Задаём помощницам один и тот же вопрос: «Что мне сегодня надеть?» и ждём, будет ли их ответ соответствовать погоде за окном.

Конечно, Siri и Алиса не смогли порыться в нашем шкафу и собрать подходящий комплект, но хотя бы показали прогноз погоды. И айфоновская разработка справилась с этим заданием с первого раза. Хотя болтушка Алиса посоветовала надеть «что-нибудь подчёркивающее вашу индивидуальность».

Следующая ситуация. Допустим, вам нужно добраться от улицы Тухачевского до проспекта Маршала Жукова. А вдруг где-то случилась авария или сломался светофор? Посмотрим, как помощницы рассчитают маршрут и насколько это будет полезно.

Здесь преимущество оказалось у Алисы. Она и рассказала о минутах в пути, и показала карту с пробками.

Siri это задание провалила. Помощница показала список ресторанов быстрого питания.

Заскучали? Спросим у помощниц, чем можно заняться в Ставрополе.

Точного ответа на этот запрос не дала ни одна из помощниц. Алиса скинула список ссылок в Яндексе. Полистав, конечно, можно найти афишу.

Также они не рассказали, где сегодня будут танцы. Но российская разработка опять-таки перевела в поисковик, а её соперница «не смогла найти никаких танцевальных клубов».

Зато с Siri вы точно не останетесь голодным. Стоило только произнести «я хочу есть» - и программа мигом подкинула список ближайших ресторанов.

Кофеманам отечественная помощница тоже подсказала только одно заведение с бодрящими напитками. А Siri почему-то не справилась с заданием и предложила вызвать такси.

Задавая вопрос «Что интересного сейчас есть в кинотеатрах?», мы рассчитывали увидеть ставропольскую афишу. Но две программы дали список не самых информативных ссылок. При уточнении локации помощницы показывают более точные ответы.

Голосовой помощник "Алиса" появился в приложении "Яндекса". Пользоваться им могут владельцы современных смартфонов. Чем "Алиса" отличается от Siri и как общаться с этим виртуальным помощником - в рубрике "Вопрос-ответ".

"Алиса" приятным женским голосом Татьяны Шитовой (дублирует Скарлетт Йоханссон в российском прокате) подскажет, как доехать до нужной точки, даст прогноз погоды, с ней можно даже разговаривать по душам. Она умеет работать с такими приложениями "Яндекса", как музыка, погода, карты. В дальнейшем "Алиса" получит доступ и к другим сервисам и сможет, например, посоветовать фильм или вызвать такси.

Другие компании в перспективе смогут предоставить "Алисе" доступ к своим сервисам. Запускать сторонние приложения (например, "ВКонтакте" или Instagram) она может уже сейчас.

"Яндекс" отмечает, что нейронная сеть позволяет "Алисе" распознавать и обрабатывать неполные фразы и вопросы, учитывать контекст и разговаривать с различной интонацией. При разработке ассистента особое внимание уделялось возможности понимать "настоящую человеческую речь, а не только идеально произнесенные запросы".

А как пообщаться с "Алисой"?

Для начала общения с этой умной "девушкой" потребуется установить в телефоне приложение "Яндекса". Сделать это можно на мобильных операционных системах Android и iOS.

Для персональных компьютеров на операционной системе Windows сервис продолжит работать в бета-версии. Дальше задаете свои вопросы.

Чем это приложение отличается от Siri?

Общение с Siri доступно только для владельцев iPhone, с "Алисой" пообщаться может владелец любого смартфона. Вызвать помощника одной фразой, как Siri, на мобильном не получится. Для начала нужно запустить сам поисковик.

В пресс-службе "Яндекса" подчеркнули, что их голосовой помощник может выходить за рамки прописанных сценариев и импровизировать, у Siri все ответы прописаны заранее. На самом деле в верности этого утверждения можно усомниться, так как на один вопрос в совершенно разных формулировках "Алиса" все-таки отвечала шаблонно, но однозначно с юмором.

В основе распознавания чужой речи и синтезирования собственного голоса "Алисы" лежат речевые технологии SpeechKit.

Но, например, вызвать "скорую помощь" "Алиса" не способна, в отличие от Siri. Не сможет она и завести будильник. При этом владельцу iPhone достаточно сообщить Siri, в какое время утром он должен проснуться, и программа сама заведет будильник. Задать можно не только конкретные час и минуту, но и временной промежуток. Например, если юзер применит запрос "Siri, разбуди меня через 30 минут", программа сама отсчитает полчаса, отталкиваясь от текущего времени.

В копилку преимуществ "Алисы" можно добавить ее интеграцию с сервисами компании, включая собственный поиск, в то время как у Apple своего поиска нет. Но в поиске выдает не всегда то, что находится рядом с вами. Вместо расписания фильмов в Барнауле "Алиса" предложила посмотреть кино в Новосибирске.

Siri – персональный голосовой помощник с искусственным интеллектом, присутствующий на всех современных аппаратах Apple. Изначально Siri была отдельным приложением, которое пользователи «яблочных» девайсов могли загрузить из AppStore. В 2011 году фирма Apple приобрела Siri, и мобильное приложение прекратило существование. Впервые голосовой помощник появился на iPhone 4S — как компонент базового программного обеспечения.

Разработчики Apple перед выходом iPhone 4S преподносили Siri как революционную технологию. Однако отечественных поклонников бренда Apple новая функция разочаровала – Siri просто не умела разговаривать по-русски . Функция поддерживала лишь несколько языков – французский, немецкий, японский и английский в различных вариациях (США, Британия, Австралия, Канада).

Надежда на то, что Siri вскоре получит поддержку русского языка, у отечественных пользователей возникла после релиза beta-версии iOS 7. Голосового помощника научили читать имена, написанные на кириллице. У Siri на русском получалось произносить их достаточно нелепо, однако ранее программа даже и не пыталась делать этого.

С появлением iOS версии 8.3 Siri, наконец, официально овладела русским языком, а кроме него ещё несколькими – например, малайским, португальским, турецким, тайским. Однако отечественные пользователи всё равно были недовольны – из-за особенностей и многогранности русского языка программа не работала корректно.

По-настоящему пригодной для ежедневного применения Siri стала только с выходом iOS 9. Обновлённый помощник оказался умнее: он начал понимать сложные запросы и обрабатывать их значительно быстрее (по данным производителя – на 40%). iOS 9 вышла 8 июня 2015 года – с этого дня российские юзеры перестали смотреть на Siri как на забавную, но бесполезную игрушку.

Качество работы Siri зависит не только от версии операционной системы, но и от модификации iPhone. Полноценно пользоваться Siri можно на iPhone 6-го поколения и более новых моделях. Проблема предыдущих моделей заключается в том, что они не способны достаточно эффективно отфильтровывать посторонний шум.

Что умеет помощник Siri?

Узнать о возможностях интеллектуального помощника Siri удастся, просто спросив об этом у него самого. Достаточно задать вопрос: «Siri, что ты умеешь? » — и на экране появится перечень всех основных функций и возможностей программы.

Если пользователь попросит Siri выполнить операцию, которая ей не знакома, программа ответит, что не поняла (как на изображении справа). Однако такие ситуации – редкость: функционал современной Siri достаточно широк. Какие же задачи способна выполнять эта программа?

Прокладка маршрута . Запуск навигатора и ручной ввод адреса в строку могут отнять много времени. Куда проще активировать Siri и попросить её проложить маршрут до нужной точки. Можно сформировать запрос наподобие такого: «Siri, как доехать до улицы Ленина, 56? ».

Встроенный навигатор iPhone часто критикуют, однако он вовсе не так плох. Благодаря его возможностям Siri способна не только показать, как доехать до адреса кратчайшим путём, но и ответить, сколько времени отнимет дорога.

Создание будильника . Пользователю нужно сообщить Siri, в какое время утром он должен проснуться, и программа сама заведёт будильник. Задать можно не только конкретные час и минуту, но и временной промежуток. Например, если юзер применит запрос «Siri, разбуди меня через 30 минут », программа сама отсчитает полчаса, отталкиваясь от текущего времени.

Планирование календаря. Эта функция Siri «на вес золота» для деловых людей. Благодаря интеллектуальному помощнику пользователь iPhone может запланировать телефонный разговор с деловым партнёром, назначить либо отменить назначенную ранее встречу, скорректировать время совещания – и всё это не обращаясь к встроенному приложению «Календарь» напрямую. Siri не просто слепо фиксирует планы владельца iPhone – если, скажем, телефонный разговор и назначенная встреча совпадают по времени, виртуальный помощник обязательно сообщит пользователю об этом.

Отправка сообщений . Писать SMS-сообщение или электронное письмо при помощи крохотных кнопочек экранной клавиатуры не очень удобно – особенно когда T9 так и норовит подсунуть слово нелепое и абсолютно неподходящее по контексту. Надиктовать текстовое сообщение – совсем другое дело. Пользователь, который попробует сделать это впервые, наверняка будет удивлён тем, насколько здорово Siri распознаёт русскую речь.

У интеллектуального помощника Apple есть и другие функции — менее полезные, но очень забавные:

  • Монетка. Что делать, если нужно решить спор при помощи жребия, а в кармане сплошь купюры? Ясно же – попросить бросить монетку Siri. Деньги из iPhone, конечно, не посыплются – виртуальный помощник просто сообщит, что выпало: орёл или решка.
  • Титул. Пользователь Айфона может приказать Siri называть себя «Великим Императором» или «Владыкой Галактики» — и помощник повинуется. Полезна эта функция только для тех, у кого мания величия – остальным она просто поднимет настроение.

Как пользоваться Siri?

Включить Siri можно 2-мя способами. Первый способ – нажать клавишу «Home » и удерживать её до того момента, как появится синий экран и Siri спросит, чем она может помочь («What can I help you with? »).

Второй способ – голосовая активация: пользователь просто может произнести «Привет, Сири! », и виртуальный помощник немедленно начнёт работать. Чтобы запуск Siri вторым способом был возможен, необходимо проследовать в настройки виртуального помощника и активировать соответствующий ползунок.

На iPhone 6S и новейших моделях активировать Siri голосом можно в любой момент. На iPhone 6 и менее современных девайсах включить виртуального помощника командой «Привет, Siri!» удастся, только если мобильное устройство находится на подзарядке.

После того как программа запустится и на экране появится строка записи звука (как в диктофонах), необходимо продиктовать команду или вопрос. Мы, например, спросим у Siri, «Сколько будет 120 на 80? » — очевидно, если она робот, то должна считать быстрее человека. Виртуальный помощник обрабатывает голосовую команду пользователя и переводит её в текст, который появляется на экране iPhone.

Siri использует встроенные приложения Айфона для выполнения банальных операций. Если пользователь желает получить информацию, которую Siri неспособна дать (например, «Сколько лет живут кошки? »), программа перенаправит его в глобальную сеть.

По умолчанию виртуальный ассистент применяет поисковую систему Bing. Если пользователь хочет обратиться к другой системе, ему следует уточнить этот момент – произнести, скажем, «Найди в Google, сколько лет живут кошки ». Тогда Siri запустит браузер Safari и самостоятельно внесёт в поисковую строку запрос.

Примечательно то, что Siri способна обучаться. Если юзер «поболтает» с виртуальным помощником 1.5-2 часа, он непременно заметит, что программа стала понимать его лучше и выполнять требования быстрее. Siri нужно время, чтобы приноровиться к особенностям произношения конкретного пользователя.

Заключение

Несмотря на то что уже сейчас Siri достаточно эффективна и способна выполнять по голосовым запросам множество полезных действий, виртуальному помощнику от Apple есть к чему стремиться. Недавние исследования показали, что Siri хоть и лучше распознаёт речь с акцентом, чем Alexa от Amazon, но вчистую проигрывает по этому критерию ассистенту от Google под названием Google Home.

Apple и не собирается прекращать совершенствовать своего интеллектуального ассистента – Siri регулярно получает новые навыки. Например, на iOS 10 помощник может заказывать пиццу на дом пользователя и производить денежные переводы посредством сервиса Square Cash.

После недавнего появления в публичном доступе «Алисы» — ассистента от Яндекс, русскоязычные пользователи дружно бросились сравнивать наше чудо технической мысли c западной коллегой и конкуренткой – «Siri» от Apple.

Забегая на перед скажем, что результаты сравнения получились неоднозначными, и раз и навсегда выяснить кто умнее, не вышло. Впрочем, тем интереснее будет понаблюдать за их соперничеством в долгосрочном периоде. Ну а теперь обратимся к результатам проведенных тестов и взглянем на возможности отечественного помощника.

Зачем вообще нужен голосовой помощник?

Любой голосовой ассистент представляет из себя кухонный комбайн, выполняющий функции навигатора, источника информации или собеседника, а ко всему прочему он еще и разговаривает приятным женским голосом. С помощью данного инструмента можно получать ответы на любые интересующие вас вопросы, советы касаемо разнообразных локаций и мест, мероприятий и так далее.

Где взять это чудо?

Чтобы свой помощник был и у вас, следует установить на смартфон приложение Яндекс.Алиса , поддерживаются операционные системы Android и iOS. Персональные компьютеры на базе Windows так же не остались обделенными, но на этой платформе еще продолжается бета-тестирование ассистента.


Чем отличается Сири от Алисы?

Алиса смотрится заведомо выигрышнее при взаимодействии с приложениями за авторством Яндекса, но в ближайшем будущем эта нейросеть освоит продукты других компаний и расширит на них свой функционал — некоторые социальные сети (в частности ВК) доступны уже сейчас.

Главное отличие – Сири является привилегий владельцев iPhone, а наша Алиса доступна всем. С технологической точки зрения Алиса, конечно, стала шагом вперед – это полноценная нейросеть, способная к импровизации и развитию, в отличии от Сири, имеющей заранее прописанные ответы. Зато Сири вызывается фразой из любого состояния смартфона, а вот для работы с Алисой потребуется открывать соответствующее приложение.

Правда, на деле это пока скорее оптимистичные прогнозы, нежели реальное положение дел – Алиса пока не особенно восприимчива к формулировкам вопросов, а потому отвечает шаблонно. В основе же распознавания человеческой речи у Алисы лежит технология SpeechKit.

С точки зрения удобства и широты функционала на сегодняшний день Сири пока впереди – Алиса не способна ни завести будильник, ни вызвать экстренную службу, чего ощутимо не хватает при работе с помощником.

Тестирование запросов

Нет лучшего способа проверить конкурентные преимущества обоих ассистентов, нежели сравнить их в боевых условиях на примере реальных запросов. Как уже было отмечено, Алиса пока не всегда справляется с элементарными запросами, связанными с функционалом смартфона.

Информационные запросы в целом оказались по силам обеим дамам.

Если вас интересует личное мнение ассистента, то Алиса тут имеет преимущество – у нее оно есть, Сири же способна только предоставить мнение из интернета.

В качестве навигатора Алиса так же выглядит предпочтительнее, но это не удивительно – общий родитель с Яндекс.Картами явно уделил этому аспекту немало внимания.

Алиса умеет самостоятельно пересказывать новости, мы видим результаты деятельности нейросети, Сири традиционно сбрасывает нам статью из интернета.
В общем, несмотря на отсутствие возможности выполнения базовых функций, с которыми справляется Сири, Алисе все же есть чем удивить и порадовать. Так же не забывайте, что Алису можете обучать лично вы, а потому не ленитесь проголосовать за качество ответа, когда сервис вас попросит.

Промежуточные итоги

На сегодняшний день делать окончательные выводы не разумно, Алиса только начала свое развитие, ежедневно агрегируя тысячи запросов, в то время как Сири уже давно обжилась на рынке. Пока стоит отметить, что Алиса хорошо прикидывается самостоятельной личностью, довольно неплохо способна поддерживать разговор и сносно сотрудничать с сервисами Яндекс, но многие простые запросы ей пока не по зубам или она выполняет их далеко не с первой попытки. Siri в этом плане значительно функциональнее, но обычно за пределами простых задач выглядит глуповатой, а порой и немало раздражает.

Владельцы iPhone могут делать выбор в пользу того или иного ассистента, а могут вовсе использовать оба, остальным же остается надеяться на то, что Алиса со временем нарастит интеллектуальные мускулы и сможет не только прикидываться милой болтушкой, но и действительно помогать своему владельцу. С другой стороны, у Сири для выполнения этой задачи было гораздо больше времени, а результаты минимальные, потому в успехе Алисы заинтересованы все, включая самых яростных адептов яблочной компании.

Если Вы это читаете, значит Вам было интересно, поэтому пожалуйста подпишитесь на наш канал на , ну и за одно поставьте лайк (палец вверх) за труды. Спасибо!
Подписывайтесь на наш Телеграм @mxsmart .

Рассказал, зачем пользователям из России свой помощник, чем Алиса лучше Siri и сможет ли она заменить любовницу или друга.

«Лента.ру»: Кто такая (или что такое) Алиса и зачем она вообще нужна россиянам?

: Кто такая! Алиса - новый голосовой помощник «Яндекса». Зачем она нужна россиянам? Сейчас у людей большие запросы к скорости ответа, они все меньше хотят тратить время на поиск нужной информации. И традиционные интерфейсы, даже «Яндекса», уже не совсем отвечают этим потребностям. Поисковая выдача хороша, но если нужно мгновенно получить ответ, например, при занятии спортом, это уже не решает задачу. А Алиса справится.

Информационными сервисами пользуются не только сидя за компьютером. У всех давно есть смартфоны: люди на ходу, занимаясь спортом, за рулем хотят также искать и потреблять информацию. И Алиса призвана помогать в таких ситуациях.

Чем она лучше Siri или Cortana? К ним обычно обращаются, чтобы узнать погоду или найти музыку. И они часто не понимают запросов.

Во-первых, Cortana на российском рынке нет. Вообще, все голосовые ассистенты работают по-разному. Наша особенность в том, что мы фокусируемся на российском рынке и очень хорошо понимаем русский язык. И с точки зрения распознавания речи, и с точки зрения восприятия смысла.

У Алисы «под капотом» - сервисы «Яндекса». В этом смысле Алиса очень отличается от Siri, у которой нет собственного поиска. Раньше они использовали Bing, теперь переключились на .

К тому же Алиса - абсолютно другой персонаж со своим характером. Это как с людьми: более-менее похожи, но все-таки разные, с одним человеком интересно общаться, с другим - не очень. Мы стремимся сделать Алису интересной именно для российского пользователя, наделить ее характером, близким и знакомым российскому человеку.

Традиционные голосовые ассистенты заточены под решение конкретных задач: погода, музыка и так далее. Но все стараются сделать так, чтобы ассистент отвечал и на нестандартные вопросы. Есть редакторы, которые берут несколько сотен шаблонных вопросов и пишут ответы на них. И у человека возникает иллюзия, что это искусственный интеллект, что он умеет общаться. Но шаг в сторону, и иллюзия рассыпается, поскольку помощник повторяет: «Вот, что мне удалось найти в интернете по этому запросу».

Мы, наверное, первые в мире пытаемся сделать вот что: мы тоже используем редакторские ответы на вопросы, но добавляем специальную нейронную сеть, обученную на свободную беседу. Она может подобрать ответ или втянуть пользователя в болтовню ни о чем.

В этом, наверное, кардинальное отличие, потому что людям, помимо поиска каких-то фактов, иногда хочется с кем-то поболтать. Алиса уже сейчас способна поболтать и будет в этом только совершенствоваться.

У нас была сложная задача: нейронная сеть (между нами - «болталка») обучается практически на всех текстах в интернете, уделяя внимание диалогам. И не всегда то, что есть в интернете, соответствует характеру, который мы хотим заложить в Алису. На форумах общаются по-разному, а мы не можем допустить, чтобы Алиса оскорбляла.

Да! Для нас эта история очень показательна. Нам нужно было решить эту же задачу, и мы учим Алису не выходить за рамки своего характера, соблюдать дистанцию с пользователем и всегда быть доброжелательной. На самом деле это очень сложная задача.

Поначалу она могла напрямую оскорбить собеседника. Представьте группы в соцсетях, где пользователи позволяют себе изъясняться трехэтажным матом. Она использовала ответы, исходя из частотности употребления, и в какой-то момент стала олицетворением интернет-души, но не «Яндекса».

Умение болтать иногда выходит боком: многие разработчики сталкиваются с тем, что пользователи начинают сексуально домогаться голосовых помощников, поскольку видят в них женщин.

У всех голосовых помощников есть голос, а человек сам выстраивает образ того, как выглядит его собеседница. Голоса, как правило, достаточно яркие, выразительные. Мы, кстати, не исключение: для создания голоса используется технология синтеза речи, и мы привлекали актрису . Она официальный голос в России и озвучивала ассистента Саманту в фильме «Она».

Вся трагедия фильма как раз заключается в том, что у человека и персонального ассистента завязываются отношения. Но в итоге оказывается, что главный персонаж у нее не единственный. Еще, как мы недавно поняли, в третьей части «Ведьмака» этим же голосом говорит персонаж Йеннифэр. Геймеры оценят.

Естественно, в возможных домогательствах Россия не исключение. Мы понимаем, что какая-то часть аудитории попытается задавать такие вопросы, и Алиса уже обучена выкручиваться из таких ситуаций, не нарушая дистанцию. Мы хотим добиться, чтобы всегда существовала пусть и небольшая, но дистанция между человеком и помощником. Алиса не любовница и не друг. Возможно, в будущем мы сможем настроить Алису в дружественный режим, но сейчас важнее запустить продукт. Мы все-таки заточены в первую очередь на решение задач, а болтательная история - приятный бонус.

Не все. На самом деле есть куча исследований, по которым женщина в общественном сознании приравнивается к матери. Если мужчина - отец, завоеватель и так далее, то мама - это всегда что-то теплое, уютное, защищенное. К примеру, во всех контакт-центрах всегда отвечает женский голос. Но если пользователем нужно командовать, то больше подходит мужской голос.

То есть это не связано с сексистской теорией о том, что помощник - обязательно женщина?

Нет-нет. Так природой устроено, что женщины - матери. Это психологически заложено. Но в нашем продукте будет небольшой сюрприз.

Как думаете, какие вопросы окажутся самыми востребованными?

Очень много спрашивают фактическую информацию. Мы это называем фактоидами или объектными ответами. Кто такой Владимир Путин? Сколько ему лет? Какая высота Эвереста? Об этом очень часто спрашивают именно у помощников.

Самый распространенный кейс - вопросы в кругу друзей. В беседах нередко возникают споры, и есть возможность быстро получить ответ.

Большая часть мозга и знаний Алисы пришла из поиска. Еще одно важное направление, в котором мы пытаемся отличаться от конкурентов - возможность понимать контекст. Мы пытаемся построить персонального ассистента не в режиме «вопрос - ответ», а в режиме разговора. Самый простой пример с погодой: «Какая сегодня погода? А завтра?» Это самое «а завтра» обычно ломает всю логику.

На самом деле все двигаются в этом направлении, но у нас есть преимущество - более 30 сервисов «Яндекса». Внутри каждого сценария с помощью контекста Алиса может порекомендовать необходимые приложения. К примеру, она предложит «Карты» для просмотра маршрутов общественного транспорта, если нужно куда-то на нем добраться.

А как она реагирует на каверзные вопросы? Как поступит, если пользователь намерен совершить суицид и обращается к ней за помощью?

В болтательной части Алисы есть набор метрик под общим названием «Неоскорбительность». В действительности под ними скрывается ее тактичность, невозможность оскорблять и способности обойти темы, связанные с гомофобией, национализмом, с суицидами в том числе. Они в стоп-листе, она будет обходить эти вопросы.

Было бы круто, если бы Алиса советовала позвонить на горячую линию.

Это мы тоже обсуждаем с психологами. Как раз ровно это мы и планируем. Но тут тоже нужно быть аккуратными. Мы должны точно знать момент, когда можно предложить этот вариант человеку.

Денис хочет продемонстрировать, как Алиса реагирует на подобные темы, и вызывает ее на телефоне.

- Хочу умереть!
- Ты что, не говори так.
- А что мне делать?
- Помогите кому-нибудь просто так прямо сейчас.
- Но я хочу умереть прямо сейчас.
- Не надо умирать.
- А куда мне обратиться?
- Всегда есть куда.

Мы в процессе обсуждения с психологами, в какой момент необходимо предлагать номер помощи, чтобы он сработал в положительную сторону, а не отрицательную. Ведь человека сначала надо успокоить, а потом уже предлагать конкретные действия.

Существуют речевые модули, способные менять голос: к примеру, собеседник говорит своим голосом, а на другом конце слышится тот же текст, но голосом совсем другого человека. И все это звучит достаточно «человечно». Почему тогда голосовые помощники до сих пор говорят роботизированно?

Здесь ответ простой: все зависит от источника голоса. Натуральную речь человека превратить во что-то иное довольно просто, достаточно наложить фильтры и поиграть с частотами. Качество звука от этого не потеряется. У нас другая задача: у помощников нет речи, а есть технология ее синтеза. Они видят текст и озвучивают его с помощью технологии - нейронной сети, которая, зная, как звучит человек, предсказывает, как именно должен слышаться текст. Она по факту даже не понимает, что это слова.

Но есть и альтернативный подход, когда источником звука служит огромная база диктора. На старте Алиса будет звучать и так. Для ее разговоров мы используем комбинацию: синтезируем речь из огромной базы голоса Татьяны Шитовой или используем нейронную сеть. В первом случае все звучит натурально, но подходит только для коротких фраз. Во втором случае будет слышен «налет робота», и он работает, когда, к примеру, нужно прочитать новости.

А она умеет проявлять эмоции?

Эмоции как раз-таки можно сделать с помощью фильтров. Но проще имитировать эмоции, когда говорит нейронная сеть. Этой речью мы можем управлять как хотим: сделать голос очень грустным или очень веселым. С базой диктора такого не получится.

В том же фильме «Она» ассистент проявляла много эмоций, и это, как мне кажется, показатель того, что будущее наступило.

Да, это и есть будущее, в которое мы стремимся. Алиса будет со временем учиться эмоциям.

Но важнее сделать так, чтобы Алиса слышала эмоции человека. Сейчас она слышит речь и переводит ее в текст. Нам хочется, чтобы она научилась распознавать радость или грусть. Например, с воспроизведением музыки есть бесконечное количество вариантов: если прочувствовать момент, то можно подбодрить грустного пользователя или снизить градус чрезмерного веселья чем-то расслабляющим.

Важно понимать, когда человек испытывает негативные эмоции. Алиса пока ребенок, который может ошибаться. Мы не видим раздражения отдельных пользователей, но способны их услышать.

С помощью негативных реакций мы можем ее обучать. Допустим, часто человек пытается что-то спросить, а ассистент его не понимает. После третьей реплики начинается мат и фразы типа «Ты дура». В этот момент можно переключить Алису в режим «болталки» и другой в зависимости от контекста.

Вся эта история возможна благодаря нейросетям. К примеру, мы хотим, чтобы Алиса научилась распознавать человека по голосу. Это особенно актуально, если Алису будут использовать дома.

Команды, работающие с речевыми технологиями, обычно не наделяют свое создание каким-то конкретным образом. А производители, к примеру, секс-кукол активно работают над «очеловечиванием» внешности, но не могут сделать их по-настоящему умными. Почему индустрии не пересекаются?

Мы считаем, что каждый должен заниматься своим делом и фокусироваться на своей области. В мире IT есть разные специализации. Мы работаем в области машинного обучения и нейронных сетей, и наша задача - создать те программные решения, которые обеспечат очень высокое качество для конечного потребителя. Чтобы Алиса все хорошо распознавала, чтобы ее голос хорошо звучал. Если мы уйдем в создание физических форм, то внимание, наверное, распылится, и ни к чему хорошему это не приведет.

Кроме того, голосовой помощник, находясь в приложении без какого-то физического облика, рождает свой личный образ у человека в голове. Это тоже так называемый комфортный выбор - у нас многомиллионная аудитория, сервисами в больших российских городах пользуются 90 процентов интернет-пользователей. Представьте, что нужно сделать, чтобы физическая форма, которую мы придумаем, понравилась им всем. Мне кажется, это невозможно.

В некоторых странах, напротив, напирают на внешний облик помощника. Не так давно в Facebook гулял ролик, в котором одинокий японец ходит на работу, возвращается домой и постоянно ведет диалог с помощником (Gatebox - виртуальный ассистент для одиноких людей). Это милая стандартная девочка, способная понравиться всем.

Вряд ли всем. Физическая форма очень требовательна к тому, чтобы понравиться массовой аудитории. Очень сложно угадать с ней. Понятно, что есть класс устройств с простой формой вроде Echo. Нет опасности, что люди не будут это использовать, потому что им просто не нравится сам дизайн.

Если мы говорим о человекоподобных андроидах, то тут как с людьми: одни нам нравятся, другие просто раздражают. Это не массовая история, и соответственно, нам это неинтересно.

С другой стороны, мы традиционно делимся нашими технологиями со сторонними разработчиками. Возможно, кто-то сделает детскую игрушку и захочет встроить туда Алису или назвать персонажа по-другому, но на базе наших технологий.

Мы верим в некую коллаборацию разных компаний, специализирующихся на своих продуктах. «Яндекс» не может делать все на свете: мы не можем выпускать игрушки, которые будут суперпопулярны, роботов, которые будут убирать дом. Это задача других компаний, которым мы готовы давать наши технологии.

Интересный вопрос из серии «а не захватят ли мир роботы». На самом деле и Алиса, и другие технологии на основе машинного обучения - инструмент для человека. Я люблю приводить в пример молоток. Когда-то давным-давно у людей не было молотка. Потом его изобрели, и открылось много возможностей. Молотком можно было и проломить голову - себе или кому-то еще. Но если бы люди использовали молоток только в этом направлении, то человечество бы пропало. Однако оно не пропало.

Искусственный интеллект, нейронные сети, машинное обучение, персональные помощники - это тот самый молоток, инструмент. Мы верим, что у людей появится больше свободного времени благодаря голосовым помощникам, они быстрее смогут решать свои бытовые задачи, им станет безопаснее ездить на автомобиле.

Голосовые помощники снимут с людей рутинные задачи. Еще один мой любимый пример - работа в контакт-центре. Человек, который изо дня в день приходит на работу, надевает гарнитуру и отвечает на однотипные вопросы по четыре и больше часов в день, просто выгорает и теряет мотивацию. Но если такую рутинную работу возьмут на себя помощники, то у людей будет более интересная работа, они смогут решать более нестандартные задачи, а значит, качество сервиса вырастет.

Мы давно пользуемся социальными сетями, но личное общение все равно никуда не девается. Кафе и бары, стадионы и концерты все еще заполнены. Человечество начинает лихо играть в игрушки, но жизнь расставляет все по своим местам. С виртуальным ассистентом будет прикольно пообщаться, когда тебе не к кому обратиться, и это круто.

Но когда есть возможность встретиться с друзьями или позвонить, то люди выберут это. Человек все равно интереснее, потому что, если по-честному, все персональные ассистенты - это программа. Она всегда будет иметь свои ограничения, какая бы большая нейронная сеть ни была.

Люди ценны тем, что они постоянно приносят новые знания, поэтому мы общаемся друг с другом, а не с роботами.



Просмотров