Загрузив н-ное количество приложений, вы можете «научить» свой смартфон «думать» как вы, действовать за вас, предугадывать не только ваши мысли, но и желания. Разработчики мобильных платформ и приложений помогли смартфонам «научиться» анализировать данные различных форматов (текст, изображение, звук, местоположение), объединять их и выдавать ответы на запросы и даже предугадывать ход человеческой мысли! Ничего себе.

Сегодня представления об искусственном интеллекте (далее ИИ) не расходятся с реальностью, порой он является ей самой и умещается в человеческой ладони. Темп, с которым ИИ внедряется в нашу повседневную жизнь, становится интенсивнее, а вкладываемые IT-гигантами человеческие и финансовые ресурсы в изучение и развитие этой области недоступны для восприятия среднестатистическим человеком. Что уже умеет делать мобильный ИИ, и куда дальше при всей этой поддержке он шагнет? Обо всем по порядку.

Artificial intelligence как он есть

Более полувека тема ИИ щекочет умы научных исследователей и разработчиков, философов и психологов, футурологов и фантастов. В 1950-х годах, когда впервые прозвучало определение ИИ на конференции в Дортмундском университете, он обозначался как совокупность исключительно вычислительных функций, которая позволяет моделировать и решать различные научные и технические задачи. Тогда было четкое понимание, что artificial intelligence не способен решать творческие и нестандартные задачи, которые до недавнего времени и оставались прерогативой живого, человеческого интеллекта.

Сегодня ИИ – это компьютерная наука, на базе которой создаются информационные технологии. Задача этой науки – воссоздавать разумные суждения и действия на базе вычислительных систем и специальных устройств. Об устройствах и интеллектуальных системах мы и поговорим далее.

 

Мы научили ваш телефон говорить! Интеллектуальные голосовые помощники

 

Все наверное видели релизы умных помощников от мастодонтов Apple, Microsoft, Google. Очаровательная Siri стала не только едким комментатором, но и понимающим собеседником. Были зафиксированы случаи, когда эта интеллектуальная программа спасала жизнь своим «хозяевам». В августе 2015 Siri помогла парнишке из штата Теннеси избежать верной смерти. Когда молодой человек ремонтировал автомобиль, машина сорвалась с домкрата и придавила ему обе руки. Как в лучших американских триллерах, поблизости не оказалось ни души, но чей-то голос все-таки звучал, и это была Siri. Через несколько минут скорая уже ехала к месту происшествия.

Интеллектуальные помощники способны распознавать человеческую речь и весьма тонко анализировать поведение своего хозяина. Основные задействованные технические области – это диалоговый интерфейс, распознавание контекста и сервисная делегация. Поиск ответов на вопросы происходит путем обработки результатов, выдаваемых партнерскими сервисами. В случае с Siri – это Yahoo, Yandex, Bing, Google и другие партнеры.

Вопросно-ответная система Siri была разработана для платформы iOS и использует обработку естественной речи (NLP – Natural Language Processing), что делает ее весьма эффективным посредником между человеком и мобильным устройством. Siri приспосабливается к пользователю, в течение долгого времени наблюдая за его поведением. Программа доступна для большинства гаджетов, выпускаемых под брендом Apple, однако для старых устройств (например, iPhone1-4) интеграция Siri невозможна из-за отсутствия чипа, способного отсеивать ненужные шумы.

В 2014 году корпорация Microsoft выпустила первого полноценного конкурента Siri, голосового помощника Cortana. Эта расширенная версия цифрового помощника полностью базируется на собственных исследованиях компании в области искусственного интеллекта, под кодовым названием Einstein. Помощник с собственным искусственным интеллектом должен знать точное время, и где находится пользователь. Cortana много болтает, напоминает, отправляет сообщения, ведет календарь, читает почту и быстро ищет нужную информацию. Амбициозность этого проекта заключается в желании разработчиков адаптировать программу для пользователей Android и iOS в качестве стороннего приложения. Сегодня Cortana подходит исключительно для устройств c Windows Phone 8.1, Windows 10, Microsoft Band.

 

Распознавание контекста – никаких тайн от смартфона

 

Подобные алгоритмы активно используются в Google Now. И как никто другой, Google Now персонализирует информацию, подстраиваясь под привычки и потребности пользователя. Впервые сервис был запущен в 2012 году вместе с выходом Android 4.1 Jelly Bean. Сейчас Google Now доступен на смартфонах (iOS и Android), хромбуках и в браузере Chrome. Качество выдаваемых Google Now запросов оценивается специалистами на сегодняшний день как лучшее. Оно и понятно, имея за плечами многолетний опыт оттачивания собственной поисковой системы, Google Now вобрал в себя все самое лучшее. В 2014 году система правильно отвечала на 58%, в противовес 29% Siri.

Основная фишка сервиса – информационные карточки, где он напоминает о встречах, днях рождениях, сделанных в Интернет-магазине заказах, предстоящем рейсе и загруженности дорог по ежедневному маршруту. Благодаря геолокационными сервисам всегда знает, где вы находитесь, и самостоятельно выводит на экран смартфона нужную вам информацию: какие места есть поблизости и какая температура за окном. Задача сервиса проста – выводить пользователю всю необходимую информацию еще до того как он введет запрос. Поэтому, чтобы успешно «предугадывать», Google Now тщательно следит за перемещениями своего «хозяина», его текущим местоположением, сканирует письма электронной почты, анализирует покупательское поведение.

Начиная работать с Google Now, надо понимать, что с этого момента он будет знать о вас все. Но, собственно, именно наличие всесторонней информации и позволяет системе быстро и тонко реагировать на поведение владельца электронного устройства.

 

Распознать и предугадать – умные приложения для работы с текстом

 

С функцией распознавания текста мы сталкиваемся регулярно и ей давно не удивляемся. Способов распознать текст на изображении немало – это и установленные ридеры, и сайты вроде Abbyy Fine Reader. Механизм прост – вы загружаете, например, фото с текстом, а потом сохраняете его в нужном формате для редактирования (doc, pdf и т.д.), ИИ распознает текст на любом изображении. Сегодня программы способны отыскивать слова и цифры не только на статичных изображениях, но и в видео, и не только распознавать, но и переводить их на другие языки.

Новейшие алгоритмы распознавания использовались при создании приложения World Lens (для Android, iOS, Google выкупил удачное приложение у разработчика), способного анализировать и переводить в режиме реального времени все названия, попадающие в камеру телефона: вывески магазинов, названия улиц, рекламные баннеры, тексты на этикетках. Таким образом, в телефоне все неизвестные иностранные названия превратятся в понятные русские. И все это в рамках картинки, которую транслирует телефон. Преимущество подобного приложения – оно работает в офлайне и не подгружает сведения через Интернет.

ИИ, как и человек, в процессе работы учится, и чем большее количество текста необходимо распознавать, тем точнее и четче становятся результаты. Тот же самый эффект мы увидим, если коснемся темы умных клавиатур. Опять же Google порадовал своих адептов умной клавиатурой Swift Key, ставшей одним из самых скачиваемых приложений. Предиктивный ввод – принцип, который делает работу с текстом простой и очень быстрой. По сути, приложение учится тому, что вы пишите и все чаще и быстрее начинает угадывать и предвосхищать не только отдельные слова, но и целые фразы. В 2014 фишка стала бесплатной для устройств на Android, а также появилась в App Store. Однако уже сегодня мы видим новую модификацию — SwiftKey Neural.

По аналогии с нейронными связями мозга, разработчики для корректировки и предугадывания текста создают искусственную нейронную сеть. Приложение анализирует весь написанный пользователем объем текстовых сообщений, запоминает и распознает даже скрытый смысл фраз, а в некоторых случаях и весьма тонкую игру слов. Понимание контекста делает сервис человечным и на очередной новый уровень выводит «отношения» человека и устройства. Но есть одна недоработка, над которой разработчики сейчас трудятся усиленно, – даже SwiftKey Neural не способна предугадывать слова, которые не использовались ранее. У создателей обширные планы, в том числе работа над карточками с наборами фраз, а пока версия мобильного приложения доступна для Android 4.4.4. и выше. Русскоязычный релиз пока не состоялся.

 

Распознавание изображений

В 2015 году прошло несколько релизов приложений, созданных на основе алгоритмов распознавания объектов на изображениях. После конференции I/O Google обновила приложение для просмотра фотографий «Фото». Особенностью новой версии, помимо безлимитного хранения снимков на серверах Googlе, стала возможность программы по ключевым словам отыскивать среди сотен и тысяч фотографий нужные пользователю.

Если вбить в поиске тэг «горы», приложение просканирует весь объем фотографий пользователя как в памяти устройства, так и в облаке, и самостоятельно выберет из него те, на которых горы, собственно, и изображены. «Google. Фото» работает на удивление быстро и довольно редко ошибается, что делает ее едва ли не самой удобной программой для просмотра своих снимков. Приложение доступно для iOS, Android.

Popular Science сообщает, что компания уже ведет работу над программой, которая определяет, что за еда изображена на фотографии, и умеет подсчитывать количество содержащихся в ней калорий. В расчет принимается как сам продукт, так и его количество на тарелке. Когда состоится релиз приложения, пока неизвестно.

 

Тенденции на рынке. С мобильными не расстаемся

 

Объединив все вышесказанное, мы можем сделать несколько выводов о том, что ждет нас и наши мобильные устройства в будущем. Наметим некоторые очевидные тенденции.

  1. ИИ уже вовсю живет в мобильных приложениях. Сам факт появления мобильных приложений, а далее – умных мобильных приложений, навсегда изменил взаимодействие человека и устройства. Тенденция к очеловечиванию и персонализации – налицо. Здесь мы можем говорить о зарождающихся специфических, психических «отношениях» человека и мобильного устройства, которое способно угадывать, помогать и понимать пользователя на его языке. Согласитесь, ваш телефон знает о вас гораздо больше, чем любой человек. Никогда еще связь человека и ИИ не была такой тесной.
  2. Сейчас основной объем работы над интеграцией ИИ в мобильные устройства сосредоточен в руках основных игроков рынка, в то время как мелкие проекты, совершившие успешные релизы, вынуждены либо продавать (а точнее, продаваться) их все тем же Google, Apple, Microsoft, либо работать дальше до совершения настоящего «прорыва». Поэтому ключевой фактор успеха уже сейчас – это инновация, продуктовая или технологическая. Отсутствие больших прибылей с продаж мобильных приложений в потребительском секторе и делает инновацию главным и единственно значимым критерием успеха. Опять же, от глобального противостояния Google Play и App Store устали и заказчики, и разработчики, и пользователи, а значит, ситуация будет меняться.
  3. На рынке существует очень высокая конкуренция, но тенденция к мультиплатформенным решениям, доступным для любых устройств, очевидна. Вспомним амбициозную Cortana и обязательную адаптацию успешных приложений для альтернативных платформ. Появляется и желание не расставаться с телефоном или жертвовать работой в отсутствии Интернета. Умные офлайн приложения не зависят от сети и при этом постоянно учатся, чем больше ими пользоваться.