Top.Mail.Ru

Поисковые гиганты в борьбе за бизнес в области искусственного интеллекта

Движки Google RankBrain vs Королёв от Яндекса
Дата24 августа 2017

Если обсуждается машинное обучение в формате появления новых инструментов для применения на практике, то на первый план выходят гиганты рынка, имеющие доступ к большим данным и обладающие ресурсами для исследований. В частности, Yandex и Google, которые сейчас не только занимаются обработкой естественного языка (NLP), но предлагают свои технологии бизнесу.

Чтобы было понятно как и куда развиваются поисковики, пройдёмся от обзора поисковых технологий, на примере текущих движков Google RankBrain и новенького Королёва от Яндекса к решениям, которые бизнес может применять для своих целей. По коням!

Google RankBrain

Система на базе машинного обучения, которая применяется с 2015 года в рамках основного алгоритма для обработки примерно 15% из 3 миллиардов запросов. Используется в основном для определения релевантности документа запросу в случае, если даже этого запроса не содержится в документе, особенно полезен при обработке длинного хвоста запросов. Такие системы используют вектора для определения релевантности, без углубления в сложную математик проще всего это иллюстрирует следующий пример. Машине давали новостные статьи и просили определить соответствие страны и столиц, вот такой вот результат получили.

Яндекс "Королёв"

В августе 2017 Яндекс запустил свой новый алгоритм — Королёв, который стал последователем алгоритма Палех. Алгоритм базируется на обучении нейронной сети обрабатывать и генерировать похожие вектора для поискового запроса и документа. Т.е. принцип примерно такой же, как и в Гугл, но если Палех сравнивал соответствие заголовка и ключевого слова, то Королёв работает уже со всем документом и применяется не на первых 150-ти результатах, а аж на 200 тысячах. Это стало возможным благодаря изменению подхода к вычислению соответствия запроса документу и хранению данных о релевантности документов.

Интересен факт того, что кроме алгоритмов поисковики наращивают массу на поле искусственного интеллекта в комплексе, поэтому появляются инструменты для машинного обучения, которыми может пользоваться любой желающий. Разберёмся по порядку на примерах, сравним самые заметные решения в области машинного обучения, предлагаемые поисковиками бизнесу.

Google

  • Tensor Flow — опенсорсный движок для проведения исследований машинного обучения, который использует сам Google. Работает бесплатно, но Google использует данные пользователей для тренировки своих моделей.
  • Api.Ai — платформа-конструктор для создания ботов, которая используется для распознавания сообщения введенного пользователем и выдачи ему соответствующего запросу ответа. Куплено у русских.
  • Умные кампании в контекстной рекламе КМС. Гугл активно применяет технологии машинного обучения во всех своих продуктах и контекстная реклама не исключение. Данная настройка позволяет задавать автоматически ставки, таргетинг и объявления … ммм т.е. почти всё, что требуется для запуска рекламы.

Yandex

  • Cat Boost — опенсорсный движок для проведения исследований машинного обучения, в основе, которого лежит градиентный бустинг, который использует сам Yandex. В отличии от TensorFlow может применяться в Python и R.
  • Yandex Data Factory — подразделение Яндекса, которое занимается внедрением машинного обучение в промышленные компании. Среди клиентов Газпром, Церн, Интел.


В итоге

Заметно, что Яндекс отстает по темпам, но это и понятно, всё же географическая ограниченность имеет значение. Тем не менее борьба за власть в области AI только начинается и Yandex выглядит готовым к этому.

Интересный вопрос, конечно, кто-кого в итоге, но что же нам с этого?

Теперь необязательно иметь команду учёных для применения алгоритмов машинного обучения на практике, достаточно иметь одного программиста, который разбирается в направлении. Крупный бизнес активно внедряет системы машинного обучения в свои продукты, малому и среднему бизнесу ничего не остаётся, как адаптироваться к надвигающейся эре искусственного интеллекта — применять системы персонализации, тестировать ботов, расширять SEO до стратегического интернет-маркетинга. Дальше снежный ком будет только нарастать, приведёт это к значительному сдвигу в применяемых инструментах, но главное, что для конечного пользователя коммуникация с бизнесом будет удобнее.