Комментарии
Как и для чего их можно использовать уже сегодня — краткое содержание нашего доклада на встрече Сбербанка с представителями малого и среднего бизнеса
Нейросети в бизнесе
Сибирикс
Нейросети в бизнесе
Как и для чего их можно использовать уже сегодня — краткое содержание нашего доклада на встрече Сбербанка с представителями малого и среднего бизнеса
29 мая исполнительный директор Екатерина и руководитель проектов Иван поделились с бизнес-аудиторией современными трендами автоматизации и информатизации и ответили на главный вопрос: зачем нейросети бизнесу? Ниже — основные тезисы их доклада, а также видео для тех, кому многобукв :)
Что происходит?
Пока одни внедряют новейшие технологии для автоматизации бизнес-процессов, другие отсиживаются в стороне, думая, что их отрасли это вообще не касается — и так ведь всё работает. На деле же область применения технологий машинного обучения шире, чем кажется, и может пригодиться в любой сфере предпринимательства. Уже сегодня можно считать обязательными предиктивную аналитику и кластеризацию/кастомизацию своих клиентов — без таких данных, кажется, уже невозможно конкурировать с предложениями других игроков рынка.
Уровни зрелости бизнеса в использовании машинного обучения и ИИ
Очень желательно развиваться дальше, внедряя умные системы рекомендаций (вроде RetailRocket) и обработку естественного языка (понимание и генерацию грамотного текста). Высший пилотаж — использование искусственного интеллекта для психографики целевых персон и внедрение механизмов распознавания изображений. Один из ведущих игроков российского рынка в этой сфере — проект Vision Labs от Сбербанка. Их решения уже умеют распознавать лица для разного рода приложений и управлять биометрическими данными для крупных внедрений.
Немного теории
Про машинное обучение слышно из каждого утюга, и довольно давно. Вокруг этого понятия часто крутятся ассоциации с теорией вероятностей, высшей математикой и линейной алгеброй, программной инженерией и математической статистикой, параллельными алгоритмами и информатикой. Но ещё чаще — с нейронными сетями.
Нейронная сеть — математическая или кибернетическая модель биологической нейронной сети (системы соединенных между собой нейронов мозга).
Искусственный нейрон выстроен наподобие биологического нейрона. У него есть входы, каждый вход умножается на заданные веса, полученные значения суммируются, прогоняются через нелинейную функцию и результат подаётся на выход.

Из таких вот единичных искусственных нейронов формируется нейросеть, которая может решать определенную задачу. Внутри нейросети могут быть скрытые слои, и если их больше одного, она уже считается глубокой. И архитектур у искусственных нейросетей — великое множество.
Как обучается искусственный нейрон? Главная задача этого процесса — найти правильные веса. Если мы знаем, что нейрон ошибся на текущих данных и знаем саму ошибку, то можем отправить её обратно по всем входам. А после подкорректировать вес на конкретном входе, чтобы ошибку уменьшить. И так — по всей нейросети.

Ещё пару лет назад для этого приходилось отлично знать математику, уметь обращаться с производными и переобучать нейроны вручную — современные пакеты для работы с нейросетями уже умеют это.


В чем разница между машинным обучением и искусственным интеллектом? Вопрос некорректный, поскольку первое — часть второго.
Искусственный интеллект — любая техника, которая позволяет компьютерам имитировать интеллект человека с использованием логики, правил «если-то», деревьев решений и машинного обучения.
Машинное обучение — подмножество ИИ, включает в себя сложные статистические методы, с помощью которых машины могут выполнять задачи на основе ранее полученного опыта.
Глубокое обучение (есть и такое) — подмножество машинного обучения, где с помощью алгоритмов машины могут обучаться выполнению задач вроде распознавания изображений и речи и снабжать многослойные нейронные сети огромными объёмами данных.
Тренды использования ИИ

1) Рост точности нейросетей.

2) Рост сложности нейросетей.

3) Рост объёмов данных.

4) Рост вычислительных мощностей.
Три волны нейросетей
Первая волна была в 50-е, когда Фрэнк Розенблатт предложил архитектуру перцептрона — первую нейронную сеть, которая умела решать простые задачки. Тогда все решили, что скоро грядет эпоха искусственного интеллекта. Но ничего не получилось, потому что не было ни необходимых мощностей, ни понимания, ни математического аппарата.

Ближе к концу XX века появились первые архитектуры, которые хорошо работали на изображениях и достигали практически человеческой точности по уровню распознавания цифр, букв и — иногда — речи.

А после того, как появилась нейросеть AlexNet, которая на стандартном наборе данных по распознаванию классов изображений показала на порядок лучший результат, чем все предшественники, началась текущая волна развития нейросетей. Главное её отличие от первых двух: сейчас практически во всех областях, где применяются нейросети, результаты их эффективности выше, чем у людей.
Как использовать ИИ
От «оживления» Моны Лизы и Сальвадора Дали до более серьёзных задач: например, YouTube уже 5 лет использует алгоритм рекомендаций, который поспособствовал росту аудитории в 10 раз за это время. А в Alibaba Group на 30% сократили дальность поездок за счёт оптимизации маршрутов доставки с использованием ИИ.
Нейросеть Самсунга может сгенерировать правдоподобную лицевую анимацию на основе 1 кадра
В Филадельфийском музее посетителей встречает «оживший» Сальвадор Дали
В 2018-м уже от 40 до 70% всех рекламных компаний (а реклама — двигатель торговли) уже использовали или планировали использовать ИИ для разных нужд: таргетирования, сегментации аудитории, оптимизации затрат на медиа и так далее.
Исследование, проведенное РАЭК и НИУ ВШЭ при поддержке Microsoft показало, что чаще всего в российских компаниях используют виртуальных помощников — их применяют 38% руководителей и ключевых специалистов. В тройке также прогнозный анализ (35%) и машинное обучение (35%).
Типовые бизнес-задачи, которые ИИ способен решить уже сегодня:
  • кластеризация покупателей;
  • персонализация контента;
  • увеличение чека;
  • удержание на сайте;
  • классификация обращений;
  • предсказание будущего поведения на основе предыдущего опыта;
  • предсказание времени доставки/изготовления заказа.

Если знать, что клиент приносит неплохой доход в течение года, можно потратить на его удержание чуть больше (и даже подстроить сайт под его интересы). И здесь очень пригодится деление клиентов на лояльных/нелояльных, постоянных/разовых, выявление их основных черт (пол, возраст, статус, ссылки, обращения в техподдержку, счётчики, средние показатели за периоды).
Наши кейсы
Классически разработка программного обеспечения — особенно, крупного — использует водопадную модель. Эта же модель, по сути, описана в PMBOK — американском стандарте управления проектами (вплоть до 5-й версии). И в ней программист — узкое звено, которому всегда приходится выполнять больший объём задач, чем аналитику, дизайнеру или тестировщику.

Теория ограничений систем (ТОС) по Голдратту говорит, что нет смысла работать быстрее, чем может работать самое узкое звено. Но тогда вряд ли получится получить осязаемую прибыль — поэтому нужен запас задач.
Программисту в такой ситуации — не очень. Клиентам — тоже, потому что приходится ждать, когда их проект будет готов. А там и до конфликта недалеко.
Поэтому у нас в студии в качестве эксперимента появился собственный инструмент для планирования всего рабочего процесса, построенный на основе нейросети — Автоматизатор. Входами для нейросети служат данные по каждому конкретному специалисту: его компетенции, карма, предпочтения, скорость по разному типу задач. Плюс используется набор данных за 10 лет: с кем работал специалист, по каким задачам, плановое и фактическое время на задачи, а также учитывается текущий график нагрузки (производственный календарь).

При планировании ресурсов на каждый новый проект мы задаем необходимые компетенции, и система предлагает подходящую команду специалистов с учетом личных параметров каждого её члена и общего графика загрузки.
Рекомендации системы при планировании ресурсов на новом проекте
На одном из проектов мы столкнулись с задачей обработки печатных форм. Есть шаблоны документов, которые принято заполнять на бумаге. Например, ставить галочки в соответствующих графах.

Подобные задачи возникают, скажем, при автоматической обработке бюллетеней голосования или банковских форм. В идеале от бумаги можно было бы вообще избавиться (берегите лес!). Но если уж есть причины, по которым нужно иметь твердую копию, можно хотя бы автоматизировать процесс переноса данных с бумаги в электронную систему. В данном случае очень пригодилась технология анализа печатных форм, реализованная нами с помощью библиотеки OpenCV.
Слева — как выглядит распечатанный бланк. Справа — примерно так его видит система после фотографирования смартфоном и загрузки обратно в приложение: понимает, где стоят галочки, крестики, стрелки, и проставляет их автоматически в самом приложении. Основные сложности — геометрия и засветы бумаги, но всё преодолимо.
Инструменты для анализа данных и машинного обучения
Топ-10 инструментов — жестко конкурируют между собой, можно освоить без специфических знаний и навыков в программировании и математике:
  • Google Cloud Atom ML;
  • IBM Whatson Studio;
  • DriverlessAI;
  • RapidMiner;
  • DataRobot;
  • Microsoft Azure ML Studio;
  • BigMl;
  • AutoWeka;
  • ML Jar;
  • Amazon Lex.

Использовать или не использовать искусственный интеллект для бизнеса — кажется, такой вопрос уже не стоит. Важнее то, насколько вы готовы погрузиться в эту задачу и заморочиться с её решением. На пути вас ждут несколько сложностей:

  • подготовка обучающей выборки — нужны данные, МНОГО данных;
  • сложность выбора функции вознаграждения (кнута и пряника) — нужен либо человек, дающий обратную связь нейросети, либо какая-то программа (и программист, соответственно);
  • вычислительные мощности (достаточный объём памяти и ресурсов для хранения и обработки данных);
  • лютая математика — если в мире где-то есть магия, то она в нейросетях!

Собирайте информацию о клиентах и сделках (CRM в помощь), анализируйте её. Пробуйте современные готовые инструменты и не бойтесь экспериментировать — за нейросетями будущее!
Пока что проблем, на самом деле, — хватает. Первая, и основная — не факт, что алгоритмы на нейросетях в принципе решат вашу задачу именно на ваших данных. Заранее это гарантировать невозможно. Поэтому, если есть классический алгоритм решения, — отходить от него нужно с большой осторожностью. Вторая проблема — сами данные: часто они недостаточно аккуратны, их слишком мало и они принадлежат не вам.

Например, Яндекс. Метрика довольно точно (внутри себя) знает пол и предпочтения пользователя, который пришел к вам на сайт. Но вам эти данные никто не отдаст. Рынок бигдаты на данный момент еще не сложился, и, скорее всего, данные в чистом виде вам никто не продаст. Вокруг этого гораздо выгоднее делать сервисы и продавать их по подписке. Поэтому, если есть возможность собирать данные по пользователям, — собирайте. Потом пригодится!

Владимир
Руководитель студии