23 сентября 2018

Машинное обучение на Moscow Python Conf++

Jupyter и PySpark на Hadoop для анализа больших данных

Каждый data scientist хочет проверять свои гипотезы быстро. Хорошо, если это простые гипотезы, например, достаточно ли данных и корректны ли они. А что, если нужно применить сложную самописную функцию к большому количеству объектов? К тому же, все задачи необходимо решать на продакшн-кластере, на котором работают еще человек 50.

Руководитель отдела машинного обучения ЦИАН Павел Тарасов расскажет, как действительно быстро проверять сложные гипотезы на Jupyter и PySpark, какими дополнительными инструментами пользоваться и как не подраться с продом и коллегами за ресурсы.

Theory of Neural Networks

Beau Carnes имеет огромный опыт преподавания на IT-темы и сейчас готовит новый курс по глубокому обучению. В первой части доклада затронем базовые понятия: обучение с учителем и без; нейронные сети для прогнозирования; градиентный спуск. Обсудим, чем методы глубокого обучения отличаются от традиционных методов машинного обучения, и разберемся с ними, не ограничиваясь рамками фреймворков.

Во второй части выступления нас ждет live-coding в Jupyter Notebook. Бо прямо на ходу создаст нейронную сеть, а мы сможем проследить и разобраться в каждом шаге.

Python Virtual Assistant

Олег Пличко из Leadza.ai обещает наглядно продемонстрировать, что можно создать чат-бота с искусственным интеллектом, используя распространенные инструменты среднего уровня освоения. Если же говорить о конкретных технологиях, то из доклада узнаем:

  • как быстро разработать чат-бот для Facebook Messenger, используя Django;
  • в чем отличие topic-led discussion и task-led pathflow;
  • как обучить RNN (Tensorflow) для распознавания сообщений от пользователя и отправки ответов;
  • как, используя Celery, обрабатывать сложные запросы в фоновом режиме, и почему пользователи ботов готовы ждать в отличие от пользователей веб-сайтов.

Подумаем, как сделать своего виртуального ассистента действительно полезным, и увидим пример одного очень интересного чат-бота, который многим из нас может пригодиться в будущем.

Система ML-моделирования финансовых показателей

Когда речь идет об автоматизации ML-моделей, чаще всего имеется в виду Jupyter и какая-то среда вокруг него. Это удобно для data scientist’ов, но не годится для кредитных аналитиков в банке.

Доклад Олега Мангутова (Deloitte Analytics Insitute) не столько про сами модели, сколько про реализацию системы моделирования для конечного пользователя, далёкого от Jupyter. Причем, отличий хватает и в архитектуре проекта — в системе нет Redis, Kafka, Docker, вот этого всего модного и современного. Но доклад покажет, что можно внедрить систему машинного обучения в среду, где в ходу Oracle и SOAP, да так, что ей сможет пользоваться обычный бизнес-пользователь. Инструмент для этого — удобный UI, а не ячейки Jupyter Notebook.

Присоединяйтесь

Посмотрите на список принятых докладов и спешите забронировать билеты. Moscow Python Conf++ всего через месяц, 22 и 23 октября в Москве. Будут все самые классные Python-программисты — кроме пользы от самих докладов, можно будет завести массу полезных знакомств.

Заглядывайте на страничку конференции в facebook, там можно проследить за работой Программного комитета и больше узнать о подготовке к конференции.