Синтаксические (и лексические) анализаторы в современной разработке

Язык Python, его эволюция и использование

Прочие языки
Бэкенд / другое

Доклад принят в программу конференции

Целевая аудитория

Инженеры мидл+.

Тезисы

Доклад про то, почему синтаксические анализаторы (парсеры) не только не теряют свою нишевую актуальность, но и активно растут как область разработки. Какие задачи решаются синтаксическими парсерами, и почему они все чаще и чаще используются в бизнес-задачах. С какими задачами столкнется разработчик при погружении в эту тему, и как не бояться сложностей.

Поделюсь своим опытом работы с синтаксическими парсерами, поговорим про то, какие бывают грамматики, о нюансах разработки и почему неправильно выбранный генератор парсера может поставить весь проект колом.

Доклад про LALR, PEG, LR(1) и другие аббревиатуры, а также практическое использование парсеров в Python — посмотрим на lark, parsimonious, antlr и другие и, конечно же, не забудем ply.

Последние 2,5 года - Руководитель отдела сбора и анализа данных в CodeScoring, строила команду с 0, продолжает успешно развивать и вырастила до 3х направлений и 10 человек - дата-инженерия, ML и ИБ-аналитика. Активно помогает выстраивать здоровые менеджмент-процессы в компании. В управлении только командами разработки - последние 7 лет, до этого более 10 лет работала на разных руководящих позициях в оффлайн-бизнесах.

В свободное от менеджмента времени - Python Engineer с фокусом в дату.
Обычно выступает не с менеджмент-докладами, а техническими - спикер конференций Pycon RU, PiterPy, SmartData, DUMP и других. Раньше баловалось опен сорсом - https://github.com/xnuinside, но сейчас фокус интересов сместился.

CodeScoring

Компания разрабатывает продукт CodeScoring - российское решение для безопасной работы с open source (поиска уязвимостей, блокировка malware, достижимость уязвимостей и многое другое), проверки совместимости лицензий, поиска секретов и оценки качества кода в разрезе команды.

Видео