Извлечение метрик из новостей, или Как мы автоматизировали работу аналитиков безопасности

AI/ML и визуализация данных

Python
ML
Инфобезопасность

Доклад принят в программу конференции

Целевая аудитория

Data-инженеры, ML-инженеры, Data Science-специалисты.

Тезисы

Есть такая задача — анализировать новости, связанные с инцидентами в ИБ. Специалисты, которые этим занимаются, собирают списки новостей и выделяют метрики из текста. Например, кто злоумышленник, когда произошел инцидент, какие последствия или сумма ущерба и др.

Сейчас 1 аналитик тратит 5-6 недель на обработку 700 новостей в квартал. Некоторые метрики явно есть в тексте, а некоторые можно определить только по контексту.

В докладе мы бы хотели рассказать, как мы сделали сервис, который облегчил рутинную работу аналитиков, и как мы вообще решали задачу извлечения метрик из новостей с помощью ML и не только. Разработанный сервис идентифицирует, классифицирует и извлекает наиболее важные фрагменты информации об инцидентах из неструктурированного текста, не требуя трудоемкого человеческого анализа.

Алсу Нурутдинова

Positive Technologies

Алсу является специалистом в области машинного обучения.
Занимается задачами детектирования атак, поиском аномалий, NLP.
Является кандидатом физико-математических наук, участником научных и практических конференций, например Data Fest Siberia (2022).

Positive Technologies

.
Игорь Кабанов

Positive Technologies

Специализируется на детектировании вредоносного ПО с помощью техник ML.
Участник практических конференций, например Data Fest Siberia (2022).

Positive Technologies

.

Видео