Большие языковые модели + словарные описания как способ кодирования слов и фразеологизмов

AI/ML и визуализация данных

Доклад принят в программу конференции

Целевая аудитория

Data Science, ML-, AI-, NLP-специалисты.

Тезисы

Применение эмбеддингов языковых моделей на всём тексте не всегда дает четкое разделение для качественного обучения под другие задачи. Периодически возникают задачи, где нужно сократить лексикон для повышения точности классификации или кластеризации текста, а постоянное дообучение fasttext не всегда возможно, тем более он не работает со словосочетаниями.

Я хочу поделиться иным способом кодирования слов и словосочетаний с помощью больших языковых моделей и словарных описаний слов и фразеологизмов, благодаря которым схожесть слов учитывается не по контексту применения, а по смыслу содержания.

Артур Сапрыкин

ИП Сапрыкин Артур Игоревич

Data scientist, предприниматель, исследователь AI, автор и преподаватель курсов по машинному обучению.

ИП Сапрыкин Артур Игоревич

Разработка моделей, сервисов и технологий искусственного интеллекта. Услуги консалтинга по внедрению в систему организации технологий искусственного интеллекта.

Видео