Большие языковые модели + словарные описания как способ кодирования слов и фразеологизмов

AI/ML и визуализация данных

20 мая, 15:00, Зал «Moscow Python Conf++»

Google Outlook Apple

Доклад принят в программу конференции

Целевая аудитория

Data Science, ML-, AI-, NLP-специалисты.

Тезисы

Применение эмбеддингов языковых моделей на всём тексте не всегда дает четкое разделение для качественного обучения под другие задачи. Периодически возникают задачи, где нужно сократить лексикон для повышения точности классификации или кластеризации текста, а постоянное дообучение fasttext не всегда возможно, тем более он не работает со словосочетаниями.

Я хочу поделиться иным способом кодирования слов и словосочетаний с помощью больших языковых моделей и словарных описаний слов и фразеологизмов, благодаря которым схожесть слов учитывается не по контексту применения, а по смыслу содержания.

Артур Сапрыкин

Команда Артура Сапрыкина

Предприниматель, основатель студии разработки "Команда Артура Сапрыкина", исследователь AI, автор и преподаватель курсов по машинному обучению.

Команда Артура Сапрыкина

Разработка моделей, сервисов и технологий искусственного интеллекта. Услуги консалтинга по внедрению в систему организации технологий искусственного интеллекта.