00. Конспекты от лектора
01. CRISP-DM
Постановка задачи машинного обучения. Место машинного обучения в процессе анализа данных
Общая схема процесса построения модели машинного обучения
Токенизация и очистка текстовых данных
Анализ текстовых данных - нормализация
Счетные модели для векторизации текстов (мешок слов, мешок символов, TF-IDF)
Предиктивные модели для векторизации текстов (word2vec, fasttext, glove)
Графы для анализа текстов и корпусов.
Виды рекомендательных систем
Коллаборативная фильтрация
Матричная факторизация (SVD, ALS)
Линейные методы рекомендаций (SLIM, EASE)
Метрики качества рекомендательных систем
Обучение ранжированию (point-wise, pair-wise)
Основные понятия информационного поиска
Архитектура “трансформер”
Виды LLM
Промпт-инжиниринг. Виды промптов
Способы дообучения LLM