00. Конспекты от лектора

01. CRISP-DM

Постановка задачи машинного обучения. Место машинного обучения в процессе анализа данных

Общая схема процесса построения модели машинного обучения

Токенизация и очистка текстовых данных

Анализ текстовых данных - нормализация

Счетные модели для векторизации текстов (мешок слов, мешок символов, TF-IDF)

Предиктивные модели для векторизации текстов (word2vec, fasttext, glove)

Графы для анализа текстов и корпусов.

Виды рекомендательных систем

Коллаборативная фильтрация

Матричная факторизация (SVD, ALS)

Линейные методы рекомендаций (SLIM, EASE)

Метрики качества рекомендательных систем

Обучение ранжированию (point-wise, pair-wise)

Основные понятия информационного поиска

Архитектура “трансформер”

Виды LLM

Промпт-инжиниринг. Виды промптов

Способы дообучения LLM