Краткий конспект лекций
Лекция 1. Современные задачи в области NLP
Знакомство с преподавателем. Общая структура курса. Формирование итоговой оценки. Основные идеи,
закладываемые в курс. Место курса в
образовательной программе. Структура лабораторной работы. LLM
. Типовые задачи NLP
, решаемые
с помощью нейросетевых моделей. Жизненный цикл модели: предобучение (pre-training
),
инференс, тонкая настройка (дообучение, fine-tuning
), инференс.
Лекция 2. Датасеты в экосистеме HuggingFace.
Экосистема HuggingFace. Поиск подходящего датасета. Ключевые характеристики датасета: имя,
вложенные датасеты, названия сплитов и их количество, количество колонок, их структура и
необходимость при замере метрики. Установка необходимых библиотек. Скачивание датасета с помощью
load_dataset
. Получение необходимого сплита. Перевод в формат DataFrame
. Основные
задачи при обработке табличных значений. Перегрузка протоколов в пользовательских классах
для поддержки поведения стандартных типов: итерируемость и взятие длины.
Лекция 3. Инференс языковых моделей.
Структура языковой модели. Препроцессинг датасета. Токенизация входа. Инференс модели через вызов как функции. Постпроцессинг результатов модели. Классификация: взятие индекса логита с максимальным значением.
Лекция 4. Пакетная обработка и загрузка примеров при инференсе языковых моделей
Инференс генерационной модели. Связь с выходом классификационной модели.
Паралелельная обработка нескольких семплов: мотивация и технические особенности. Сценарии
использования нейронной сети: ориентация на пропускную способность или на задержку. Ограничения
пакетной обработки. Выравнивание длин семплов в батче через padding
и truncation
.
Упаковка семплов в батч с помощью DataLoader
.
Лекция 5. Оценка качества работы языковых моделей и улучшение качества
Автоматические метрики качества. Библиотека evaluate
. Модель как сервис: мотивация и
технические особенности реализации. Сервер. Конечные точки сервиса
(endpoint
).
Лекция 6. Тонкая настройка языковых моделей с помощью метода LoRA
Тонкая настройка модели (fine-tuning
). Задачи тонкой настройки. Методы тонкой настройки
больших языковых моделей. Основные идеи метода LoRA
.
Библиотека PEFT. Сценарий тонкой настройки
языковой модели.