Hello, LLM! для 4-го курса ФПЛ (2025/2026)

В рамках предмета “Информационный поиск и извлечение данных” в НИУ ВШЭ - Нижний Новгород.

Преподаватели:

Эксперты:

Студенческая исследовательская бригада:

План лабораторных работ:

  1. Лабораторная работа №7. Оценка нейросетевой языковой модели

    1. Дедлайн: 9 февраля

  2. Лабораторная работа №8. Тонкая настройка нейросетевой языковой модели

    1. Дедлайн: 2 марта

История занятий

Дата

Тема лекции

Тема практики. Материалы практики.

12.01.2026

Современные задачи в области NLP. Анонс лабораторной работы.

Создание форка. Загрузка датасета из HuggingFace. Листинг

19.01.2026

Токенизация. Анализ и инференс языковых моделей.

Подготовка датасета. Листинг Перегрузка протоколов датасета. Листинг Анализ PyTorch модели. Листинг. Инференс модели. Листинг.

26.01.2026

Пакетная обработка при инференсе языковых моделей.

Упаковка семплов через DataLoader. Листинг. Инференс генерационной модели. Листинг Инференс NLI модели. Листинг

02.02.2026

Оценка качества модели. Модель как сервис.

Оценка качества модели. Листинг. Модель как сервис. Листинг.

09.02.2026

Тонкая настройка языковых моделей с помощью метода LoRA.

Сдача лабораторной работы №7. Тонкая настройка модели. Листинг

16.02.2026

Ускорение инференса языковых моделей.

Использование GPU. Листинг Конвертация PyTorch модели в ONNX формат. Листинг. Инференс модели с помощью ONNX. Листинг.

02.03.2026

N/A

Сдача лабораторной работы №8.

Более полное содержание пройденных занятий Вы найдете здесь.

Литература

Базовый уровень

  1. HuggingFace NLP Course.

Порядок сдачи и оценивания лабораторной работы

  1. Лабораторная работа допускается к очной сдаче.

  2. Студент объяснил работу программы и показал её в действии.

  3. Студент выполнил задание ментора по некоторой модификации кода.

  4. Студент получает оценку:

    1. Соответствующую ожидаемой, если все шаги выше выполнены и ментор удовлетворён ответом студента.

    2. На балл выше ожидаемой, если все шаги выше выполнены и ментор решает поощрить студента за отличный ответ.

    3. На балл ниже ожидаемой, если лабораторная работа сдана на неделю позже срока сдачи и выполнены критерии в 4.1.

    4. На два балла ниже ожидаемой, если лабораторная работа сдана на две недели позже от срока сдачи и выполнены критерии в 4.1.

Note

Студент может улучшить оценку по лабораторной работе, если после основной сдачи выполнит задания следующего уровня сложности относительно того уровня, на котором выполнялась реализация.

Лабораторная работа допускается к очной сдаче, если она:

  1. Представлена в виде пулл реквеста (Pull Request, PR) с правильно составленным названием по шаблону: Laboratory work #<NUMBER>, <SURNAME> <NAME> - <UNIVERSITY GROUP NAME>.

    1. Пример: Laboratory work #1, Kashchikhin Andrey - 21FPL1.

  2. Имеет заполненный файл settings.json с ожидаемой оценкой. Допустимые значения: 4, 6, 8, 10.

  3. Имеет “зелёный” статус - автоматические проверки качества и стиля кода, соответствующие заданной ожидаемой оценке, удовлетворены.

  4. Имеет лейбл done, выставленный ментором. Означает, что ментор посмотрел код студента и удовлетворён качеством кода.

Ресурсы

  1. Таблица успеваемости

  2. Таблица c моделями и датасетами

  3. Сайт дисциплины

  4. Инструкция по подготовке к прохождению курса на сайте

  5. Инструкция по запуску тестов на сайте

  6. Инструкция по запуску .py файлов в терминале на сайте

  7. Инструкция по обновлению форка на сайте

  8. Ответы на часто задаваемые вопросы на сайте