Физтех.Статистика

Меню

Контакты

Введение в анализ данных



Время: суббота 17:05-20:00. Начало 8 февраля.
Курс проходит очно в поточной аудитории корпуса Арктика.
Кафедра дискретной математики.

Организационная информация будет объявлена на первой лекции.

Полезные ссылки

Занятия

Дата
Занятие
ДЗ
Дата
08.02.25
Занятие
О курсе, DS-поток. Что такое анализ данных. Обзор задач анализа данных на примере историй из Мурмурландии. Метод ближайшего соседа на примере решения задачи классификации на два класса. Примеры реальных задач: АБ-тестирование, распознавание лиц, генерация изображений, синтез речи, обучение с подкреплением.
Дата
22.02.25
Занятие
Обзор применения инструментов ИИ в работе и учебе. Примеры использований, с чем надо быть осторожным. Использование ИИ в курсе, в домашних заданиях. Оформление домашних заданий.
Дата
01.03.25
Занятие
Обучение с учителем: регрессия и классификация. Линейная и логистическая регрессии. Градиентный спуск и стохастический градиентный спуск. Энтропия и кросс-энтропия.
Дата
15.03.25
Занятие
Нейрон. Связь нейрона с линейной регрессией. Полносвязный слой нейронной сети. Однослойные и двухслойные нейронные сети. Теорема Цыбенко. Обучение нейронных сетей. Примеры применения различных нейронных сетей.
Дата
22.03.25
Занятие
Классификация изображений. Стандартное представление изображения. Свёртка, Pooling. Предсказание вероятности. Перенос стиля. Генерация произвольных изображений. Upsampling. GAN. Диффузионные модели. Обзор задач в CV.
ДЗ
Дата
29.03.25
Занятие
Введение в NLP. Кодирование текстов: Bag of Words, Word2Vec. Основные модели: 1D-свертка, RNN, Large Language Models (LLM). Примеры задач.
ДЗ
Дата
05.04.25
Занятие
Задача кластеризации: постановка задачи, особенности, требования к форме кластеров, метрики качества. Метод кластеризации KMeans. Понижение размерности с помощью метода главных компонент (PCA), проклятие размерности.
Дата
12.04.25
Занятие
Гостевая лекция. Профессия аналитика, разбор реального кейса.
ДЗ