Физтех.Статистика

Меню

Контакты

для студентов · МФТИ

DS-поток — чтобы уметь решать, а не угадывать

Большинство программ по Data Science либо чисто теоретические, либо прикладные под тренды. DS-поток — это связка теории с практикой: здесь изучаются разные подходы, решаются задачи на каждую тему и формируется фундамент, который не ломается со временем.

Нагрузка высокая — да. Зато на выходе появляется навык широко мыслить и находить нестандартные решения.

Для кого и какие знания нужны

Про требования на входе и кому будет комфортно учиться на DS-потоке.
для кого
  • Студенты МФТИ от 3 курса, которым интересен анализ данных, машинное, глубокое обучение и работа с реальными задачами.
  • Те, кто готов к высокой учебной нагрузке и системной работе в течение семестра.
  • Те, кто хочет не просто «освоить инструменты», а понять, как и почему работают методы.
  • Студенты, планирующие дальнейшее развитие в DS, ML, аналитике или смежных направлениях.
какие знания предполагаются
  • Базовая математика на уровне 1–2 курсов ФПМИ.
  • Теория вероятностей и понимание базовых статистических понятий.
  • Курс «Введение в анализ данных» или «Phystech@DataScience».
  • Уверенное владение Python на уровне написания функций, работы с библиотеками и простого анализа данных.

Почему DS-поток?

Теория vs практика??? Мы нашли баланс.
главный тезис

DS-поток — это про системность: понимание того, почему метод работает, где заканчивается область его применимости и как корректно использовать его на реальных данных — от теорем и доказательств до практики и анализа ошибок.

  • разбор теории: формулировки, предположения и доказательства ключевых утверждений
  • переход от теорем к методам и алгоритмам, построенным на них
  • практика на синтетических данных для понимания поведения метода
  • применение на реальных данных и обсуждение типичных подводных камней

Глубокая теория

Фундамент, который не устаревает: статистика, модели, постановка.

SOTA-практика

Современные методы и проверка гипотез на данных — регулярно.

Рост и карьера

Умение доводить задачу до результата и объяснять решения.

Чем DS-поток отличается

Про посыл: не модно, не круто — а фундамент + практика + широта.
формула
  • В меру глубокая теория, всегда в связке с практикой
  • Разные подходы в анализе данных — от базовых до современных
  • Широкий круг задач и практические задания на каждую тему
  • Высокие нагрузки, которые конвертируются в результат
почему это важно

Обычно программы делятся на две крайности: фаршированный гусь теории или прикладное под сейчас. DS-поток — это третья опция.

Согласованные линейки статистики, ML и DL — чтобы оно складывалось в систему.

ML или аналитика?

И то, и другое — и главное: как их совмещать в одном решении.
Не только "DL"Для узкой специализации есть курсы. Здесь — фундамент и широта.
Сильный специалистразвит во всех скилах, но с доминирующими — DS-поток помогает это выстроить.
Пересечение областейстроить сложную ML-модель и прикручивать продвинутую аналитику.

План обучения

4 семестра — от базы к продвинутым темам. Ниже — укрупнённо, по фактам.
5 семестрфундамент

В этом семестре собрана база, которой должен владеть сильный специалист: статистика, классические модели, деревья/бустинг и нейросети, плюс погружение в CV и NLP.

  • оценки параметров, робастность, теория наилучших оценок
  • проверка статистических гипотез (включая современные подходы)
  • линейные модели, валидация
  • случайный лес и градиентный бустинг (с разбором пакетов)
  • нейросети на PyTorch; CV; NLP
6 семестрприкладной уровень

Последовательные данные и прикладная статистика, которые логично дополняют друг друга. Много практики, но теория остаётся.

  • трансформеры в NLP и CV; техники обучения больших языковых моделей
  • современное A/B: снижение дисперсии, ratio-метрики
  • causal inference и uplift-моделирование
  • временные ряды, случайные процессы, последовательный анализ
  • байесовский подход, байесовское A/B, MCMC
7–8 семестрadvanced

Продвинутые методы и прикладные задачи: байесовские подходы, генеративные модели, RL, ранжирование, нестандартные темы на стыке направлений.

  • EM-алгоритм, вариационный вывод, Pyro, байесовские нейросети
  • генеративные модели: VAE, GAN, диффузии
  • речь, сиамские сети, хаки в нейросетях
  • обучение с подкреплением
  • рекомендательные системы и learning-to-rank

Цифры, чтобы понимать масштаб

за 4 семестра
120+
домашних заданий за всю траекторию — чтобы реально научиться решать
Это не «послушал лекции» — это постоянная практика + разбор ошибок.
100+
вопросов в боте за семестр
закрепляем темы до автоматизма
50
научных статей
разобраны студентами за время обучения
15
командных проектов
на реальных (или почти реальных) задачах
TOP-компании
где работают наши выпускники
Яндекс · T-Банк · Сбер · X5 · Авито
стало страшно от чисел?

Эти цифры про нагрузку и темп — входной уровень здесь не является решающим. При готовности учиться и работать результат обязательно придет!

Выпускники и студенты — про DS-поток

отзывы

«без шуток, впервые за время обучения на физтехе могу сказать, что нормально поняла и выучила предметы благодаря формату обучения и подаче материала!!»

Вероника Прохорова
Вероника Прохорова
студентка DS-потока, 4 курс

«На DS-потоке многие темы я именно понял, а не просто выучил формулировки. Науки о данных ты начинаешь "чувствовать", поэтому их становится легче применять на практике.»

Максим Иванов
Максим Иванов
студент DS-потока, 4 курс

«Самое ценное на DS-потоке – регулярные практические задания, постоянный индивидуальный фидбек, возможность исправлять свои ошибки»

ЛТ
Лидия Троешестова
выпускница DS-потока, студентка магистратуры ШАД + МФТИ
Скоро добавим больше отзывов!

FAQ

Самые частые вопросы — коротко.