«без шуток, впервые за время обучения на физ техе могу сказать, что нормально поняла и выучила предметы благодаря формату обучения и подаче материала!!»
Большинство программ по Data Science либо чисто теоретические, либо прикладные под тренды. DS-поток — это связка теории с практикой: здесь изучаются разные подходы, решаются задачи на каждую тему и формируется фундамент, который не ломается со временем.
Нагрузка высокая — да. Зато на выходе появляется навык широко мыслить и находить нестандартные решения.
Базовое условие: учиться в бакалавриате МФТИ.
После очередного семестра можно отказаться от дальнейшего прохождения программы.
DS-поток — это про системность: мы опираемся на сильный физтеховский фундамент, не боимся сложной математики и выстраиваем не узкий мостик между теорией и практикой, а целостную картину: от доказательств и ограничений метода до его устойчивого применения на реальных данных.
Фундамент, который не устаревает: статистика, модели, постановка задач и математическая оптика на методы.
От A/B и CI до ADL, генеративных моделей и распределённого обучения — без застревания в старом учебном каноне.
Мы не рассказываем темы «просто так»: по каждой теме есть домашние задания, разбор ошибок и доработка решений.
Обычно программы делятся на две крайности: фаршированный гусь теории или прикладное под сейчас. DS-поток — это третья опция.
Согласованные линейки статистики, ML и DL — чтобы оно складывалось в систему.
В 5 семестр е закладывается база: сильная статистика и системное машинное обучение с выходом в CV и NLP.
В 6 семестре появляются целостные продвинутые блоки по современным направлениям Data Science и аналитики.
трансформеры в NLP и CV; техники обучения больших языковых моделей; визуально-языковые модели; Retrieval Augmented Generation; распределённое обучение; профилирование и оптимизация нейросетей; графовые нейросети
современное A/B-тестирование, обучение критериев, понижение дисперсии, ratio-метрики, многовыборочные тесты. Aboba
графовые модели, теория и практика propensity score, модели при жёстких ограничениях, uplift-моделирование
временные ряды: классические и современные нейросетевые подходы, случайные процессы, последовательный анализ
байесовский подход к статистике, теория и практика методов MCMC, байесовские A/B-тесты, байесовская оптимизация
В 7–8 семестрах добавляются продвинутые вероятностные и генеративные модели, RL, ranking и retrieval, а также собственные проекты и исследовательская практика.
EM-алгоритм, вариационный вывод и его приложения, теория и практика Pyro, байесовские нейросети
VAE, GAN, диффузионные модели, теория диффузионных моделей
Эти цифры про нагрузку и темп — входной уровень здесь не является решающим. При готовности учиться и работать результат обязательно придет!
«без шуток, впервые за время обучения на физ техе могу сказать, что нормально поняла и выучила предметы благодаря формату обучения и подаче материала!!»
«На DS-потоке многие темы я именно понял, а не просто выучил формулировки. Науки о данных ты начинаешь "чувствовать", поэтому их становится легче применять на практике.»
«Самое ценное на DS-потоке – регулярные практические задания, постоянный индивидуальный фидбек, возможность исправлять свои ошибки»