«без шуток, впервые за время обучения на физтехе могу сказать, что нормально поняла и выучила предметы благодаря формату обучения и подаче материала!!»
Большинство программ по Data Science либо чисто теоретические, либо прикладные под тренды. DS-поток — это связка теории с практикой: здесь изучаются разные подходы, решаются задачи на каждую тему и формируется фундамент, который не ломается со временем.
Нагрузка высокая — да. Зато на выходе появляется навык широко мыслить и находить нестандартные решения.
Базовое условие: учиться в бакалавриате МФТИ.
После очередного семестра можно отказаться от дальнейшего прохождения программы.
DS-поток — это про системность: мы опираемся на сильный физтеховский фундамент, не боимся сложной математики и выстраиваем не узкий мостик между теорией и практикой, а целостную картину: от доказательств и ограничений метода до его устойчивого применения на реальных данных.
Здесь учатся широко мыслить, искать нестандартные подходы там, где шаблонов уже недостаточно.
Это фундамент, который не устаревает: по полной используем физтеховскую теоретическую базу и разбираем не только формулы, но и предположения, доказательства и аккуратные выводы.
Темы подбираются не потому, что так принято, а потому что они полезны в современной практике и/или науке. Программа регулярно обновляется, когда меняется реальный ландшафт Data Science.
По каждой теме есть домашние задания, разбор ошибок и доработка решений, поэтому студенты не просто слушают материал, а обязательно пробуют его руками.
Нагрузка здесь конвертируется в результат, выносливость и способность выдерживать большой рабочий темп.
В 5 семестре закладывается база: сильная статистика и системное машинное обучение с выходом в CV и NLP.
В 6 семестре появляются целостные продвинутые блоки по современным направлениям Data Science и аналитики.
трансформеры в NLP и CV; техники обучения больших языковых моделей; визуально-языковые модели; Retrieval Augmented Generation; распределённое обучение; профилирование и оптимизация нейросетей; графовые нейросети
современное A/B-тестирование, обучение критериев, понижение дисперсии, ratio-метрики, многовыборочные тесты. Aboba
графовые модели, теория и практика propensity score, модели при жёстких ограничениях, uplift-моделирование
временные ряды: классические и современные нейросетевые подходы, случайные процессы, последовательный анализ
байесовский подход к статистике, теория и практика методов MCMC, байесовские A/B-тесты, байесовская оптимизация
В 7–8 семестрах добавляются продвинутые вероятностные и генеративные модели, RL, ranking и retrieval, а также собственные проекты и исследовательская практика.
EM-алгоритм, вариационный вывод и его приложения, теория и практика Pyro, байесовские нейросети
VAE, GAN, диффузионные модели, теория диффузионных моделей
Эти цифры про нагрузку и темп — входной уровень здесь не является решающим.
При готовности учиться и работать результат обязательно придет!
«без шуток, впервые за время обучения на физтехе могу сказать, что нормально поняла и выучила предметы благодаря формату обучения и подаче материала!!»
«На DS-потоке многие темы я именно понял, а не просто выучил формулировки. Науки о данных ты начинаешь "чувствовать", поэтому их становится легче применять на практике.»
«Самое ценное на DS-потоке - регулярные практические задания, постоянный индивидуальный фидб ек, возможность исправлять свои ошибки»
«У тебя выстраивается более менее целостная картина мира, и лично у меня возникло восхищение красотой математики во всех ее проявлениях, особенно в приложениях (которые и освещаются на DS-потоке).»
«Благодаря регулярным домашкам и валидациям у тебя просто нет шансов не разобраться в предмете за семестр. Также очень нравится, что есть много разноплановых задач: и теоретических, и практических. Получается посмотреть на предмет со всех сторон.»