Машинное обучение. Классическое
Бесплатный развивающий проект «ШИФТ Интенсив» помогает начинающим IT-специалистам из Сибирских вузов прокачать свои навыки, стать востребованными специалистами и получить работу. В формате интенсива во время каникул участники погружаются в ИТ, посещают лекции и мастер-классы от практикующих экспертов, реализуют собственный проект и узнают о работе в крупной компании при поддержке опытных кураторов.
Чему научитесь
Этот интенсив создан для начинающих — людей, которые хотят сделать первые осмысленные шаги в машинном обучении и Data Science. Если ты слышал об ML, но не знал, с чего начать, чтобы получить готовый результат, тебе точно к нам. Цель интенсива — за короткое время погрузиться в полный цикл задачи Data Science: от первичного анализа данных до развёртывания работающей модели в виде простого веб-приложения, которым можно поделиться с друзьями.
- Каждый участник создаст собственное веб-приложение (например, «Калькулятор стоимости автомобиля» или «Определитель музыкального жанра»), которое будет делать предсказания на основе обученной ML-модели.
Для участия нужно
Базовые навыки работы с Python
Математические основы (градиент, производная, матрицы, линейная алгебра)
Формат работы
- Вводные лекции по каждому модулю
- Экспертные консультации: наставники помогут разобраться со сложностями в коде и подскажут направление для решения
- Практическое соревнование: настоящий боевой опыт в контролируемых условиях
- Знакомство с основными понятиями и типами задач машинного обучения.
- Практический инструктаж: учимся работать с данными соревнований и правильно загружать свои результаты (сабмиты).
- Ответы на все организационные вопросы. Старт работы над кейсом.Практический инструктаж: учимся работать с данными соревнований и правильно загружать свои результаты (сабмиты).
- Ответы на все организационные вопросы. Старт работы над кейсом.
- Используем Pandas для первичного анализа: загрузка, оценка размера и типов данных, поиск аномалий и пропусков.
- Визуализация и статистика для понимания распределений и взаимосвязей между признаками.
- Превращаем сырые данные в осмысленную информацию для будущей модели.Визуализация и статистика для понимания распределений и взаимосвязей между признаками.
- Превращаем сырые данные в осмысленную информацию для будущей модели.
- От простого к сложному: изучаем логику работы линейной и логистической регрессии — идеальная точка входа в ML.
- Переходим к более мощным алгоритмам: знакомимся с ансамблевыми методами, включая бустинги (CatBoost/XGBoost/LightGBM).
- Учимся не просто тренировать модели, а правильно их оценивать и сравнивать между собой.
- Техники создания новых признаков, которые повышают точность модели.
- Методы отбора самых информативных переменных: избавляемся от шума и ускоряем обучение.
- Учимся готовить идеальный набор данных для финальной модели.
- Сохраняем обученную модель для дальнейшего использования.
- Осваиваем процесс инференса — как модель делает предсказания на новых данных.
- Практикуемся на примере создания простого веб-интерфейса для нашей модели.
Завершение интенсива
За день до закрытия Интенсива состоится онлайн-встреча, где всем участникам предстоит презентовать свои проекты. Лучшие работы и их авторы будут представлять направление ML CL офлайн на закрытии Интенсива в Томске и Новосибирске.
Где, когда
Начальный: достаточно уметь работать с виртуальным окружением и читать CSV.
Получи комплексные знания в рамках выбранного направления и начни карьеру в ИТ
Работай над реальными проектами под руководством опытных наставников