Машинное обучение
О курсе
Этот курс научит вас использовать самые распространенные инструменты для анализа данных и машинного обучения. После освоения данного курса вы научитесь применять классические модели регрессии и классификации, писать код для обучения и тестирования моделей, вести проекты в области построения интеллектуальных систем.
Программа курса
Название занятия | Методичка | Слайды | ||
---|---|---|---|---|
ML0 Введение в машинное обучение | ||||
Лекция: Основные понятия машинного обучения | Слайды | |||
Практика: Знакомство с инструментами | Методичка | |||
Практика: Простой анализ данных | Методичка | |||
ML1 Регрессия | ||||
Лекция: Задача регрессии | Методичка | Слайды | ||
Практика: Линейная регрессия | Методичка | |||
Практика: Множественная регрессия | Методичка | |||
ML2 Классификация | ||||
Лекция: Задача классификации | Методичка | Слайды | ||
Практика: Логистическая регрессия | Методичка | |||
ML3 Методы обучения с учителем | ||||
Лекция: Методы обучения с учителем | Слайды | |||
Контрольная работа по регрессии | ||||
Практика: Метод опорных векторов | ||||
Практика: Деревья решений | ||||
Практика: Метод К ближайших соседей | ||||
Практика: Наивный Байесовский классификатор | ||||
Контрольная работа по классификации | ||||
ML4 Диагностика моделей машинного обучения | ||||
Лекция: Метрики качества и диагностика моделей | Методичка | Слайды | ||
Практика: Метрики эффективности | ||||
Практика: Модели классификации | Методичка | |||
Практика: Модели регрессии | Методичка | |||
Практика: Диагностические кривые | ||||
Практика: Кросс-валидация | Методичка | |||
Практика: Диагностика недо и переобучения | Методичка | |||
Практика: Оптимизация гиперпараметров | ||||
ML5 Предобработка данных | ||||
Лекция: Задачи и методы предварительной обработки и очистки данных | Слайды | |||
Практика: Сбор и интеграция данных | ||||
Практика: Очистка данных | ||||
Практика: Преобразование шкал | ||||
Практика: Комплексная предобработка данных | Методичка | |||
Практика: Отбор и инжиниринг признаков | ||||
ML6 Методы обучения без учителя | ||||
Лекция: Задачи и методы обучения без учителя | ||||
Практика: Кластеризация данных | ||||
Практика: Обнаружение аномалий | ||||
Практика: Понижение размерности | ||||
ML7 Ансамблирование моделей | ||||
Лекция: Ансамбли моделей | ||||
Практика: Понижение размерности |
Предварительные требования
Для плодотворного изучения данного курса будут необходимы такие навыки:
- Уверенное знание синтаксиса Python
- Знакомство с основными понятиями математической статистики и теории вероятностей
Источники информации
Основная литература
- Дорожная карта развития специалиста по машинному обучению
- Классический курс от Andrew Ng
- A. Geron. Hand on Machine Learning with scikit-learn and Tensorflow - 2017 (564p)
- Официальная документация библиотеки sklearn
Дополнительная литература
- C. Albon. Machine learning with Python Handbook - 2018 (427p)
- L.P. Coelho, W. Richert. Building machine learning systems with Python - 2015 (326p)
- J. Grus. Data science from scratch - 2015 (330p)
- W. McKiney. Pandas: powerful Python data analysis toolkit - 2016 (1971p)
- М.В. Коротеев. Учебное пособие по дисциплине “Анализ данных и машинное обучение” - 2018.
- Официальная документация библиотеки numpy
- Официальная документация библиотеки pandas
- Официальная документация библиотеки matplotlib
- Официальная документация библиотеки seaborn
- Официальная документация библиотеки yellowbrick
Видео-ресурсы
- Конспекты к курсу Ng
- Материалы к куру Ngна гитхабе
- Pandas tutorial
- Канал Python programmer - много контента по программированию на питоне
- Серия Data analysis от Computerphile
Программное обеспечение
- Python 3 Anaconda
- библиотеки numpy, pandas, matplotlib, scikit-learn
- Tensorflow 2
- PyTorch
Для студентов Финансового университета
Методические указания по составлению тестовых заданий