Машинное обучение
О курсе
Этот курс научит вас использовать самые распространенные инструменты для анализа данных и машинного обучения. После освоения данного курса вы научитесь применять классические модели регрессии и классификации, писать код для обучения и тестирования моделей, вести проекты в области построения интеллектуальных систем.
Программа курса
Название занятия | Методичка | Видео | Слайды | |
---|---|---|---|---|
ML0 Введение в машинное обучение | ||||
Лекция: Основные понятия машинного обучения | Видео | Слайды | ||
Практика: Знакомство с инструментами | Методичка | |||
Практика: Простой анализ данных | Методичка | |||
ML1 Регрессия | ||||
Лекция: Задача регрессии | Видео | Слайды | ||
Практика: Линейная регрессия | Методичка | Видео | ||
Практика: Множественная регрессия | Методичка | Видео | ||
Практика: Регрессия на реальном датасете | Методичка | Видео | ||
ML2 Классификация | ||||
Лекция: Задача классификации | Видео | Слайды | ||
Практика: Логистическая регрессия | Методичка | Видео | ||
Практика: Классификация на реальных данных | Методичка | Видео | ||
ML3 Методы обучения с учителем | ||||
Лекция: Методы обучения с учителем | Видео | Слайды | ||
Практика: Полиномиальные модели | Методичка | Видео | ||
Практика: Метод опорных векторов | Методичка | Видео | ||
Практика: Многослойный перцептрон | Методичка | Видео | ||
Практика: Деревья решений | Методичка | Видео | ||
Практика: Метод К ближайших соседей | Методичка | Видео | ||
Практика: Наивный Байесовский классификатор | Методичка | Видео | ||
Лекция: Метод обратного распространения ошибки | Слайды | |||
ML4 Диагностика моделей машинного обучения | ||||
Лекция: Метрики качества и диагностика моделей | Методичка | Видео | Слайды | |
Практика: Метрики эффективности | Методичка | Видео | ||
Практика: Диагностические кривые | Методичка | |||
Практика: Кросс-валидация | Методичка | |||
Практика: Диагностика недо и переобучения | Методичка | |||
Практика: Оптимизация гиперпараметров | Методичка | |||
ML5 Предобработка данных | ||||
Лекция: Задачи и методы предварительной обработки и очистки данных | Слайды | |||
Практика: Сбор и интеграция данных | Методичка | |||
Практика: Инжиниринг численных признаков | Методичка | |||
Практика: Инжиниринг категориальных признаков | Методичка | |||
Практика: Таргет и отбор признаков | ||||
Практика: Комплексная предобработка данных | Методичка | |||
ML6 Методы обучения без учителя | ||||
Лекция: Задачи и методы обучения без учителя | Методичка | Слайды | ||
Практика: Кластеризация данных | ||||
Практика: Понижение размерности | ||||
ML7 Ансамблирование моделей | ||||
Лекция: Ансамбли моделей | Методичка | Слайды | ||
Практика: Понижение размерности |
Предварительные требования
Для плодотворного изучения данного курса будут необходимы такие навыки:
- Уверенное знание синтаксиса Python
- Знакомство с основными понятиями математической статистики и теории вероятностей
Источники информации
Учебник по началам машинного обучения для начинающих. В книге объясняются теоретические основы классических алгоритмов машинного обучения с примерами на языке программирования Python.
Учебное пособие по дисциплине ‘Машинное обучение’. Сборник лабораторных работ по основам машинного обучения в библиотеке sklearn.
Продолжение пособия по дисциплине ‘Машинное обучение’. Сборник лабораторных работ по основам машинного обучения в библиотеке sklearn.
Основная литература
- Дорожная карта развития специалиста по машинному обучению
- Классический курс от Andrew Ng
- A. Geron. Hand on Machine Learning with scikit-learn and Tensorflow - 2017 (564p)
- Официальная документация библиотеки sklearn
Дополнительная литература
- C. Albon. Machine learning with Python Handbook - 2018 (427p)
- L.P. Coelho, W. Richert. Building machine learning systems with Python - 2015 (326p)
- J. Grus. Data science from scratch - 2015 (330p)
- W. McKiney. Pandas: powerful Python data analysis toolkit - 2016 (1971p)
- Официальная документация библиотеки numpy
- Официальная документация библиотеки pandas
- Официальная документация библиотеки matplotlib
- Официальная документация библиотеки seaborn
- Официальная документация библиотеки yellowbrick
Видео-ресурсы
- Конспекты к курсу Ng
- Материалы к куру Ng на гитхабе
- Pandas tutorial
- Канал Python programmer - много контента по программированию на питоне
- Серия Data analysis от Computerphile
Программное обеспечение
- Python 3 Anaconda
- библиотеки numpy, pandas, matplotlib, scikit-learn
- Tensorflow 2
- PyTorch
Для студентов Финансового университета
Контрольная работа №1. Регрессия
Контрольная работа №2. Классификация
Контрольная работа №3. Диагностика
Методические указания по курсовой работе