На курсе слушатели познакомятся с тем, какие задачи можно решать с помощью машинного обучения, как проводить предобработку данных и строить модели машинного обучения.
Курс поможет в прохождении несложных собеседований.
Формат курса: продолжительность 7,5 недель, по два занятия в неделю по 3 ак. ч.
Аудитория курса:
Курс подойдёт для начинающих специалистов интересующихся машинным обучением и анализом данных.
Курс состоит из 15 занятий , каждое занятие по 3 ак. часа.
Анализ данных и машинное обучение (10 занятий):
- Основы питона (списки, словари, множества, строки и т. д.)
- Основы ООП (наследование, инкапсуляция, полиморфизм), best practice при написании кода
- Pandas, работа с DataFrame, срезы данных по условию, объединение таблиц (.join, merge(), concat())
- Типы задач машинного обучения (обучение с учителем, обучение без учителя). Решаемые с помощью машинного обучения задачи (классификация — бинарная и многоклассовая, кластеризация, регрессия, прогнозирование). Линейная регрессия. Метрики для оценки качества регрессии.
- Логистическая регрессия, метод опорных векторов, метод knn. Метрки для оценки качества решения задачи классификации.
- Модели используемые для решения задачи кластеризации: kmeans, DBSCAN, иерархическая кластеризация. Метрики для оценки качества кластеризации.
- Деревья решений и их ансамбли. Случайный лес и бустинги (Catboost, XGBoost, LightGBM)
- Временные ряды, свойства временных рядов. Авторегрессионные модели (AR, MA, ARMA, ARIMA, SARIMA и т. д.), модель GARCH, бустинги для прогнозирования временных рядов.
- Понятие искусственного нейрона. Полносвязные нейронные сети. Свёрточные нейронные сети (LeNet, VGG, ResNet, GoogleNet и некоторые другие).
- Работа с текстом. “Мешок слов” (Bag of Words). Токенизация, лемматизация и стемминг. BERT. Здадачи решаемые с помощью NLP.
Визуализация данных (библиотеки matplotlib, seaborn, plotly и дашборды) (3 занятия)
- Обзор библиотек matplotlib, seaborn
- Рассмотрение возможностей библиотеки plotly
- Построение дашбордов (plotly + Dash)
Инструменты вывода моделей в прод.(2 занятия)
- Обзор ML-flow
- Streamlit для разработки web-приложений для ML-моделей.