1. Установка и настройка программного обеспечения. Базовый инструментарий работы в Jupyter notebook (4 ак.ч.)
• Принципы организации и управления вычислениями
• Используемые языки программирования и взаимосвязь между ними
• Обзор библиотек и инструментов
• Необходимые пакеты Python: numpy, pandas, matplotlib, seaborn, Jupyter и другие
• Дистрибутив Anaconda, его преимущества и недостатки
• Установка пакетов в Linux
• Установка пакетов в Windows. Возможные проблемы и методы их решения
• Методы и функции
• Основные команды и методы работы в Jupyter notebook
2. Библиотека numpy. Вычислительные задачи. (6 ак.ч.)
• Структура библиотеки
• Типы данных библиотеки numpy
• Векторы и массивы, специальные типы данных
• Понятие массива и его основные характеристики
• Принципы вычислений
• Универсальные функции
• Важнейшие стандартные функции
• Работа с массивами и матрицами
3. Библиотека pandas и анализ данных (6 ак.ч.)
• Объект Series
• Объект DataFrame
• Загрузка данных
• Выгрузка данных
• Чтение и запись данных в формате Excel
• Чтение и запись JSON-файлов
• Загрузка данных из интернета и из базы данных SQL
• Загрузка CSV-файлов из Интернета
• Основы работы с датафреймами
• Организация колонок и строчек
• Создание срезов объекта Series
• Выравнивание данных по меткам индекса
• Выполнение логического отбора
• Переиндексация объекта Series
4. Первичная обработка данных. (8 ак.ч.)
• Сбор данных
• Очистка данных
• Подготовка данных
• Объединение данных
• Сцепление и наложение
• Слияние данных
• Замена значений
• Работа с пропущенными значениями и их заполнение
• Повторы в данных
• Объединение и переформирование данных
5. Статистика и анализ (8 ак.ч.)
• Фильтрация
• Группировка
• Агрегация
• Описательные статистики
• Получение итоговых описательных статистик
• Измерение центральной тенденции: среднее, медиана и мода
• Вычисление дисперсии и стандартного отклонения
• Вычисление ковариации и корреляции
• Распределения
• Разведывательный анализ
• Постановка гипотезы
6. Библиотека matplotlib. Визуализация данных. (4 ак.ч.)
• Основные элементы диаграммы
• Создание диаграммы
• Виды графиков и диаграмм
• Оформление и кастомизация графиков
• Форматы изображений
7. Библиотека seaborn. Наглядная визуализация сложных данных. (4 ак.ч.)
• Виды графиков, их корректное использование и интерпретация
• Принципы хорошей визуализации, основные ошибки при визуализации данных
• График функции
• Гистограмма
• Визуализации отфильтрованных и сгруппированных данных