Целевая аудитория: Руководители, специалисты (группа от 10 человек)
Длительность курса: 48 ак. часов
Место проведения: Виртуальная школа Сбербанка
Стоимсть: 16 800 руб.
Для совершения покупки необходимо выполнение одного из условий:1) Общая сумма договора – от 50 000 рублей;
2) Количество слушателей – от 10 человек.
Краткое описаниеПрограмма повышения квалификации Корпоративного университета Сбербанка. Программа рассчитана на профильных специалистов, прошедших входное тестирование.
Цели: - Улучшить процессы, требующие интеллектуальной обработки данных
- Познакомить с современными методами интеллектуальной обработки данных (включая методы машинного обучения)
- Сформировать практические навыки работы с инструментами анализа данных и машинного обучения
Результат / навыки
Знания - Постановки задач машинного обучения (classification, regression, clustering)
- Современного инструментария по работе с данными, алгоритмам машинного обучения
- Фундаментальных проблем анализа неполных, гетерогенных данных со сложной структурой или скрытым представлением
- Возможностей и ограничений существующих методов и инструментария машинного обучения
Умения - Работать с предобработкой, анализом и визуализацией данных
- Выбирать отвечающий задаче алгоритм машинного обучения и оценивать его эффективность
- Выбирать метрику качества в соответствии с бизнес-задачей
- Применять полученные знания для анализа реальных данных и бизнес-кейсов
Навыки - Обладание достаточным опытом для решения прикладных задач в области машинного обучения и анализ данных при помощи современных библиотек на языке программирования Python
- Корректно сопоставлять задачи машинного обучения и задачи бизнеса
- Принимать решение по организации процессов работы с данными и оценки постановки задач анализа данных относительно качественных и количественных характеристик данных
Содержание программы - Введение в анализ данных
- Введение в Python, библиотеки numpy, pandas. Статистические возможности Python. Визуализация данных. Сбор данных: скрейпинг (обработка HTML) и работа с открытыми API (JSON). Анализ сетевых структур и распространение информации в социальных сетях
- Модели и методы машинного обучения
- Кластеризация: метод K-средних, обнаружение аномалий, поиск сообществ на графах.
- Регрессия: качество предсказания, Lasso/Ridge регуляризация. Отбор признаков, снижение размерности. Рекомендательные системы
- Модели и методы машинного обучения
- Классификация: метрические методы (kNN), вероятностные (NaiveBayes), логистическая регрессия, деревья решений, случайный лес, метод опорных векторов (SVM), градиентный бустинг и ансамблевые методы
- Обзор проблем: метрики качества, несбалансированные классы, переобучение
- Нейронные сети и обучения представлениям
- Теоретические основы обучения искусственных нейронных сетей. Полносвязные и сверточные нейронные сети. Автоэнкодеры: применение для детектирования фрода. Визуализация внутреннего состояния нейронной сети