 |
|
 |
 |
Курсы Big Data Science
|
|
Курс: BD-AM Аналитика больших данных для руководителей
(Big Data Analytics for Managers)
Ориентирован: на руководителей, менеджеров и специалистов, желающих получить дополнительные знания по инструментам и методам анализа больших данных для участия в проектах больших данных.
Предварительный уровень подготовки:
не требуется
Продолжительность: 3 дня, 24 академических часа.
Методические материалы: учебное пособие на русском языке.
Документ об окончании курса: свидетельство учебного центра Микроинформ.
Квалификационный тест: нет.
Данный курс предоставляет базовые знания необходимые для участия в проектах по анализу больших данных. Включает информацию о фазах жизненного цикла процессов аналитики больших данных при переходе бизнеса к использованию Big Data. Материал курса обеспечивает слушателей знанием базовых и расширенных аналитических методов и техник, применяемых для поиска и извлечения знаний из больших массивов разнородных данных. В процессе обучения сравниваются различные дистрибутивы платформы Hadoop, "open source" и коммерческие инструменты, используемые для хранения, обработки и аналитики больших данных.
Программа курса
- Введение в Big Data (Большие данные)
- Большие данные и цифровая трансформация
- Методы аналитики больших данных
- Отраслевая специфика аналитики больших данных
- Жизненный цикл аналитики данных: Получение данных, подготовка данных, планирование модели, построение модели, проверка результатов, внедрение
- Data Mining - извлечение знаний из больших данных
- Задачи Data Mining
- Техники Data Mining
- Классификация и кластеризация
- Прогнозирование и визуализация
- Ассоциативные правила и обнаружение аномалий
- Методология CRISP-DM
- Инструменты Data Mining
- Специфика применения Data Mining для разных отраслей бизнеса с примерами
- Машинное обучение для Data mining
- Основные определения
- Задачи и область применения машинного обучения
- Supervised/unsupervised машинное обучение
- Инструменты и технологии машинного обучения
- Data mining в социальных сетях
- Введение в анализ социальных сетей и теорию графов
- Базовые алгоритмы на графах и основные возможности графового анализа
- Феномен маленького мира
- Выделение важных узлов в социальных сетях
- Инструменты и методы визуализации графов для применения в бизнесе
- Инструментарий для работы с Big Data
- Специфика работы с Big Data
- Аналитика для неструктурированных данных - Hadoop и MapReduce
- Компоненты экосистемы Apache Hadoop для хранения и обработки Big Data (MapReduce, HDFS, YARN, Spark, HBase, и т.д.)
- Функционал и особенности MapReduce
- Введение в Apache Spark
- Сравнительный анализ Hadoop дистрибутивов и инструментария аналитика данных на примерах использования
- Средства визуализации для аналитики данных
- Интеграция Больших данных
- Основные принципы работы с Big Data
- Импорт и экспорт данных с Hadoop (SQL, NoSQL, HDFS, NFS, потоковые данные, web content, файлы логов, социальные сети)
- Пакетная и динамическая загрузка данных
- Правовые аспекты организации защиты персональных данных
- Правовое регулирование в области защиты персональных данных
- Международная практика в области защиты персональных данных
- Права субъекта и обязанности оператора при обработке персональных данных
- Виды нарушений безопасности персональных данных
- С чего начать?
- Формирование команды проекта Big Data. Ключевые роли
- Специфика рынка данных и аналитики
- Отличия подходов Business Intelligence и Data Science
- Сравнительные характеристики программных и аппаратных решений для реализации решений по Big Data.
|