На первую страницу Курсы для специалистов Школа Web-мастеров ИТ сервис-менеджмент и управление проектами  

Курсы Big Data Science

Микроинформ логотип

Курсы Big Data Science в Микроинформ

 Курс: BD-AM Аналитика больших данных для руководителей
(Big Data Analytics for Managers)

Ориентирован: на руководителей, менеджеров и специалистов, желающих получить дополнительные знания по инструментам и методам анализа больших данных для участия в проектах больших данных.
Предварительный уровень подготовки: не требуется

Продолжительность: 3 дня, 24 академических часа.
Методические материалы: учебное пособие на русском языке.
Документ об окончании курса: свидетельство учебного центра Микроинформ.
Квалификационный тест: нет.

Данный курс предоставляет базовые знания необходимые для участия в проектах по анализу больших данных. Включает информацию о фазах жизненного цикла процессов аналитики больших данных при переходе бизнеса к использованию Big Data. Материал курса обеспечивает слушателей знанием базовых и расширенных аналитических методов и техник, применяемых для поиска и извлечения знаний из больших массивов разнородных данных. В процессе обучения сравниваются различные дистрибутивы платформы Hadoop, "open source" и коммерческие инструменты, используемые для хранения, обработки и аналитики больших данных.

Программа курса

  1. Введение в Big Data (Большие данные)
    • Большие данные и цифровая трансформация
    • Методы аналитики больших данных
    • Отраслевая специфика аналитики больших данных
    • Жизненный цикл аналитики данных: Получение данных, подготовка данных, планирование модели, построение модели, проверка результатов, внедрение
  2. Data Mining  - извлечение знаний из больших данных
    • Задачи Data Mining
    • Техники Data Mining
    • Классификация и кластеризация
    • Прогнозирование и визуализация
    • Ассоциативные правила и обнаружение аномалий
    • Методология CRISP-DM
    • Инструменты Data Mining
    • Специфика применения Data Mining для разных отраслей бизнеса с примерами
  3. Машинное обучение для Data mining
    • Основные определения
    • Задачи и область применения машинного обучения
    • Supervised/unsupervised машинное обучение
    • Инструменты и технологии машинного обучения
  4. Data mining в социальных сетях
    • Введение в анализ социальных сетей и теорию графов
    • Базовые алгоритмы на графах и основные возможности графового анализа
    • Феномен маленького мира
    • Выделение важных узлов в социальных сетях
    • Инструменты и методы визуализации графов для применения в бизнесе
  5. Инструментарий для работы с Big Data
    • Специфика работы с Big Data
    • Аналитика для неструктурированных данных - Hadoop и MapReduce
    • Компоненты экосистемы Apache Hadoop для хранения и обработки Big Data (MapReduce, HDFS, YARN, Spark, HBase, и т.д.)
    • Функционал и особенности MapReduce
    • Введение в Apache Spark
    • Сравнительный анализ Hadoop дистрибутивов и инструментария аналитика данных на примерах использования
    • Средства визуализации для аналитики данных
  6. Интеграция Больших данных
    • Основные принципы работы с Big Data
    • Импорт и экспорт данных с Hadoop (SQL, NoSQL, HDFS, NFS, потоковые данные, web content, файлы логов, социальные сети)
    • Пакетная и динамическая загрузка данных
  7. Правовые аспекты организации защиты персональных данных
    • Правовое регулирование в области защиты персональных данных
    • Международная практика в области защиты персональных данных
    • Права субъекта и обязанности оператора при обработке персональных данных
    • Виды нарушений безопасности персональных данных
  8. С чего начать?
    • Формирование команды проекта Big Data. Ключевые роли
    • Специфика рынка данных и аналитики
    • Отличия подходов Business Intelligence и Data Science
    • Сравнительные характеристики программных и аппаратных решений для реализации решений по Big Data.