На первую страницу Курсы для специалистов Школа Web-мастеров ИТ сервис-менеджмент и управление проектами  

Курсы Big Data Science

Микроинформ логотип

Курсы Big Data Science в Микроинформ

 Курс: BD-DSDAV Data Science: Анализ данных и визуализация в R
(Data Science: Data Analysis and Visualization in R)

Ориентирован: на специалистов по работе с большими данными, бизнес аналитиков и руководителей, желающих получить расширенную теоретическую и практическую подготовку по использованию R-Studio в проектах анализа больших данных.
Предварительный уровень подготовки:

  • Понимание основ статистики;
  • Базовый опыт работы с языками программирования или скриптами.

Продолжительность: 5 дней, 40 академических часа.
Методические материалы: учебное пособие на русском языке.
Документ об окончании курса: свидетельство учебного центра Микроинформ.
Квалификационный тест: нет.

Данный курс является необходимым для получения практических навыков работы с R и R-Studio. В процессе обучения слушатели узнают, как загружать, сохранять и преобразовывать данные, а также как писать функции, создавать графики и сопоставлять базовые статистические модели с данными. В дополнение к изучению теоретических основ процесса анализа данных, этот курс фокусируется на практических инструментах, необходимых для анализа и визуализации больших данных. По окончании курса слушатели овладеют основными навыками обработки, манипулирования и анализа данных различных типов, навыками создания отчетов и документирования кода.

Программа курса

  1. Основы статистики и простая линейная регрессия
    • Что такое ваши данные
    • Статистические выводы
    • Введение в машинное обучение
    • Простая линейная регрессия
    • Диагностика и трансформация
    • Коэффициент определенности
  2. Базовое программирование с R
    • Введение в R. Что такое R?
    • R-Studio, пакеты и рабочая область
    • Основные элементы языка R
    • Типы объектов данных. Локальный импорт / экспорт данных
    • Введение функций и управляющих операторов
    • Углубленное изучение объектов данных
    • Функции. Программирование функций
  3.  Базовые элементы данных
    • Преобразование данных (Reshape, Split, Combine)
    • Символы. Обработка строк. Даты и временные метки
    • Сбор Веб-данных
    • API источники данных
    • Подключение к внешней базе данных
  4. Манипулирование данными с помощью "dplyr"
    • Подмножество, преобразование и переупорядочение наборов данных
    • Объединение наборов данных
    • Групповые операции над наборами данных
  5. Графика данных и визуализация данных
    • Основные подходы к визуализации данных и графики данных. Base, Grid, Lattice, ggplot2
    • Построение графиков больших данных с ggplot2
  6. Расширенная визуализация в R
    • Настраиваемая графика с помощью ggplot2
    • Титулы, системы координат, масштабы, темы, метки, легенда scatterplot с многоразмерными данными, визуализация временной последовательности, карты
    • Интерактивная визуализация в R.