На первую страницу Курсы для специалистов Школа Web-мастеров ИТ сервис-менеджмент и управление проектами  

Курсы Big Data Science

Микроинформ логотип

Курсы Big Data Science в Микроинформ

 Курс: BD-DSML Data Science: Машинное обучение в R
(Data Science: Machine Learning in R)

Ориентирован: на специалистов по работе с большими данными, бизнес аналитиков и руководителей, желающих получить расширенную теоретическую и практическую подготовку по методам Data Mining для участия в проектах анализа больших данных.
Предварительный уровень подготовки:

Продолжительность: 5 дней, 40 академических часа.
Методические материалы: учебное пособие на русском языке.
Документ об окончании курса: свидетельство учебного центра Микроинформ.
Квалификационный тест: нет.

Данный курс предназначен для изучения алгоритмов машинного обучения с практическим применением техник машинного обучения реализованных в R. Рассматриваются понятия Data Mining, измерения производительности и уменьшения размерности, регрессионные модели, байессовская модель, SVM и ассоциативные правила для анализа. После успешного завершения данного курса вы сможете понимать и объяснять принципы работы алгоритмов машинного обучения и применять данные алгоритмы на реальных задачах в больших данных.

Программа курса

  1. Основы статистики и простая линейная регрессия
    • Что такое ваши данные?
    • Статистические выводы
    • Введение в машинное обучение
    • Простая линейная регрессия
    • Диагностика и трансформация
    • Коэффициент определенности
  2. Множественная линейная регрессия и обобщенная линейная модель
    • Множественная линейная регрессия
    • Допущения и диагностика
    • Обобщенные линейные модели
    • Логистическая регрессия
    • Оценка максимального правдоподобия
    • Интерпретация модели
    • Оценка соответствия модели
  3. Алгоритм ближайших соседей, наивный байессовский анализ и "проклятие размерности"
    • Алгоритм K-ближайших соседей
    • Выбор К и меры расстояния
    • Условная вероятность: теорема Байеса
    • Оценка Лапласа
    • Уменьшение размерности
    • Процедура PCA
    • Ridge и регрессия Лассо
    • Перекрестная проверка
  4. Метод опорных векторов и модели деревьев
    • Деревья решений. Bagging
    • Случайные леса. Boosting
    • Важность переменной
    • Сортировка полей и поддержка векторного классификатора
    • Метод опорных векторов
  5. Кластерный анализ и нейронные сети
    • Кластерный анализ
    • K-means кластеризация
    • Иерархическая кластеризация
    • Нейронные сети и персептроны
    • Сигмоидные нейроны
    • Сетевая топология и скрытые функции
    • Метод обратного распространения ошибки с градиентным спуском