Share |

понедельник, 2 января 2017 г.

Семинар-практикум "HR-Аналитика в R", Москва

Анонсирую свой семинар-практикум "HR-Аналитика в R", Москва, дата и место пока не определены, но если вы хотели бы принять в нем участие, можете пожать заявку, я проинформирую вас по датам отдельно. Подать заявку можно в форме ниже

Почему R

Самый популярный инструмент аналитики в Мире – программа R. В группах по HR-аналитике на linkedin я задавал вопрос, каким инструментом чаще всего пользуются hr-аналитики. Самый популярный ответ - R

Кого бы я хотел видеть на семинаре

В идеале вы прошли мой семинар Аналитика для HR. Или вы знакомы со матстатистикой (регрессия, R^2, корреляция, классификация вам знакомы), но не знакомы с R. Или вы не были на моих семинарах, не знакомы со матстатистикой, не знакомы с R, но у Вас есть желание осваивать новое и, главное, готовность выносить крышеснос.

Требования к участникам

Ноутбук с установленными программами R и Rstudio и необходимыми пакетами для работы. После подачи заявки на семинар вы получите ссылки на установку программ, перечень необходимых пакетов для работы, инструкцию по установке, и файл с данными для загрузки.

Формат

Семинар-практикум. В течение двух дней по восемь астрономических часа мы будем решать кейсы по HR-аналитике. 

Результат семинара

  • Знакомство с R/Rstudio;
  • Понимание круга задач HR-аналитики, решаемых с помощью данного инструмента;
  • Знание и применение базовых техник работы в R/Rstudio: загрузка данных, описательные статистики, визуализация данных и т.п..;
  • Знание и применение базовых алгоритмов предиктивной аналитики в R/Rstudio;
  • Главное: код, который у вас будет в качестве шаблона для анализа, для дальнейшего осмысления и развития.

Содержание

  1. Типы задач в HR-аналитике
  2. Начинаем работу: Базовые операции
    • Загрузка данных;
    • Структура данных;
    • Типы данных;
    • Описательные статистики;
    • Выбираем необходимый диапазон данных, фильтрация (subset).
  3. Задачи, не требующие создания моделей: Хи квадрат, Манн-Уитни, Краске-Уолисс, Т- тест
  4. Типы моделей
    • Регрессия;
    • Классификация.
  5. Подготовка данных.
    • Проверка нормальности распределения;
    • Преобразование  категориальных переменных;
    • Шкалирование и логарифмирование метрических переменных;
    • Работа с пропущенными значениями (импутация).
  6. Качество модели
    • Показатели качества модели;
    • Кросс-валидация;
    • Train-test split.
  7. За пределами линеарности – непараметрические модели
    • Решающие деревья (decision trees);
    • Случайный лес (Random forest).
  8. Визуализация результатов ggplot2
  9. Управление текучестью персонала
    • Работа с датами (lubridate);
    • Два подхода к построению модели прогноза увольнения;
    • Регрессия Кокса.
  10. Чего не было на семинаре, куда двигаться дальше

Комментариев нет:

Отправить комментарий