Share |

пятница, 30 января 2015 г.

Особенности управления текучестью персонала на основе данных

Управление текучестью на основе данных обладает одним важным преимуществом в сравнении с управлением другими процессами – наличием ясной зависимой переменной. Стаж – легко измеримая объективная переменная. Для ее измерения HR фиксирует дату приема и дату увольнения сотрудника. Все
На этом преимущества заканчиваются. Посмотрим на проблемы управления стажем. Точнее, стоило бы назвать особенностями, а  не проблемами.
  1. Ненормальность распределения стажа. Распределение стажа имеет длинный правый хвост и подчиняется не закону Гаусса, а экспоненциальному семейств распределений (я чаще встречал распределение Вейбулла). «По русски» это значит, что мы не можем использовать линейную регрессию для предсказания стажа. Либо мы преобразуем зависимую переменную (см. например Преобразование переменной для получения нормального распределения), либо используем непараметрическую регрессию. Либо, совсем простой вариант: отбрасываем «хвост», теряя при этом точность, конечно (аналитики меня убьют за это, но лучше сделать регрессию без хвоста, чем получить непонятно что с такими выбросами).
  2. Незаконченные события. Представьте, что вы начали вести статистику увольнений с новой группой входящих сотрудников. У вас принято 150 человек, в течение первых полугода уволилось 50 человек, вы уже можете создавать модель. Но… у вас осталось еще сто человек, которые продолжают работать. Мы не просто исключаем их из анализа, мы модель на 50-ти уже уволившихся делаем не совсем корректную, поскольку оставшиеся сто не просто новые наблюдения, это наблюдения будут с бОльшим стажем. Поэтому работающих сотрудников также стоило бы учитывать. Но тут возникает проблема: мы не может их взять в линейное уравнение регрессии, поскольку у них стаж открыт: если у уволившихся стаж ясно определен – дата увольнения минус дата приема, то у работающих есть только дата приема и сегодняшний день…
  3. Причины увольнений. У нас как минимум есть два больших кластера причин увольнений: инициатива работодателя и инициатива работника (ну или так: попросили сотрудника или он сам ушел). Понятно, что скрытые пружины у разных категорий могут быть разными, поэтому как вариант решения этой задачи – учитывать только добровольные увольнения (хотя здесь тоже можно и нужно вычленять причины: переезд, учеба, изменение семейного положения и т.п.). Можно построить логистическую регрессию с тем, чтобы определить различия в добровольной и не добровольной текучести.
  4. Динамичность текучести. Во время exit интервью можно снимать причины увольнений через вопросы. Например, мы задаем вопрос «давал ли вам руководитель обратную связь». Вопрос хороший, но мы получаем ответ сотрудника на его сегодняшнее состояние. Если он отвечает, что не давал, это не значит, что руководитель не давал обратной связи совсем, может быть он ее не давал только последние полгода. Или наоборот, подчиненные напишет, что руководитель давал обратную связь, потому что руководитель давал ее полтора года, а потом вдруг перестал давать… И если мы будем «снимать» только статичные показатели, то мы получим только часть картины…


Перечисленные задачи, с одной стороны, делают изучение текучести персонала более трудной задачей, с другой, придают задаче красоту и интерес. Представляете, какую сложную и серьезную работу проделали в Google (Как Google стал №3 в списке самых дорогих компаний Мира, используя People Analytics), чтобы так точно предсказывать увольнения

вторник, 27 января 2015 г.

Бонус для респондентов опроса о факторах текучести персонала

Коллеги, уже официально сообщаю приятную новость для тех, кто готов принять участие в качестве респондента в опросе Ключевые факторы удержания и текучести персонала:
Лаборатория "Гуманитарные технологии" предоставляет возможность пройти батарею тестов тем, кто принял участие в исследовании.
Если вы хотите пройти батарею тестов, то для этого вам необходимо:
корректно пройти опрос по факторам текучести персонала;
указать (вопрос 52) свой е майл;
поставить флажок (вопрос № 53), выразив тем согласие пройти тест.
После прохождения опроса в течение 1-2 недель (по мере того, как набирается группа респондентов) вам на почту придет приглашение пройти тест. И поторопитесь: это предложение будет действовать не все время
Все.
Показываю кусочек результатов.
Бонус для респондентов опроса о факторах текучести персонала

Бонус для респондентов опроса о факторах текучести персонала

Перейти к исследованию Ключевые факторы удержания и текучести персонала

суббота, 24 января 2015 г.

Кейс: отсев неэффективных работников на этапе подбора

Обращаюсь к уже имеющимся данным Прогноз эффективности на основе теста CPI
При приеме на работу кандидаты в продажники проходили тестирование по тесту CPI, в дальнейшем замеряли их эффективность. Оценка эффективности состояла из оценки экспертов и состояла из трехбальной шкалы:

  1. высокоэффективные, 
  2. средне эффективные, 
  3. низкоэффективные 

Принимаю все замечания, но часто у нас нет количественных мер оценки деятельности, поэтому мы можем воспользоваться оценкой экспертов (разработчики моделей компетенций: разве не тот же метод вы используете?)

Итак

наша задача - отсеять неэффективных. Для этого мы делим группу на 1 - неэффективные ("3" группа) и 0 - остальные ("1" и "2" группа)
Я опущу некоторые шаги (подробнее Прогноз эффективности на основе теста CPI), сразу скажу, что значимо делит неэффективных и остальных шкалы Sp и Do.

  • Социальное присутствие (Sp)
  • Доминирование (Do)

Диаграмма распределения неэффективных и остальных работников по шкале Sp

Кейс: отсев неэффективных работников на этапе подбора

Зеленая линия показывает распределение показателей шкалы Do неэффективных, красным - остальных. Серая область - неопределенность прогноза.
Т.е. если кандидат покажет при приеме на работу результат 45 баллов по шкале Sp, это не гарантирует нам, что он обязательно будет неэффективным. Сохраняется вероятность, что он может быть нормальным работником. Те, кто показывают результаты между 50 и 55 баллами, находятся в еще бОльшей зоне неопределенности.

понедельник, 19 января 2015 г.

Кто виноват. Задачка для аналитиков

А вот петля каузальности. Кто сможет задачку решить:
посмотрите на график
на нем показан распределение стажа (ось X) в зависимости от

  • руководитель подчеркивает достижения подчиненного, одобряет его действия
  • не отмечает действий подчиненного

Заметно, что вторая группа заметно уступает первой в продолжительности жизни в компании.
HR-директор делает доклад, где обращает внимание руководителей на необходимость обращать внимание на действия подчиненных, благодарить их за достижения и т.п..
Линейные руководители в ответ заявляют, что они и рады бы, да не за что... и вообще, рекрутеры виноваты. что таких подбирают.
HR попадает в ловушку, которую он сам себе выстроил: хотел подчеркнуть важность обратной связи, но сам огребся...
И главное: по полученным данным непонятно: то ли работники мало проработали, что сами плохие и их "слили", то ли мало проработали, что руководитель не подчеркивал их заслуг.
А вот теперь вопрос: как в данной ситуации разделить "мух и котлеты"? Что бы вы посоветовали HR директору: как показать бизнесу, в каком % случаев виноват рекрутер, который подбирает не тех, а в каком случае виноват руководитель, которые не подчеркивает заслуг подчиненного?
Только прошу не мнение высказывать а предложения по выстраиванию процедуры отделения "мух от котлет". А в процедуру обязательно входит предложение по тому, какие данные и как собирать, какие гипотезы выстраивать.
И кейс этот реальный

Кто виноват. Задачка для аналитиков


воскресенье, 18 января 2015 г.

Причина увольнения с последнего места работы как предиктор текучести

Данные мне предоставлены моим клиентом, поэтому я не дам полной информации. Но вы сами можете организовать такой процесс у себя и получить собственную картину.
При приеме на работу часто задают вопрос: какова причина увольнения с прошлого места работы.
Ниже результат анализа (я даю только описательные статистики, без результатов регрессии, результаты регрессии впечатляющие)
$`1`
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's
    2.0    46.0    75.0   156.8    89.5   704.0       3


$`3`
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's
   9.00   22.00   37.00   42.67   59.00   76.00       2


$`5`
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's
  23.00   39.00   44.00   50.36   63.50   79.00       4

$`14`
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
   1.00   30.00   50.00   62.72   72.75  327.00 

1, 3, 5, 14 - это причины увольнения с предыдущего места работы. Не называю их, поскольку это является конфиденциальной информацией, но вы можете у себя аналогичную статистку собрать
а цифры - показатели стажа тех, кто указал ту или иную причину. Стаж - не удивляйтесь - в днях.
Причина увольнения с последнего места работы как предиктор текучести
В любом случае, не транслируйте этот вывод без проверки на своих данных, собирайте информацию, анализируйте и принимайте решение

суббота, 17 января 2015 г.

Каналы привлечения кандидатов. Динамика 2006-2014

Еще один из результатов нашего опроса Ключевые факторы текучести и удержания персонала 2014 (результаты исследования). Эти данные - некий артефакт исследований, не было прямой цели собирать по ним информацию, но результат интересный, и я с удовольствием им делюсь.
Заранее оговорюсь, что полученные данные нельзя транслировать на весь рынок, поскольку разные группы специалистов представлены неравномерно, интерес поэтому представляет именно динамика.
Кроме того, вызывают много вопросов сами каналы привлечения (источники трафика), поэтому в новых опросах (в которых вы, конечно же, примите участие), я дал новые каналы
Исследование времени поиска работы
Ключевые факторы удержания и текучести персонала

Результаты

Таблица абсолютных значений ответов на вопрос "Как Вы узнали о вакансии" в динамике по годам

вторник, 13 января 2015 г.

Как предсказать увольнение работника по результатам электронного курса

.Представляете идею: человек у нас проходит электронный он лайн курс, что то делает, а мы по результатам курса говорим: это уволится, а этот... попозже уволится...
Ну вот мы приближаемся к этой фантастике.
Аналитика в дистанционном обучении (кейс для работы)
Напомню: в кейсе есть данные оценок удовлетворенности электронным курсом, и есть стаж работы в компании работника.
Сразу результаты
Непараметрическая регрессия показывает значимые различия между "отличниками" (кто ставил "5" за курс) и "хорошистами", "отличниками" и "троечниками" (для спецов сообщаю, что использовал непараметрическую регрессию, учитывая также стаж тех, кто не уволился).
Грустно, что R^2 = 0, 001, но он значим
Посмотрите на статистики
$`3`
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
    6.0   114.8   258.0   425.8   561.0  3570.0

$`4`
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
    2.0   101.0   241.0   402.7   525.0  4513.0

$`5`
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
    1.0   101.0   224.0   368.7   496.0  4743.0

Как предсказать увольнение работника по результатам электронного курса


Шибздануться, правда? Те, кто оценивают курс на "4" или "3" работают в компании значимо дольше.
Но обращаю Ваше внимание: данные "грязные", много bullshit, непонятен инициатор увольнения, поэтому еще много вопросов к выводам.

Как зависит удовлетворенность электронным курсом от времени его прохождения

Порешаем кейс Аналитика в дистанционном обучении.
Напомню, основная идея: посмотреть как время прохождения курса влияет на оценку удовлетворенности этим курсом.

Диаграмма. Распределение времени прохождения курсов


Как зависит удовлетворенность электронным курсом от времени его прохождения
Данные по оценкам такие
     1     2       3      4        5
   63    90   769  5280 22585
Ценность прогноза, безусловно, снижается тем, что у "пятерки" дают три четверти оценок. Тем не менее, мы различия нашли
Данные регрессии следующие (время прохождения курса мы логарифмируем)
lm(formula = log(r1$timec, base = exp(1)) ~ k, data = r1)

Residuals:
    Min      1Q  Median      3Q     Max
-1.2396 -0.5590 -0.0482  0.4218  3.3122

Coefficients:
             Estimate Std. Error t value Pr(>|t|)  
(Intercept) 3.9601884  0.0046702 847.976  < 2e-16 ***
k1          0.2416935  0.0866167   2.790  0.00527 **
k2          0.2267594  0.0730114   3.106  0.00190 **
k3          0.1126549  0.0255257   4.413 1.02e-05 ***
k4          0.0004889  0.0107263   0.046  0.96364  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.7027 on 28870 degrees of freedom
  (19 observations deleted due to missingness)
Multiple R-squared:  0.001263, Adjusted R-squared:  0.001124
F-statistic: 9.125 on 4 and 28870 DF,  p-value: 2.305e-07
Потрясающий R^2?)
И распределение времени по каждому уровню оценки
Как читать диаграмму boxplot - для понимания результатов
Как зависит удовлетворенность электронным курсом от времени его прохождения

Vlookup (ВПР) в Rstudio

Во вчерашнем посте Аналитика в дистанционном обучении (кейс для работы) основная идея аналитики - посмотреть, какие факторы влияют на оценку курса обучаемым.
Однако в самой оценке курса могут быть проблемы: кто-то подходит серьезно, ставя оценки взвешенно, кто-то "лепит" подряд "пятерки", кто-то всегда "троечки".
В нашем кейсе (прикрепленные данные) 36 000 строк - записей о прохождении курсов и 4 900 юзеров или работников компании, т.е. на каждого работника примерно 7 курсов.
на самом деле статистика такая
  Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
  1.000   2.000   5.000   6.838  10.000  39.000
a = table(r$ID)
b = as.data.frame(a)
summary(b$Freq)

понедельник, 12 января 2015 г.

Аналитика в дистанционном обучении (кейс для работы)

В ответ на мою просьбу (см. пост Оценка удовлетворенностью электронным курсом (предложение)) мне прислали файл с данными, а я их вам передаю.
Данные реальные! Я только закодировал названия курсов и должностей, чтобы нельзя было по ним догадаться, что это за компания. Сам я пока ничего не считал.

Итак, кейс

У вас есть файл excel в 36 066 строк со следующими переменными
  1. ID пользователя - уникальный код работника
  2. Дата создания - дата прохождения курса
  3. курс - уникальный код курса
  4. позиция - занимаемая должность
  5. Дата рождения - того, кто проходил курс
  6. Дата приёма - на работу учащегося
  7. Дата увольнения - его же дата увольнения (если пустое поле, значит работает)
  8. Оцени удобство перемещения по курсу - оценка логистики курса учащимся
  9. Сколько времени потратил на изучение курса в минутах? Введи число - оценка учащимся времени прохождения курса
  10. Оцени весь курс по пятибальной оценке - оценка курса учащимся
Вопросы к вам:

  • Какие результаты мы можем извлечь из данного файла;
  • Этот же вопрос в другой формулировке: какие гипотезы можно выдвинуть, исходя из имеющихся данных;
  • Посмотрите на данные и скажите, какие данные вызывают недоверие и почему.

Считать пока ничего не надо, просто выдвигайте гипотезы, если вы не умеете посчитать, посчитаю я. Мне важно, чтобы вы научились зряче смотреть на данные.
ПыСы. осторожней качайте файл
Аналитика в дистанционном обучении (данные для анализа)

воскресенье, 11 января 2015 г.

Ключевые факторы текучести и удержания персонала 2014 (результаты исследования)

Вот и завершился опрос про факторы текучести и удержания персонала, которым я мучил вас больше года.
Вынужден признаться, что опрос был несовершенен: отчасти потому, что я наделал ошибок, отчасти потому, что в принципе через такой опрос нельзя выявить всю картину.
Сразу скажу, что я с помощью коллег создал новый опрос, к участию в котором я вас и приглашаю
Ключевые факторы удержания и текучести персонала - 2015
В этом опросе учтены ошибки прошлого опроса.
Результаты исследования можно скачать здесь
Ключевые факторы текучести и удержания персонала 2014
Отчет в формате PDF, 29 страниц. Для удобства я сделал оглавление (кликнув по интересному заголовку, вы сразу переходите в эту тему) + краткое резюме.
Если же у вас останутся вопросы, пишите edvb@yandex.ru указав в теме письма Ключевые факторы текучести и удержания персонала.
И спасибо вам всем огромное за поддержку!
ПыСы.


Как читать диаграмму boxplot - для понимания результатов

Надо ли посылать работника на внешнее обучение, чтобы удержать в компании

Еще один вопрос исследования Ключевые факторы удержания и текучести персонала (опрос открыт и ждет вашего участия) 
Посылали ли Вас на внешние семинары и тренинги  в последние полгода работы?
  • ·         Да – «1» в кодировке (592 респондента)
  • ·         нет – «0» в кодировке (1099 респондентов)
  • ·         не было такого за все время работы в компании – «2» в кодировке (409)

Результаты
$`0`
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
   1.00   11.00   23.00   33.75   42.00  189.00

$`1`
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
   1.00   17.00   32.00   41.78   56.00  193.00

$`2`
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
   1.00    9.00   17.00   26.49   33.00  184.00

Различия значимы между всеми тремя вариантами
Для тех, кто не знает, как читать данный тип диаграмм Как читать диаграмму boxplot.
Надо ли посылать работника на внешнее обучение, чтобы удержать в компании

И вот здесь возникает самое интересное: мы выявили корреляцию между обучением и стажем, но не можем сказать, что есть причина другого. То ли работник работает дольше, потому что его посылают учиться, то ли посылают изначально того, кто дольше работает, кто менее склонен к текучести.

Эта проблема легко снимается в корпоративной статистике: нам достаточно фиксировать время, когда работника послали на внешний семинар (или не послали). В нашем исследовании можно было бы поставить вопрос: «Через какое количество месяцев после начала работы Вас впервые послали на внешний семинар?», где одним из вариантов будет вариант «никогда». Но я, к сожалению, не предусмотрел. И кроме того, думаю, такой вопрос дал бы много bullshit: память часто подводить в такой ситуации

Хотите удержать работника? Обеспечьте ему коммуникации

Начну с просьбы: не верьте заголовкам моих постов - это замануха. Все не так просто. 
В исследовании Ключевые факторы удержания и текучести персонала (опрос открыт и ждет вашего участия) есть такой вопрос
Просим оценить интенсивность взаимодействия с коллегами. Доля времени на коммуникацию с коллегами (запросы, ответы на запросы, письма, телефонные и устные коммуникации) в общем рабочем времени составляла
  • крайне незначительная (117 респондентов)
  • незначительная (171)
  • средняя (527)
  • значительная (776)
  • крайне значительная (502)

Описательные статистики
$very_significant
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
   1.00   14.00   27.00   36.52   48.00  189.00

$significant
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
    1.0    13.0    26.0    36.5    48.0   193.0

$so_so
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
   1.00   10.50   20.00   33.54   42.00  189.00

$slight
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
   1.00    9.50   18.00   26.89   33.00  163.00


$very_slight
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
    1.0     6.0    14.0    29.1    37.0   178.0

Показатели взаимосвязи
Call:
lm(formula = log(r1$stag, base = exp(1)) ~ interaction, data = r1)

Residuals:
    Min      1Q  Median      3Q     Max
-3.2330 -0.6680  0.0629  0.6981  2.4065

Coefficients:
                            Estimate Std. Error t value Pr(>|t|)   
(Intercept)                  3.17313    0.03591  88.360  < 2e-16 ***
interactionslight           -0.34525    0.08451  -4.085 4.57e-05 ***
interactionso_so            -0.17095    0.05647  -3.027   0.0025 **
interactionvery_significant  0.05985    0.05730   1.045   0.2963   
interactionvery_slight      -0.39789    0.09921  -4.010 6.27e-05 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 1 on 2088 degrees of freedom
  (27 observations deleted due to missingness)
Multiple R-squared:  0.02016,  Adjusted R-squared:  0.01829
F-statistic: 10.74 on 4 and 2088 DF,  p-value: 1.283e-08

Диаграмма
Для тех, кто не знает, как читать данный тип диаграмм Как читать диаграмму boxplot.
Хотите удержать работника? Обеспечьте ему коммуникации

В качестве контрольной группы я взял самую многочисленную – тех, кто указал значительную степень взаимодействия. Они «живут» в среднем в компании почти два года. Те, кто очень значительно взаимодействует не отличается значимо от «значительных». А остальные группы работников отличаются и:
  • Работники со средней степенью взаимодействия «живут» на 4 месяца меньше,
  • С незначительной – на 7 месяцев меньше,
  • С крайне незначительной – на 8 месяцев.


Результат замечательный, но не забывайте, что это самоотчет работников, а не реальные показатели коммуникаций. С другой стороны, подумайте, если ли у нас право проводить здесь причинно следственную связь между уровнем коммуникаций в качестве причины и следствием в виде стажа. А может наоборот: работник просто не успел / не смог / не захотел выстроить коммуникации и ушел? Это в случае, если коммуникация определяется самим работником. Тогда склонность к интроверсии может быть предиктором текучести в некоторых профессиях, верно?

Возрастные характеристики менеджеров в разных социальных сетях

В исследовании Ключевые факторы удержания и текучести персонала (опрос открыт и ждет вашего участия) был такой вопрос
В какой социальной сети вы проявляете максимальную активность

Я посмотрел возрастные различия по разным сетям, вот что получил
У нас вот такое количество пользователей было в сетях
facebook       linkedin odnoklassniki  vkontakte            
  449           241           152        738   

$facebook
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.   
   1950    1974    1979    1978    1983    1993       


$linkedin
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.   
   1956    1972    1977    1977    1982    1993      

$odnoklassniki
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.   
   1956    1971    1979    1977    1982    1994      

$vkontakte
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.   
   1958    1982    1986    1985    1989    1995     
Возрастные характеристики менеджеров в разных социальных сетях
Если взять контрольной группой фейсбук, то различия значимые во всех парах: линкедин и одноклассники чуть старше фейсбука, в ВКонтакте младше

суббота, 10 января 2015 г.

Лояльность работодателю определяется стажем

В исследовании Ключевые факторы удержания и текучести персонала (опрос открыт и ждет вашего участия) был такой вопрос о лояльности бывшему работодателю
Если бы вы остались без работы, как бы вы восприняли предложение бывшего работодателя о работе
  • Принял(-а) бы предложение (на диаграмме обозначено как “yes”)
  • Рассмотрел(-а) бы среди прочих (“among”)
  • Пошел (пошла) бы работать в случае крайней нужды (“need”)
  • Не стал(-а) бы рассматривать в принципе (“no”)

Описательные статистики такие
$among
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
   1.00   15.00   29.00   38.15   51.00  189.00

$need
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
   1.00   12.00   23.00   33.49   42.00  189.00

$no
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
   1.00    9.00   18.00   28.91   36.00  193.00

$yes
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
   2.00   15.00   33.00   43.08   54.50  183.00

Call:
lm(formula = log(r1$stag, base = exp(1)) ~ k, data = r1)

Residuals:
    Min      1Q  Median      3Q     Max
-3.2679 -0.6289  0.0646  0.6943  2.4044

Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept)  2.85829    0.03750  76.227  < 2e-16 ***
kamong       0.40963    0.05372   7.625 3.69e-14 ***
kneed        0.21262    0.05726   3.713  0.00021 ***
kyes         0.50786    0.07769   6.537 7.85e-11 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.9907 on 2093 degrees of freedom
  (23 observations deleted due to missingness)
Multiple R-squared:  0.03514,  Adjusted R-squared:  0.03376
F-statistic: 25.41 on 3 and 2093 DF,  p-value: 3.828e-16

Различия значимые: контрольной группой взял тех, кто не стал бы рассматривать в принципе.
  • «Средний срок жизни» самых нелояльных – 17 месяцев
  • Тех, кто вернулся бы в компанию по необходимости – 21, 5 месяца
  • Тех, кто рассмотрел бы предложение бывшего работодателя – 26 месяцев
  • Тех, кто вернулся бы однозначно – почти 29 месяцев
Диаграмма. Связь лояльности и стажа
По оси X - стаж в месяцах, ось Y - показатели лояльности
Для тех, кто не знает, как читать данный тип диаграмм Как читать диаграмму boxplot.

Лояльность работодателю определяется стажем

Вывод: чем дольше работает в компании работник, тем бОльшая вероятность, что после увольнения из компании он будет ей лоялен

Аналитика для HR-директора. Мастер – класс

Анонс нового семинара. Текст анонс тестовый. Буду благодарен за критику, вопросы

Аналитика для HR-директора. Мастер – класс

HR аналитика больше, чем hr-метрики, бенчмаркинг, ROI, модель Киркпатрика и даже больше, чем применение статистических методов анализа данных, а представляет из себя тип мышления менеджера, способ управления. На семинаре я хочу донести основы это до участников.
Семинар является продолжением семинара Аналитика для HR, но если Аналитика для HR – для тех, кто будет считать – это «лопата» и «грабли», то Аналитика для HR директора для тех, кто сам не считает в excel, а является потребителем результатов анализа: ставит задачи, делает выводы, интерпретирует результаты, представляет варианты, принимает решения.

Формат

Лекция + разбор кейсов + работа в группах по решение кейсов два дня по 8 академических часов (с 10.00 до 18.00). 

Область результатов

Знания и навыки:
  • технологии выстраивания процессов управления на основе данных в компании (от сбора данных до принятия решения);
  • базовых терминов статистики (корреляция, регрессия, объясненная дисперсия, доверительные интервалы и т.п..);
  • чтения  аналитических отчетов (зарплатные обзоры, бечмарки);
  • постановки задачи аналитику (в том числе внешнему провайдеру);
  • принципов создания и проведения корпоративных опросов;
  • принципов «оцифровки» данных (и сюда же знание принципов «датификации»);
  • принципов принятия решения на основе данных;
  • основных приемов визуализации под разные типы решений;
  • постановки задачи ай-ти отделу на автоматизацию сбора данных.

Условия участия

Просмотр фильма «Человек, который изменил все». Опционально (по желанию): 

Спикер

Бабушкин Эдуард

Содержание семинара

  • Эволюция аналитики: что привнес в HR Moneyball
  • Какие задачи решает HR-аналитика
  • Как ставить задачу (или: как переводить с языка бизнеса на язык аналитики)
  • Основы моделирования управления процессом на основе данных (например, управления эффективностью и текучестью персонала на основе данных).
  • Методология аналитических методов
    • Чем гипотеза отличается от мнения;
    • Что такое факторы / драйверы процессов;
    • Чем корреляция отличается от причинно-следственной связи;
    • Основные показатели силы взаимосвязи: корреляция, регрессия – и что это нам дает;
    • «Очищение» эффекта влияния факторов;
  • Принятие решения на основе данных: понятие рисков, вероятностей при принятии решения
  • Визуализация: основные принципы решений

Как реализовать в компании

  • Сбор данных
    • Сбор данных как процесс, а не проект;
    • Какие данные собирать;
    • что такое «оцифровка» данных, что такое «датификация»;
    • отчет как элемент системы сбора данных: элементы отчета;
    • как выстроить систему отчетов;
    • автоматизация сбора данных.
  • Структура баз данных: «матрица».
  • Команда проекта
    • как объяснить айти отделу, что вы хотите получить;
    • как подобрать аналитика: какими скилсами он должен обладать.
  • Лирика: культура данных в компании

Кейсы мастерской (состав может меняться)

  • Исследование вовлеченности;
  • Создание корпоративного опроса;
  • Чтение зарплатных обзоров;
  • Использование тестов и личностных опросников («психологических тестов») в отборе персонала;
  • Связь между оценкой по компетенциями и KPI;
  • Оценка эффективности обучения;
  • Влияние каналов привлечения (источников трафика) кандидатов на текучесть персонала ;
  • Влияние отношений с руководителем на текучесть персонала;
  • Разрабатываем анкету рекрутера, exit – интервью, опросник.
  • Принимаются к анализу кейсы участников.

четверг, 8 января 2015 г.

Что читали HR в 2014 году

В конце прошлого года собрал отзывы: что читали в 2014 году. При этом имелось ввиду. что литература могла быть как профессиональная, так и художественная. Главное условие - оказала влияние на профессиональное развитие.
Я не представляю как можно систематизировать книги, поэтому выкладываю просто все, что написали. Замечу только, что в топе чтения Большие данные, В. Майер - Шенбергер.
И само обсуждение не закрыто, можно оставить отзыв здесь Топ книг 2014
Итак

среда, 7 января 2015 г.

Поколения X и Y: кто чаще меняет работу

Я уже не аноснирую наше исследование в начале, пишу так много, что не ожидаю незнакомых людей в нем, но если и появятся, ссылка на исследование текучести внизу, проголосуйте - оно по прежнему актуально.
Если вся эта аналитическая фигня неинтересна - читайте внизу вывод жирным 
Логика проверки заключается, в первую очередь , в очищении эффекта корреляции пары «возраст – стаж».
Представьте ситуацию, что представитель поколения X устроился на работу в 1985 году и работает по сю пору. Это здорово, но это не значит, что поколение X более стабильно: просто представитель поколения Y в 1985 году в лучшем случае сидел на горшке и сравнивать поколения в данном разрезе некорректно.
Поэтом у справедливо было бы посмотреть ситуацию, в которой оба поколения X и Y дееспособны.
Я взял следующие границы поколений:
Поколение X = 1963 : 1981
Поколение Y = 1982 : 1992
Верхнюю границу поколения Y я не стал поднимать до 1995 года, потому что:
Я решил взять выборку респондентов, трудоустроившихся после после 1 января 2012 года. В этом году даже самым молодым представителям поколения Y уже 19 лет, они вполне трудоспособны.
Далее мы посмотрим значимость различий в стаже между поколениями X и Y.
Всего в этот период устроилось на работу 637 респондентов, из них
X   Y
227 410


Call:
lm(formula = log(r1$stag, base = exp(1)) ~ XYZ, data = r1)

Residuals:
    Min      1Q  Median      3Q     Max
-2.2638 -0.4720  0.1341  0.5165  1.2741

Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept)  2.19159    0.04842  45.264   <2e-16 o:p="">
XYZY         0.07218    0.06035   1.196    0.232   
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.7295 on 635 degrees of freedom
Multiple R-squared:  0.002248, Adjusted R-squared:  0.0006766
F-statistic: 1.431 on 1 and 635 DF,  p-value: 0.2321
 Либо банальный Манн Уитни
> wilcox.test(stag ~ XYZ, data=r1, paired = FALSE)

        Wilcoxon rank sum test with continuity correction

data:  stag by XYZ
W = 43647.5, p-value = 0.1938
alternative hypothesis: true location shift is not equal to 0
Для тех, кто не знает, как читать данный тип диаграмм Как читать диаграмму boxplot.
Поколения X и Y: кто чаще меняет работу

$X
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
   1.00    5.00    9.00   10.09   14.75   26.00

$Y
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
   1.00    6.00   11.00   11.66   16.00   32.00
Вывод: мы не наши различий стаже Y-ов и X-ов.
У данного метода есть несколько недостатков, главный, на моя взгляд, в том, что я не беру в анализ незаконченные случаи, т.е. те ситуации, когда человек устроился на работу в указанный промежуток времени (после 1 января 2012 года), но еще не уволился. Эти ситуации также можно анализировать, но данная информация изначально искажена в нашем исследовании, поэтому я не могу полноценно ее включить.
Как мы можем сделать проверку? У нас в этот же промежуток времени 54 респондента указали пустой дату увольнений, т.е. они продолжали работать на момент заполнения опросника.
16  из них относятся к поколению X
38 – к поколению Y
Напомню, что ранее я давал цифры
X   Y
227 410
Это те, кто указал дату увольнения, т.е. закончил работать
Далее составляем таблицу сопряженности

поколение X
поколение Y
продолжает работать
16
38
уволился
227
410

Хиквадрат = 0, 374 без поправки на непрерывность. С поправкой – еще выше будет.

Вывод: мы не смогли доказать утверждение,что представители поколения Y чаще меняют работу, чем поколение X.
Для продвинутых аналитиков скажу, почему не сделал анализ типа Каплан Майер: у нас опрос более года длился, а дату заполнения анкеты не фиксировал, поэтому анализ дожития был бы некорректным.
Но я исправился, и в новой анкете учтены недостатки, а вы сейчас пойдете и поучаствуете в опросе Ключевые факторы удержания и текучести персонала