Share |

четверг, 30 июня 2016 г.

Несколько статей по hr-аналитике 2

Часто попадаются интересные статьи по hr-аналитике в интернете, переводить некогда, но поделиться хочется. Это уже вторая подборка, первую смотри Несколько статей по hr аналитике на английском.
Начну с совершенно шедевральной статьи - Recent HR Analytics Themes - состояние и перспективы HR-аналитики на Западе. Приведу просто несколько цитат из статьи:

  • How do you put 72 metrics on a dashboard?
  • Building an HR Analytics capability takes 2 – 3 years, is a sizable investment, and requires discipline
  • Separate your Analytics team and make them “untouchable” so they can focus solely on analytics

Отзывается сердце?)
Вторая статья - 9 HR Analytics terms you should know - просто супер класс. Просто тупо буду использовать как часть своего семинара BigData для HR директоров.
И немного статей на русском:




среда, 29 июня 2016 г.

Метафоры траектории карьерного развития

Занимаюсь сейчас анализом траекторий карьерного роста / развития (см. например, Карьерный рост / карьерное планирование в компании на основе машинного обучения или Прогноз эффективных руководителей с учетом их "созревания"), понял, что нужно еще осмысление на уровне рефлексии - смыслового / содержательного понимания.
Попросил в группе HRM на Линкедине дать свое представление метафоры карьерного развития, из 18 000 участников никто не поделился. Никому это не интересно.
Дали мне свои метафоры те, кто занимается hr-аналитикой.

Максим Андреенок

Метафоры траектории карьерного развития

Иван Безуглов

Метафоры траектории карьерного развития

Метафоры траектории карьерного развития

Люда Рогова

Метафоры траектории карьерного развития

Снова Иван Безуглов

Метафоры траектории карьерного развития

Снова Люда Рогова

Метафоры траектории карьерного развития

Ольга Хайдарова

Метафоры траектории карьерного развития

Присылайте свои картинки метафоры карьерного развития edvb@yandex.ru

воскресенье, 26 июня 2016 г.

Какого размера выборки достаточно для исследования: еще раз про репрезентативность

Один из главных "контраргументов" против моих исследований звучит как претензия в нерепрезентативности выборки.
Вопрос о репрезентативности состоит из двух вопросов:

  • соответствии параметров выборе генеральной совокупности;
  • размер выборки.

Первый вопрос я не буду рассматривать, это еще одна большая тема, сейчас расскажу про размер выборки.
В качестве примера последний пост Бенчмарк текучести IT специалистов.
К примеру, нам поставили благородную исследовательскую задачу провести бенчмарк IT специалистов. Мы опросили 248 респондентов - специалистов IT рынка (это показатели моего исследования). Наша задача - оценить, достаточный ли размер выборки для презентации результатов исследования или достаточно.
Первый вопрос, конечно,заключается в том, мало или достаточно размера выборки для чего. Хотя вопрос банален, про это почему-то забывают.
Во-вторых, у вопроса о размере выборке нет однозначного, объективного ответа.
Именно так. Поскольку вопрос о размере выборки это вопрос о границах ошибки исследования. И я, читая, изучая бенчмаркиновые исследования в HR, ни разу (!!!!) не сталкивался с этим.
В моем случае с IT специалистами вопрос о репрезентативности выборки звучит так: мы выяснили, что медиана среднего стажа IT специалиста составляет 30 месяцев, но границы ошибки таковы:

  • нижняя - 24 месяцев;
  • верхняя - 36.

Т.е. медиана не 30 месяцев, а находится в границах от 24 до 36 месяцев. Много это или мало? А вот на этот вопрос уже отвечает Заказчик исследования - насколько точную он хочет получить оценку.
В нашем случае разброс в 12 месяцев или один год - наверное многовато.
Увеличение размера выборки сужает границы ошибки. Посмотрите на бенчмарк текучести IT специалистов компании Люксофт и остального рынка

Пунктиром обозначены границы ошибки, у Luxoft границы значительно уже. У меня были данные на более чем 1 000 IT специалистов компании.
Вот и вся логика репрезентативности размера выборки исследования

Бенчмарк текучести IT специалистов

Одна из прикладных задач исследования факторов текучести и удержания персонала (ссылку можно и нужно расшарить по знакомым и самим не забыть пройти) - бенчмарк текучести (и не только текучести, но и: зарплат, условий и т.п..) по отраслям, позициям, регионам, уровням позиция и т.п...
Показываю возможности бенчмарка на примере IT специалистов.
На сегодня у нас поучаствовало в опросе 248 специалистов из разных отраслей, регионов, уровней позиций, средняя их "температура по больнице" в текучести такая
Бенчмарк текучести IT специалистов
Как читать такой тип диаграммы - Анализ и визуализация дожития: чем HR похож на медиков.
  • По оси X - число месяцев стажа
  • По оси Y - вероятность, что работник доработает до этого момента стажа в компании.
В цифрах это выглядит так
$quantile
      25         50       75
     12.2    30.5    55.3
$lower
       25        50       75
     8.9      24.0       48
$upper
      25       50       75
    15.5     36.9     76

Что обозначают цифры

  • 25, 50, 75 - обозначение первого квартиля, медианы и третьего квартиля текучести IT специалистов, 
  • Цифры под ними - значение в месяцах. 
  • lower, upper - обозначения нижней и верхней границы
Таким образом, мы можем утверждать, что в среднем IT специалист работает 30, 5 месяцев, но с учетом границы ошибок мы говорим, что этот показатель с 95 % вероятностью укладывается в границы от 24 до 36, 9 месяца. Т.е. от двух до трех лет.
Вам это кажется слишком широким диапазоном? Так приглашайте своих знакомых IT специалистов поучаствовать в опросе факторов текучести персонала.
Если вы IT компания, то можете сравниться с рынком: посмотреть, насколько ваша текучесть "бьется" с текучестью по рынку, см, например Бенчмарк текучести IT специалистов (на примере компании Luxoft - сравниваем с рынком).
Пишите edvb@yandex.ru, если хотите сравниться.

Понравился пост?

если Вы захотите выразить мне благодарность за интересный пост, вы можете перевести небольшую сумму мне на Яндекс кошелек (кликните по кнопке Перевести) 
или сделать перевод на карту Сбербанка,
Номер карты 676 280 38 921 538 46 57 - укажите "за результаты исследования ". 
Или просто покликайте на директ рекламу ниже на странице - у вас это отнимет несколько секунд, а мне принесет немного денег. 
спасибо!

суббота, 25 июня 2016 г.

Время начала работы как стрессогенный фактор (результаты исследования)

Совсем недавно прошла информация в интернете, что раннее время начала работы крайне стрессогенный фактор, приравнивается чуть ли не к пытке и насилию над человеком. Я проверил гипотезу о стрессогенности времени начала работы: у нас в опросе ключевые факторы текучести и удержания персонала (ссылка дана для того, чтобы вы прошли и поучаствовали в опросе) есть вопрос про время начала работы:
  • 08.00
  • 09.00
  • 10.00
  • другое 
Гипотеза очень простая: если раннее время начала работы стрессогенный фактор, то работники, начинающие работать в 8 утра, будут работать в компании значимо меньше, чем те, у кого время начала работы в 10 утра.

Выборка

На сегодняшний момент распределение ответов про время начала работы имеет такой вид:
  • 08.00 - 347 респондентов указали 8 утра как время начала работы;
  • 09.00 - 1279;
  • 10.00 - 323;
  • другое указали 167 респондентов.

Результаты

оказались интересными.
Время начала работы как стрессогенный фактор (результаты исследования)

Как читать такой тип диаграммы - Анализ и визуализация дожития: чем HR похож на медиков.
  • По оси X - число месяцев стажа
  • По оси Y - вероятность, что работник доработает до этого момента стажа в компании.
Вы уже догадались?) Те, кто начинают работать в 8 утра, работают в компании значимо дольше
  • Те, у кого время начала работы в 9 утра, имеют риск увольнения в 1, 3 раза выше, чем те, кто начинают работу в 8 утра (p-value - 0.000165)
  • Те, у кого время начала работы в 10 утра, имеют риск увольнения в 1, 36 раза выше, чем те, кто начинают работу в 8 утра (p-value - 0.000566)
Забавно? Это должно иметь какое то объяснение, и я решил, что это результат ложной корреляции или, по другому, за фактором времени начала работу стоит другой, настоящий фактор, влияющий на текучесть персонала, а время начала медиатор.
В качестве гипотезы я предположил, что специалисты на заводах (промышленность), которые расположены в регионах и небольших городах начинают работу чаще в 8 утра, и эти же специалисты работают значимо дольше, но не в силу времени начала работы, а в силу того, что в промышленности более длительный цикл, меньше возможностей в маленьком городе и т.п..
Итого, я проверил интеракции переменной время начала работы со следующими переменными:
  • отрасль;
  • позиция;
  • регион;
  • размер населенного пункта
К удивлению, значимость переменной время начала работы осталось значимой, т.е. мы не нашли переменную, стоящую за переменной время начала работы.
Итого, остается два вариант интерпретации:
  • искать дальше переменную, стоящую за временем начала работы;
  • принять как факт, что время начала работы стресогенный фактор, но в обратную сторону: более раннее время начала работы влияет на удержание персонала.
Вам какой вариант кажется более реальным?

Понравился пост?

если Вы захотите выразить мне благодарность за интересный пост, вы можете перевести небольшую сумму мне на Яндекс кошелек (кликните по кнопке Перевести) 
или сделать перевод на карту Сбербанка,
Номер карты 676 280 38 921 538 46 57 - укажите "за результаты исследования ". 
Или просто покликайте на директ рекламу ниже на странице - у вас это отнимет несколько секунд, а мне принесет немного денег. 
спасибо!

пятница, 24 июня 2016 г.

Ре-концепция блога, новые авторы и как стать автором

Решил поменять концепцию блога.
Суть изменений проста. Цель - взвинчивание градуса саморазвития. Саморазвитие возможно в условиях конкуренции. Поэтому конкурентов надо растить. Не звездоболов критиканов, а тех, кто умеет до зеленых человечков пахать.
Саморазвитие происходит тогда, когда ты видишь рост конкурентов и сам бежишь изо всех сил.
Вот поэтому я решил добавить авторов в блог (у вас есть тоже шанс). С тем, чтобы смотреть, что они делают, учиться у них, спорить с ними, ругаться, давать и получать пинки.
Кстати, авторам моим от меня доставалось от меня сильно, но эти люди из той породы, кого пинки закаляют. Надеюсь, я из той же породы.
В этом и заключается смысл неформального обучения.

Представлю авторов. 

Иван Безуглов - руководитель отдела обучения крупной ритейлинговой сети. Посты Ивана:


Иван был на моем семинаре сто лет назад, на сегодня владеет R лучше моего, я видел его код и понял, что уже отстаю)). При этом Иван не просто технарь, у него много смыслов, что делает его зрелым hr-аналитиком.
Люда Рогова - руководитель отдела отчетности в одном банке (познакомились на моем семинаре по hr-аналитике). Посты Людмилы


Люда - это ваще хардкорд, нечто невероятное)))))) Человек записался на курсы Вышки, где ребята ведут жесткие курсы, и начала сразу с тяжелой артиллерии - с Python. Теперь просто берет и делает.
Мы с Иваном ахаем, мнемся, а Люда идет и делает)
Заметьте, Иван работает в R, Rstudio, Люда в Python, а я линяю в сторону от Rstudio к Python, но мы как-то уживаемся) Абсолютно разные как люди, но похожи в том, что наши тараканы устремились в одну сторону

Как стать автором

Если вы захотите стать автором блога, в чем я сомневаюсь, нахрена вам быть идиотом, зачем вам тратить свои выходные на взрыв мозга, правда?
Но если вы все-таки захотите стать автором, то путь простой:
У меня есть данные опроса Ключевые факторы текучести и удержания персонала, я вам передаю весь дата сет, а вы на основе этих данных строите прогнозную / предиктивную аналитику.
Пост должен быть не только про математику, но и про смыслы. Вы должны поставить гипотезу, показать "вкусноту" идеи, посчитать. Все.
Потом на ваш пост смотрят авторы блога, дают добро, я принимаю окончательное решение.
Предпочтение отдается участникам моего семинара, но не обязательно.
В случае приема в авторы блога пишите, что бох на душу положит. Но про аналитику. edvb@yandex.ru 

воскресенье, 12 июня 2016 г.

Несколько статей по hr аналитике на английском

Я даю ссылки на статьи западных hr-аналитиков в соц сети, решил подвести некоторый бриф, и самые интересные статьи оставить в своем блоге.
Никто не хочет потренироваться в переводе?

  • Recent HR Analytics Themes - независимые консультант по hr аналитике по результатам участия в нескольких конференциях по аналитике описывает состояние дел в этой сфере. Интересные замечания по 2-3 года как цикл развития корпоративной компетенции по hr-аналитике
  • Moneyball for Business: Employee Engagement Meta-Analysis - статья, где обосновывается использование конструкта "вовлеченность персонала", обратите внимание, опять все построено на аналитике: вовлеченность появляется там, где просто показателями игроков не объяснить результаты. 
  • What has Walmart learned from HR analytics? - краткий пересказ результатов hr-аналитики в Юлмарте, хотя здесь только про верхушки, не т ничего про инструменты, включаю только потому, что видел видеоинтервью с hr-директоров Юлмарта, она рассказывала действительно стоящие вещи.
  • Leveraging public data to predict employee attrition - здесь предлагаю обратить внимание на сам ресурс, а статья про соревнование по прогнозу текучести персонала, дается набор предикторов, вы можете поучаствовать в соревновании. Детали не раскрываются, но важен сам подход.
  • Innovations in HR Analytics - видеозапись специалиста Университета Корнелла, сам не смотрел, говорят, системная штука.
  • Analyzing Employee Turnover - Predictive Methods - это уже исключительно для технарей типа меня, но лишний раз подтверждает, что мы на правильном пути и даже где-то поспорить уже можем. Если сравните то, что в статье, с тем, что пишу в блоге, то увидите много общего.
  • Employee Attrition Risk Assessment using Logistic Regression Analysis  - название само за себя говорит. 
  • Employee Attrition: Survival Analysis - это уже собственно в доказательство того, что работаю на общем уровне. Статья может показаться легкой, но я общался с этими товарисчами, они работают на серьезном уровне.
  • People Analytics Using R - Employee Churn- An Example - вот это вообще мужик чумовой, выкладывает коды статистики

Если вы считаете, что список стоит дополнить, кидайте ссылки в комменты!
Спасибо и приятно чтения!
Несколько статей по hr аналитике на английском

Браузер как метка кандидата

Не дает мне покоя тема браузеров как предикторов поведения кандидата. Тема эта зреет давно, получила продолжение недавно в статье Браузер скажет о кандидате то, что не скажет уровень учебной успеваемости. Если вкратце, то логика статьи: пользование не дефолтным браузером говорит о том, что кандидат проявляет инициативу, не удовлетворяется данными ему инструкциями, ищет нечто больше, выходит за рамки.
Я хочу проверить эту гипотезу. В нашем исследовании факторов текучести персонала, которое открыто, вы можете в нем поучаствовать, есть вопрос, в каком браузере вы предпочитаете работать.
Здесь нужно пояснить одну тонкость: в западном исследовании информацию о браузере получали в тот момент, когда кандидат заходил на портал пройти он лайн тест, а в нашем исследовании - мы просим дать самоотчет. Это определяет различие.

Но и тем не менее

Я составил уравнение регрессии, где в качестве выходной переменной выступал стаж работы респондента в компании, а в качестве предиктора - браузер, который респондент указал в качестве основного рабочего. Стаж мы брали только в случае добровольной текучести - когда респондент покинул компанию по собственной причине.

Результат такой

Максимальные различия были обнаружены в стаже между пользователями браузеров Google Chrome и Яндекс Браузер. В качестве основного браузера  Google Chrome указали 1309 респондентов, Яндекс - 224.
Как читать такой тип диаграммы - Анализ и визуализация дожития: чем HR похож на медиков.

  • По оси X - число месяцев стажа
  • По оси Y - вероятность доработать до такого стажа.

Пунктиром показаны доверительные интервалы. 
Для пользователей  Google Chrome медиана стажа работы в компании составляет 31, 5 месяцев;
Для пользователей Яндекс браузера - 37 месяцев.
Беда в том, что значимость различий составляет 0.0853. 
Прогностичной ценности мы не нашли, и я бы не создавал отдельный пост, если бы содержательно данные результаты не соответствовали, на мой взгляд, изложенному в статье Браузер скажет о кандидате то, что не скажет уровень учебной успеваемости. В нашем случае Google Chrome является "дефолтным" - этот браузер указывают более 50 % респондентов как основной. Яндекс браузер является новым, пользование этим браузером говорит, скорее всего, о желании опробовать что-то новое. 

Понравился пост?

если Вы захотите выразить мне благодарность за интересный пост, вы можете перевести небольшую сумму мне на Яндекс кошелек (кликните по кнопке Перевести) 
или сделать перевод на карту Сбербанка,
Номер карты 676 280 38 921 538 46 57 - укажите "пост в блоге". 
Или просто покликайте на директ рекламу ниже на странице - у вас это отнимет несколько секунд, а мне принесет немного денег. 
спасибо!

суббота, 11 июня 2016 г.

Психотип как фактор риска текучести персонала

Очередной результат исследования факторов текучести персонала (пройдите по ссылке и поучаствуйте).
Напомню, что мы использовали результаты психологических тестов для выявления факторов текучести и уже получили интересные результаты (см. Универсальный драйвер текучести персонала). Но предыдущие попытки были связаны с оценкой связи отдельных психологических качеств работника и текучести персонала.
Я попытался посмотреть связь сочетаний качеств и текучести персонала. Использовал для этого кластерный анализ по методу kmeans, а основа для кластерного анализа - результаты респондентов по тесту Big5, который включает следующие шкалы:

  • Интроверсия - экстраверсия;                                                                   
  • Независимость - согласие;                                                                     
  • Импульсивность - самоконтроль;                                                                
  • Тревожность- стабильность;                                                                    
  • Консерватизм- новаторство.
Как вы уже наверное догадались, под психотипами я понимаю получаемые кластеры. Это, безусловно, спорный вопрос, можем ли мы получаемые кластеры обзывать термином "психотипы", но мне в данном контексте представляется это возможным.

Что получилось.

Сразу предупреждаю, результаты жиденькие. В идеале стоило бы разбить результаты на подвыборки по отраслям, позициям и т.п.., но у нас всего выборка 312 респондентов, поэтому пока пока готов предложить только результат по общей группе.
Лучшее количество кластеров - 3. Кластеры имеют такие центры:

1
2
3
Интроверсия - экстраверсия                                                                 
4.31
7
5.32
Независимость - согласие                                                                
4.74
5.56
5.85
Импульсивность - самоконтроль                                                              
6.84
3.82
6.56
Тревожность- стабильность                                                         
6.91
5.72
4.11
Консерватизм- новаторство
5.72
7.42
3.82

В ячейках - средние значения показателя теста для кластера. Далее я построил уравнение регрессии, где в качестве зависимой переменной выступал стаж респондентов (брал только тех, кто ушел по собственному желанию, а не по сокращению и т.п.), а в качестве предикторов - принадлежность к кластеру.

Диаграмма дожития

аПсихотип как фактор риска текучести персонала

Как читать такой тип диаграммы - Анализ и визуализация дожития: чем HR похож на медиков.

  • По оси X - число месяцев стажа
  • По оси Y - вероятность доработать до такого стажа.

Заметно, что респонденты первого кластера работают чуть дольше. Значимость различий 0.0476 для второго кластера и 0.0307 для третьего. Т.е. ниочем....
Точность модели - 0, 54, где 0, 50 - случайность, 1 - высокая точность. Т.е. мы по сути сделали результат чуть выше плинтуса.
И совсем грубо я бы сформулировал результат так: тревожные интроверты чуть дольше задерживаются в компании.
Ну а дальше нужно ждать ваших голосов в исследовании с тем, чтобы посмотреть, как минимум, влияние психотипов на текучесть среди HR. Т.е. если мы говорим, что у нас позиция HR имеет набор общих требований как профессия, то мы могли бы говорить в данном случае об использовании результатов нашего исследования в целях профориентации: если мы выясним, что определенный набор качеств способствует более длительному сроку работы на позиции, мы можем это рекомендовать в качестве базы для профориентации.

Понравился пост?

если Вы захотите выразить мне благодарность за интересный пост, вы можете перевести небольшую сумму мне на Яндекс кошелек (кликните по кнопке Перевести) 
или сделать перевод на карту Сбербанка,
Номер карты 676 280 38 921 538 46 57 - укажите "пост в блоге". 
Или просто покликайте на директ рекламу ниже на странице - у вас это отнимет несколько секунд, а мне принесет немного денег. 
спасибо!

Антимакиавелли Фридриха Великого

Блог про hr аналитику разбавляю книгами по военной стратегии, поскольку это главное мое увлечение.
Мой список книг по военной стратегии пополнился еще двумя:


Людендорфа как всю первую мировую у нас не принято вспоминать, а жаль, поскольку Людендорф по мнению английского историка Лидел Гарта был лучшим стратегом войны, а Фридриха Великого у нас упоминают только в разрезе побед русского оружия в семилетней войне.
но будь моя воля, я бы учил русских школьников по этим книгам. Надо брать лучшее из Истории.
Да, и по опросу среди коллег вот такой рейтинг книг по военной стратегии
И ждите новых цитат в блоге)

Антимакиавелли Фридриха Великого

пятница, 10 июня 2016 г.

Критический взгляд на анализ эмоций по фото

Недавно мы вам продемонстрировали возможность анализа эмоций по фото (см. этот пост).
Сейчас я хотел бы более критично посмотреть на данный анализ.
Возможность потокового распознавания эмоций существует достаточно давно, системы распознавания верой и правдой служат различным спец.службам и охранным структурам.
Разумеется, подобная услуга доступна и частным лицам.
В последнее время верификацией эмоций (профайлингом, если будет угодно) занимается достаточно много специалистов, разумеется, каждый кулик хвалит своё болото. В данном посте я не буду сравнивать эффективность человека и компьютера, моя цель посмотреть насколько точно алгоритм от Microsoft определяет эмоции.
В своё время я активно интересовался определением эмоций, познакомился с трудами Пола Экмана, системой FACS - Facial Action Coding System (Система Кодирования Лицевых Движений).
Думаю, что в основе алгоритма от Microsoft  лежит нечто подобное.
И так, для теста я отобрал классические фото эмоций, которые многим могут быть знакомы:


 Первая эмоция: Удивление, почти 100% попадание.

четверг, 9 июня 2016 г.

Анализ эмоций человека по фото

Анализ эмоций человека по фото может быть полезна во многих случаях: у меня был реальный заказ от автосалона прогнозировать по фото человека на входе, собирается ли он покупать машину или просто посмотреть... (в свое время мне продавцы салонов рассказывали, что простых "поглядеть" называют "конями").
В рекрутинге анализ эмоций по фото может быть использован в нескольких ситуациях:

  • использование данных фото резюме при построении прогнозных аналитик;
  • анализ эмоций на собеседовании, как источник;
  • тренажер эмоционального интеллекта для рекрутеров, специалистов по ассессмент центру и т.п.: вы предъявляете фото, просите назвать те эмоции которые фото выражает а потом предъявляете оценку машиной;
  • управление собственными эмоциями и т.п...

Для этого мы предлагаем услугу анализа эмоций по фото. А также анализ эмоций кандидата по видео. И, конечно же, технологию оценки по фото придумали не мы, а компания microsoft:) А мы только эти решения доносим. Пишите edvb@yandex.ru

Описание

Вы присылаете фото, мы в виде результата предоставляем отчет в виде диаграммы выраженности эмоций. Вот как это выглядит

Мона Лиза


Не согласны с нашим анализом эмоций по фото Мона Лизы?_
Анализ эмоций человека по фото














Барак Обама



















Путин (фото из Википедии)


Эйнштейн



Ну и я


Вот так живешь и не знаешь, какие эмоции испытываешь....

Анализ эмоций человека по фото