.

Сделать репост в соц сети!

среда, 27 декабря 2017 г.

Влияние гендера команды на успешность в игре ЧТО ГДЕ КОГДА



Наша команда аналитиков решила заняться в свободное от работы время (новогоднюю ночь) ответом на вопрос, как diversity влияет на успешность в игре ЧТО ГДЕ КОГДА.
diversity - это ситуация, когда предельное разнообразие команды влияет на ее эффективность.
Наиболее известный пример  diversity - пример Google Блог компании Google и политики diversity. Якобы в компании есть политика принимать на работу не менее 20 % женщин для обеспечения diversity. И еще из Google уволили одного разработчика, который усомнился в способностях женщин. В Apple появился вице-президент по многообразию и меньшинствам - тут вообще политика diversity вынесена на высший уровень. Не чурается этой темы и гранд гуру HR Джош Берсин. Переворот рынка HR технологий: 10 топ трендов 2018. Посмотрите шестой тренд: "....в ядре рекрутинга сейчас находится разнообразие (diversity)....".
Но я никак не мог найти нормальных доказательств на уровне цифр, которые бы показывали, что diversity действительно влияют на эффективность команды. Я встречал вот типа такие исследования Что делает команду более умной? Больше женщин - это лабораторные игры, которые не имеют отношения к бизнесу. Хотя красиво, не скрою.

Задача

В какой то момент у меня родилась идея, как проверить diversity - взять игру ЧТО ГДЕ КОГДА. Там есть абсолютно четкий результат (скептики скажут, что там все подстроено, но даже в этой ситуации diversity как бе работать должно). У нас есть команда из шести человек. Мы можем посмотреть, как diversity  команды связано с эффективностю. И в любом случае согласитесь, что результат игры это бизнесовый результат поскольку на кону деньги. Все честно.
Итого, осталось раздобыть данные и сделать анализ.
Но с сайта игры крайне сложно выкачать данные игр
А я обладаю нехорошим качеством: нетерпелив. Поэтому нашел скорострельное решение. Только про гендер.
Взял информацию с турнира Открытый Кубок России 2017. В турнире принимали участие несколько сотен команд, что делает доступным анализ. Кроме того, информацию можно скачать прямо с сайта в файле csv + есть информация по игрокам (фио).
Через признак ФИО достаточно легко определить пол игрока, из него я получаю общий признак пола по команде: мужчин я мечу как "1", женщин как "0". И признак команды принимает значения от 0 (одни дамы) до 6 (одни мужики). Этот признак и будет у нас обозначать diversity.
Правда там одна странность - было много команд с меньшим числов игроков, чем 6, были и те, что более шести. Я, не парясь, оставил только те, где были ровно шесть игроков в команде.
Задача такая: посмотреть взаимосвязь между количеством мужчин в команде (diversity) и местом с турнире.
В этом анализе есть еще одна интрига - Что делает команду более умной? Больше женщин - западные исследования показали, что присутствие женщин в команде делает ее более эффективной. И вот наш российский импортозамещающий ответ.

Результат

  1. Корреляция по Пирсону между местом в Кубке и числом мужчин в команды равна cor -0.1952639 при p-value = 4.125e-05
  2. Корреляция по Спирмену между местом и числом мужчин в команды равна cor -0.1895072  при p-value = 6.973e-05

Неплохо, правда?)
Влияние гендера команды на успешность в игре ЧТО ГДЕ КОГДА

Ну на картинке все вроде понятно, не надо объяснять. Просто в качестве коммента: команды из одних дам выше 200 места не поднимались. Дамы, берите хотя бы одного мужика на разживку, а?

Загогулина

А вот если эта связь нелинейна, а? А тогда давайте мы построим линейную регрессию, где признак "количество мужчин" выступает не как числовая переменная, а как фактор. А давайте: diversity в нашем случае был бы ближе как раз к нелинейной связи, т.е. наиболее diversity сочетание было бы 3 (половинка на половинку).
Call:
lm(formula = q$Место ~ as.factor(q$ген))

Residuals:
    Min      1Q  Median      3Q     Max
-354.08 -171.16  -36.56  164.57  472.84

Coefficients:
                  Estimate Std. Error t value Pr(>|t|)   
(Intercept)         466.19      59.84   7.790 5.11e-14 ***
as.factor(q$ген)1   -70.11      86.38  -0.812  0.41743   
as.factor(q$ген)2   -32.65      69.82  -0.468  0.64027   
as.factor(q$ген)3  -107.38      63.97  -1.678  0.09399 . 
as.factor(q$ген)4  -161.03      62.52  -2.576  0.01034 * 
as.factor(q$ген)5  -146.64      63.37  -2.314  0.02115 * 
as.factor(q$ген)6  -204.50      70.36  -2.907  0.00384 **
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 215.8 on 428 degrees of freedom
Multiple R-squared:  0.04798, Adjusted R-squared:  0.03464

F-statistic: 3.595 on 6 and 428 DF,  p-value: 0.001729


F статистика значима, уже хорошо, объясненная дисперсия, правда, всего 4 % (а adjusted - чуть больше трех % объясняет). Но связь то есть.
И самый сильный коэффициент у уровня "6", т.е. если в команде все 6 мужчин, то вероятность более высокого места выше.
Полиномные регрессии тоже не дали результата.
* да, преобразования типа Бокса Кокса, логарифмирование и т.п. тоже ничего не дали, порядок факторов такое же.
........................
Дамы, простите, ничего личного,  это у них там на Западе дамы и diversity делают эффективность команды, а у нас суровые российские условия диктуют свои условия.

В этом месте как бе следует часть "Обсуждение результатов", но я лично не понимаю, а чего тут обсуждать, вроде все себе вполне понятно. Если мы обсуждаем тему diversity, то в нашем случае гипотеза про гендерное diversity для данного конкретного кейса не подтвердилась.
Но это не все данные, не все команды, не все переменные. И не все ваши возражения, комментарии, подъ...ки я еще выслушал) Пишите, буду рад. Больше всего мне бы хотелось услышать от вас наводки на то, где diversity реально бы работало.

__________________________________________________________
На этом все, читайте нас в фейсбуке и телеграмме

2 комментария:

  1. Спасибо за тему для размышлений. Очень интересный пример.
    У меня вот такие мысли появились на этот счет. Если рассматривать влияние пола, то необходимо учитывать и биологические аспекты этого влияния. То есть гипотеза следующая. Влияние гендера на эффективность можно связать с влиянием тестостерона на поведение. В биологии, медицине известно, что более высокий уровень тестостерона и его колебания (повышение) в ходе деятельности обеспечивает мужчинам соревновательность и стремление к конкуренции. Тогда как у женщин, тестостероновых всплесков, как правило нет и поэтому они менее склонны к соревновательности. Следовательно, в таких видах деятельности где есть ярко выраженный элемент соревнования и конкуренции, преобладание мужчин более повлияет на эффективность и достигнутый результат (поэтому команды где больше мужчин занимали более высокие места). А, возможно, там, где нет условий соревнований, присутствие женщин позволит более точно и результативно выполнить обычную работу.

    ОтветитьУдалить
  2. Ремарка к этой цитате: "результат игры это бизнесовый результат поскольку на кону деньги". В спортивном ЧГК, результаты которого вы анализировали, никто не выигрывает никаких денег, в отличии от телевизионной версии.

    ОтветитьУдалить