とりあえずやってみればいいじゃん

読者です 読者をやめる 読者になる 読者になる

とりあえずやってみればいいじゃん

エンジニア関連のことについてつらつら書くブログ

読書メモ:統計学が最強の学問である[ビジネス編] - 人事のための統計学

読んだ本の内容を忘れないためのメモです。

対象の本

統計学が最強の学問である - ビジネス編

この記事で記述する範囲

第2章 人事のための統計学

内容要約

優秀な人は採れてますか?

いくら画期的な経営手法やツールを導入しても、そもそも従業員の能力がなければ業績は上がらない。ゆえに、優秀な人材を採用できるかどうかという問題は大きなインパクトをもたらす。

選考方法によってその後の生産性や業績がどの程度予想できるかという研究結果もあり、例えばワークサンプルテスト(入社後担当するであろう仕事の一部をサンプルとしてやってもらうテスト)の決定係数は0.29であり、採用後の業績の3割は予想がつくということである。この研究では構造的ではない一般的な面接は14%の業績しか予想できないと出ている。

一般知能と状況適合理論

SPIなどで測る一般認知能力は「だいたいなんでも知的な活動とはよく相関する」指標になるよう設計されているので、知的活動である仕事への相関もある程度高いと考えられている。とは言っても全ての企業がSPIなどで高得点の人を採用できるわけではない。そこで役に立つのが状況適合理論である。昔から、良いリーダーとそうでないリーダーの違いはどこになるかという研究がされていたが芳しい結論は出なかった。この分野の研究にブレークスルーが生じたのはパーソナリティ(性格)への理解が深まったことである。例えばビッグファイブと呼ばれる5つの軸での性格特性の見方が確立した。ビッグファイブには以下の5つが含まれる。

  • 外向性(社交性)
  • 調和性(人当たりの良さ、気立ての良さ)
  • 誠実性(責任感の強さや完璧主義)
  • 感情の安定性(物事への動じなさや慎重さ)
  • 経験への開放性(想像力や芸術的な感性)

これにより様々な人間の性格はこの5つの軸にまとめられることが明らかになった。そして次第に「どのような状況でどのようなリーダーが機能するのか」という状況とリーダーシップの相性問題に対して強い関心を向けるようになった。これが状況適合理論という考え方である。メジャーな状況適合理論の一つにパス・ゴール理論がある。この理論ではリーダーは以下の4つに分類される。

  • 指示型リーダー(やるべきタスクとスケジュールを整理し達成方法を具体的に指示)
  • 支援型リーダー(親しみやすく部下の希望に配慮)
  • 参加型リーダー(部下に相談し彼らの提案を活用して意思決定)
  • 達成思考型リーダー(達成困難な目標を示し部下に全力を尽くすよう要求)

そしてこれらのリーダーが「良いリーダー」となるか否かは場や部下などの状況次第だという。要するに、従業員の価値は優秀か否かだけでなく、状況とその人の特性の相性問題と捉えるべきというのが状況適合理論の考え方である。そのため、この手の先行研究があっても究極的には自分の会社で同じように適用できるとは限らず、自分で調査を行って人事施策をとる必要がある。

人事のための分析手順①分析対象の設定

分析の基本的な流れは以下のようになる。

  1. 分析対象の設定
  2. 変数のアイディア出し
  3. 必要なデータの収集
  4. 得られたデータの分析
  5. 分析結果の解釈

まず分析対象の設定から考えていく。人事における解析単位は人間であり、自社を儲けさせてくれる人とそうでない人の違いは何かという観点で行う。解析単位は最低数十、できれば数百程度は欲しい。その中で、全く異なる職種、環境、仕事内容の人を一緒くたに分析するとあまり良い結果は得られないかもしれない。

解析対象を広げるために他社の従業員も解析対象にするのは一つの手である。自社の人員データだけで分析してしまうとデータの「打ち切り」や「切断」※という現象が問題になることがある。例えばSPIの高得点者だけしか社内にいない状況だと低得点者のデータがないためにSPIと業績の関連性が見られない可能性がある。逆に分析対象者が大量にいるのであれば、同じ営業でも法人営業、バイヤー営業などにわけると良いかもしれない。範囲の区切りは特にこれがいいということはなく、可能であれば並行して複数の範囲で分析するとよい。しかしそもそも論として、分析の費用対効果は考えなくてはならない。

人事のための分析手順②変数のアイディア出し

分析する変数は求める結果として現れるアウトカム※とアウトカムに影響を与えているかもしれない説明変数に分けられる。人事分析は明確に利益につながる指標が定義されているわけではないため、アウトカムの定義が難しい。指標を誤って設定してしまうとせっかくの分析が無駄になってしまう。伝票の処理件数を指標にした場合、分析が成り立つのは1件の伝票にかかる手間がほぼ均一な場合だけであり、難易度によって担当者を変えていたら成立しない。理想的に言えば、一定期間、処理する伝票の難易度を分けずに処理してもらい、時間あたり何件処理したかを比較すれば良い。このように評価の期間だけランダム性を取り入れるのは他の職種にも応用可能な話である。

次に説明変数について。人材の捉え方は大きく分けるとIQのような認知能力、特定分野の知識・経験、ビッグファイブのような性格特性、でもグラフィック属性などがある。専門知識と経験は筆記テスト以外にワークサンプルテストのような方法で測ることができる。認知能力は「数的知性と言語的知性」のように2軸で捉えるものもあれば、サーストンの7因子知性※で捉えるものもある。さらに最近では非認知能力(IQのような認知に関わる能力ではない能力)が注目され始めている。日本でもEQ、すなわち心の知能指数が一時期話題になった。このように様々な可能性を考え、その中でも特にどの説明変数のデータを得なければいけないかを考える。

人事のための分析手順③必要なデータの収集

新規で調査を行う際はまず社内にどのような人材に関するデータがあるか明らかにし、眠っているデータを活用したい。データを揃えたら既に考えておいたアウトカムとできるだけ一致するような指標はどのように定義できるかを考える。現実的なデータの制約(一部不完全なデータがある等)を考慮した上で最も良いアウトカムを考える。アウトカムが決まったらアウトカムとの関連が当たり前ではない項目をリストアップする。

データが不足していれば新規でどのようなデータを調査するか考えなければならない。特にアウトカムに関するデータ不足は致命的である。欠損している、あるいは曖昧な場合は可能な限り関係者に確認する作業が必要となる。それがどうしてもできなければ別の妥当なアウトカムを考えなければいけない。説明変数に関わるデータが不足していて追加で調査をしようとした場合は、単純に直球なアンケートを取ればいいというわけではない。質問作成には専門性を要するため、専門家が作った測定尺度を使って分析する方が簡単である。例えば知りたい概念と「質問紙尺度」という言葉を合わせてGoogle検索すれば意外と専門家が作った心理測定尺度が見つかる。あるいは『心理測定尺度集』という本も参考になる。近年ではビッグファイルを10項目の質問で測定できるようになっているのでそれを使ってもよい。

ただ、尺度自体はよくできていても例えばEQを測る質問紙に対し、自分を良く見せようとウソの回答をすることが起こりうる。そのため他者からの評価を用いたり、意図的に細工しづらい方法(集中力がいる問題を騒がしい環境で解いてもらうなど)を取るという手もある。データの偏りが出ないよう、もしくは出たとしても補正できるようデータの取り方を工夫することが人材分析を行う上で最も重要なポイントである。

人事のための分析手順④得られたデータの分析

基本的には第1章で説明した通り※。1つだけ異なるところは人事のための分析では時に縮約(多数の変数をより少ない数の変数にまとめ直す)という作業が必要になるという点である。異なる尺度を組み合わせて使う場合、もしくは自分たちで質問項目を作った場合は最低限エクセルの「分析ツール」機能やCORREL関数を確認すべきである。 ※写真 ビッグファイブに加えて「どんな仕事でも積極的に取り組んでいく」という自分で作った質問項目を実施した時、外向性の得点とこの項目の相関が高いため、わざわざこの項目を追加質問しなくても良いということがわかる。また「泣ける映画やドラマを好んで見る方だ」と「どんなに忙しくても受けた恩は忘れず報いたい」の質問は互いに相関し合っているので、一方だけ採用するか両者の得点を合算した説明変数を新たに作る。前者の場合はアウトカムとの関連性がしっくりする方を採用すると良い。後者の場合はどちらも同じくらい重要、もしくは2つに共通する裏の何かが重要な場合に取るべきやり方である。

追加質問項目が増えた場合、どれが相関し合っていてどれを除外すべきかがわからなくなってくる。その時使われるのが因子分析である。同じ因子と関連する質問項目の得点を足し合わせて「外交性得点」などとまとめてしまえば良い。なお、逆転項目(調和性の高さを測る質問の中に調和性の低さを測る質問があるなど)の場合は得点を逆にする(5段階得点の場合、1なら5にする)必要がある。このように自分で項目を追加すると多大な労力を要するのでできるだけ専門家が作った尺度のみを使うのが望ましい。

もしアウトカムが定量的な数値であれば重回帰分析を、逆に定性的な場合はロジスティック回帰を行う。

人事のための分析手順⑤分析結果の解釈

ロジスティック回帰に関する詳しいことは『統計学が最強の学問である - 実践編』に書いている。オッズ比とはロジスティック回帰によって得られる「該当する確率が(もともと十分小さい時に)おおよそ何倍になると考えられるのか」という結果の指標である。例えば「全体の上位5%に該当する優秀者か」というアウトカムで男性のオッズ比が0.96であった場合、それ以外(つまり女性)と比べて優秀である確率が0.96倍ということになる。つまりもし女性スタッフの5%が優秀ならば、男性スタッフの優秀者割合は0.96倍の4.8%である。いずれにしてもオッズ比が1より大きいと該当しやすく、1より小さいと該当しにくい。極端に1から遠い説明変数はアウトカムとの関連性は高いと言える。性別のように定性的な説明変数については「当てはまる場合、[アウトカム]である確率は何倍」という見方をし、経費額のような定量的説明変数については「1増えるごとに[アウトカム]である確率は何倍ずつ増えるか」という見方をする。

気をつけなければいけないのは例えば「優秀なスタッフか否か」というアウトカムの場合、あくまで上司や同僚から「優秀」と評価されたかどうかなので会社全体から見て優秀かどうかは判断できないということである。特に気をつけなくてはならないのは、これまでの経験や直感に反する結果が得られた場合である。大きな可能性を持っている反面、アクションにつなげるのに大きな反感をくらう場合がある。そのため単純なミスでこのような結果になってないかよく確認し、それでも結果が変わらない場合は今まで見落としていた大発見ということになる。

分析結果から示唆される取るべきアクションは「変えること」「ずらすこと」の2つに分けられる。前者については例えば感情の安定性の向上のためにアンガーマネジメント(怒りをコントロールする技術)トレーニングを導入するというのも一つのやり方である。変えるアクションの有効性を検証するには一方には上記のような研修を実施し、一方には従来の研修を実施して比較をすれば良い。後者については性別など変えることができないものに対して用いる。つまり次から採用する人を今回明らかになった属性の人にしていくなど、今いる1人1人は変えずに会社全体として変えていくということである。

最後に、こうした打ち手を考える上でもう1つエビデンスを紹介する。欧米の人的資源管理においてはハイ・パフォーマンス・ワーク・プラクティス(HPWP)が注目されている。自分の会社にとって優秀な人材にどうアプローチし、評価、採用、昇進させるのか、どのようにワークライフバランスを設計するのかなど様々な分野から構成されている。これは有効な施策の候補となるがむやみに推し進めればいいというわけではない。特に注意すべきなのがインセンティブ給の取り扱いである。個人の成果の測定が容易であれば成果給は大きな効果をもたらすが、チーム作業や成果の客観的測定が難しい場合は下手をすれば互いがサポートをしなくなり逆にマイナス影響が出ることもある。それよりゲインシェアリングと呼ばれる利益分割方法を採用した方がパフォーマンスが向上するという結果も出ている。

本章では話が拡散しないよう個人の能力や資質というところに絞って言及したがこれ以外に考慮すべき説明変数として組織的要因というものもある。失敗が許されない雰囲気では本来の能力を発揮できないかもしれないし、本人は特別業績を上げていなくても周りが集中しやすい環境づくりをしているかもしれない。従業員満足度調査のためのフォームはすでに数多く出ており、そうした調査を追加で行うことでどのような組織要因が重要でそれをどのように改善すればどれほど業績に影響するのかが示唆されるはずである。すでにあるエビデンスとしては従業員満足度が高い、もしくはともに働く人が信頼できる度合いが高いと生産性が高い傾向があるということである。また、従業員の入れ替わりは少ない方が生産性は向上する。さらに究極の人事とは経営陣を誰にするかというものであり、経営層の能力や特徴が企業の能力や特徴を基礎づけるという上層部理論を提唱した。真に優秀な経営者とはどのような人物なのかを明らかにしそのような人を置けば全社的な業績に大きな影響を及ぼす。

補足

アウトカム

分析の時に最も重要になる最大化/最小化したい値のこと。可能な限り収益性や生産性に直結するよう注意深く設定された業績。一般的に統計学では結果変数、従属変数、yと呼ばれ、機械学習の世界では外的基準と呼ばれる。

サーストンの7因子知性

  1. 空間や立体を知覚する空間的知能
  2. 計算能力についての数的知能
  3. 言葉や文章の意味を理解する言語的知能
  4. 判断や反応の速さに繋がる知覚的知能
  5. 論理的推論を行う推理的知能
  6. 言葉を速く柔軟に使う流暢性知能
  7. 暗記力を示す記憶知能

第1章で説明された分析に関する話

この世には様々な分析手法が存在するが基本的には重回帰分析が使えるようになっておけば良い。重回帰分析とは数量に対してどのような要因がどれほど影響しているかを分析できる手法である。詳しく知りたい人は『統計学が最強の学問である - 実践編』を読むと良い。

重回帰分析を知らない人は単純集計に頼ることかと思うが、これには少なくとも2つの問題がある。1つ目は手間である。何百という説明変数を分析するために何百回もエクセルで分析し、何百ものグラフに目を通さなければならない上にどのグラフが重要なのかがわからないのでは価値がない。2つ目は単純な集計で見つけた結果が本当に因果関係を持っているのかわからないという点である。一方重回帰分析のような多変量解析手法は「他の説明変数の条件が一定ならばこの説明変数が1増えるごとに求めたい数量がどれだけ増えるか減るか」という形で結果を得ることができるため、単純集計よりミスリーディングな結果をだいぶ回避することができる。

重回帰分析を行う際に注意しなければならないことは、分析対象の数量より説明変数の数は少なくなければならないということである。競合企業をリストアップして分析する場合、対象が30社しかないのに100の説明変数を使って分析することは数理的にできない(連立方程式のようなイメージ)。

統計的に信頼できる説明変数を選び出すアルゴリズムでおすすめなのはステップワイズ法である。複数の説明変数を順番に単回帰分析を行い、最も優秀な説明変数を見つけ出す。次に残りの説明変数と先程の最も優秀な説明変数1つと組み合わせた重回帰分析を行った時に最も優秀な説明変数を探す。このように説明変数を1つずつ追加(場合によっては削除)し、最適化されたら説明変数の探索を終了する。普通に分析する分にはステップワイズ法で十分であると考えるが、近年ではラッソ正則化などの方が望ましいという考え方もある。興味があれば『統計的学習の基礎 ―データマイニング・推論・予測―』を読むと良い。

こうした手法よりも重要になってくるのが「当たり前過ぎる説明変数が入っていないか」「それがわかってもどうしようもない説明変数が入っていないか」ということであり、試しにそれらを削除した上でやり直すこともポイントである。

「切断」と「打ち切り」

切断は例えば入社試験のスコアが一定以上でないと採用されない時などに起こり、打ち切りは例えばテストの性質上100点以上にならないなどという場合に起こる。これに対しデータの取り方自体を工夫することも考えると良い。例えば通常の採用基準であれば落とす者をあえて採用するという枠を設けておき、その後の業績を観察する。そこまでは難しいということであれば不採用者がその後どのような企業でどのような地位にいるのかを調査会社を通じて調べると良い。