既存の機械学習機能が大きく進化いたします。
オートMLの追加、解釈性の向上、を大きなテーマとして掲げておりますが、本ノートでは解釈性の向上がどのようになされるのか、一部情報をお届けします。
なお、機械学習モデルの解釈を行うための情報は、ボニートくんから確認できる予定です。
※画面はすべて開発中のものである点ご注意ください。
モデル構築後、まず確認すべき事項をまとめたものを用意。
内部的に行われた精度検証の結果から、モデルの有用性を確認できます。
観察手法としてはベタな「混合行列」や各種指標が並んでいます。また「モデルの信頼性」という独自指標も提供予定。
データがどういう前処理をされたのか、どういう精度検証をしたのか、どうやってモデルが作られているのか、を把握することができます。
下記の例だと「年齢」という列が事前に「数値列変換」されて機械学習モデルに入力されていることがわかりますね。
構築されたモデルがどの列を重視したのか、影響が大きかった列を把握できます。
例えば、退職or勤続、を目的変数として構築されたモデルにおいては、「年齢」が最も重要視されており、下の範囲を見ると
年齢が低いほど青、つまり「退職」に
年齢が高いほど赤、つまり「勤続」に
影響を与えていることがわかります。
とまぁ若干煽るようなテーマを記載しましたが、つまり、精度が悪い原因を特定することができます。
まず、最も精度を悪化させているのは「勤続年数」のせいであることがわかります。
読み進めると、
勤続年数が少ない場合は青、つまり「精度を上げている」
勤続年数が一定を超えた範囲は赤、「精度を下げている」
さらに勤続年数が多くなってくると青、「精度を上げている」
つまり、勤続年数が中間くらいの人は予測が当たりづらく、これが精度を押し下げていることがわかります。
勤続年数の扱いを見直すなど、対策することで精度を改善できるかもしれない、ということです。
現機械学習機能にある、パラメータの組み合わせごとの精度比較も行い、ベストモデルを自動で構築してくれる機能は健在です。
パワーアップした機械学習機能では、設定のしやすさにも力を入れています。
前処理設定のイメージを一部公開します。
新しく、前処理パターンに数値の外れ値処理を設定できるようになります。
列ごとに手法を割り当てることが可能に。
手法を吟味し、色々追加しております。
いかがでしたでしょうか。
ビジネスにAIを取り入れる上で、最も課題となっているのは中身がブラックボックスであることです。
その課題をできるだけ解決することが「解釈性の向上」の大きな目的です。
ぜひ、リニューアルまで今しばらくお待ち下さい。