機械学習リニューアル情報公開
2022.09.15
改めてリニューアルの目的
既存の機械学習機能が大きく進化いたします。
オートMLの追加、解釈性の向上、を大きなテーマとして掲げておりますが、本ノートでは解釈性の向上がどのようになされるのか、一部情報をお届けします。
なお、機械学習モデルの解釈を行うための情報は、ボニートくんから確認できる予定です。
※画面はすべて開発中のものである点ご注意ください。
1.モデル情報のサマリが確認できる
モデル構築後、まず確認すべき事項をまとめたものを用意。
内部的に行われた精度検証の結果から、モデルの有用性を確認できます。
観察手法としてはベタな「混合行列」や各種指標が並んでいます。また「モデルの信頼性」という独自指標も提供予定。
2.内部のプロセスを把握できる
データがどういう前処理をされたのか、どういう精度検証をしたのか、どうやってモデルが作られているのか、を把握することができます。
下記の例だと「年齢」という列が事前に「数値列変換」されて機械学習モデルに入力されていることがわかりますね。
3.機械が重視したデータとは?
構築されたモデルがどの列を重視したのか、影響が大きかった列を把握できます。
例えば、退職or勤続、を目的変数として構築されたモデルにおいては、「年齢」が最も重要視されており、下の範囲を見ると
年齢が低いほど青、つまり「退職」に
年齢が高いほど赤、つまり「勤続」に
影響を与えていることがわかります。
4.あなたのモデルはなぜ精度が悪いのか?
とまぁ若干煽るようなテーマを記載しましたが、つまり、精度が悪い原因を特定することができます。
まず、最も精度を悪化させているのは「勤続年数」のせいであることがわかります。
読み進めると、
勤続年数が少ない場合は青、つまり「精度を上げている」
勤続年数が一定を超えた範囲は赤、「精度を下げている」
さらに勤続年数が多くなってくると青、「精度を上げている」
つまり、勤続年数が中間くらいの人は予測が当たりづらく、これが精度を押し下げていることがわかります。
勤続年数の扱いを見直すなど、対策することで精度を改善できるかもしれない、ということです。
5.設定ごとのモデル精度一覧
現機械学習機能にある、パラメータの組み合わせごとの精度比較も行い、ベストモデルを自動で構築してくれる機能は健在です。
おまけ:機械学習の設定をよりしやすく
パワーアップした機械学習機能では、設定のしやすさにも力を入れています。
前処理設定のイメージを一部公開します。
設定例1:外れ値処理
新しく、前処理パターンに数値の外れ値処理を設定できるようになります。
設定例2:列ごとの処理を細かく設定
列ごとに手法を割り当てることが可能に。
設定例3:新規手法も追加
手法を吟味し、色々追加しております。
最後に
いかがでしたでしょうか。
ビジネスにAIを取り入れる上で、最も課題となっているのは中身がブラックボックスであることです。
その課題をできるだけ解決することが「解釈性の向上」の大きな目的です。
ぜひ、リニューアルまで今しばらくお待ち下さい。