何ができるの？機械学習の学習モデル10種類の特徴と活用事例

様々な分野で活用されている機械学習。

言葉は聞いたことがあっても、実際にどんな場面で活用できるか理解している人は少ないのではないでしょうか？

機械学習には様々な手法があるため、今回の記事では代表的な10種類の学習モデルについて、それぞれの特徴と活用事例を紹介させていただきます。

機械学習とは

まず、機械学習と混同しやすい言葉に人工知能やディープラーニングがありますが、それらの関係は以下の図のようになっています。機械学習は人工知能に含まれており、機械学習の一部にディープラーニングという技術があります。歴史的に見ても、はじめに人工知能（AI）という概念が生まれ、次に機械学習が発展し、最後にディープラーニングが登場しました。

▼AIについてはこちらの記事をご参照ください。

2021年11月22日【AI活用の第一歩】正しく知ってる？AIの定義や歴史、種類など

機械学習はその名の通り機械が学習して特定のタスクを遂行する技術ですが、学習の方法には大きく分けて教師あり学習、教師なし学習、強化学習の3種類があります。さらに、教師あり学習は回帰と分類に分けられており、それぞれの学習方法には様々なモデルが存在します。

10種類の機械学習の学習モデルとその事例

この記事の本題はここからです。

機械学習には様々な学習モデルがありますが、それぞれどのような場面で活用されており、どんな特徴があるのでしょうか？

事例を挙げて順番に紹介していきます。

線形回帰

事例

収縮期血圧と年齢の関係について分析する
駅の平均乗降客数と売上高の関係について分析する
ビールの販売ケース数と最高気温の関係について分析する
あるクラスの点数の分布から学年全体の点数の分布を分析する

線形回帰は主に、年齢と血圧、売上と来店客数、所得と消費のように、ある一方が他方を左右するという一方向の関係にあるものの分析に使います。

予測したい変数は従属変数(または目的変数)、他の変数の値を予測するために使用する変数は独立変数(または説明変数)と呼ばれます。

正則化

事例

線形回帰と同様

機械学習で学習モデルを構築する際には、「過学習」と言って、コンピューターが手元にあるデータから学習しすぎた結果予測がうまくできなくなってしまう状態に陥ることがあります。線形回帰は連続変数の予測モデルとして優れていますが、説明変数が増えると過学習してしまうことがあります。

正則化とは、線形回帰の過学習を防ぐために使用するもので、複雑になったモデルをシンプルにすることで過学習を解決します。

サポートベクターマシン（SVM）

事例

迷惑メールと通常のメールの区別
郵便番号を認識して分類する
事前に画像ピクセルから出された値から顔を否かを識別する（顔認識）
あらゆる地域・災害を対象に、過去のデータから災害危険度を評価する

機械学習の方法としてパターン認識という手法があります。パターン認識とは、画像や音声などといった膨大なデータの中から一定の特徴や規則性を選別して取り出す処理のことです。この認識方法は人間はごく自然に行っていますが、これをコンピューターに実現させるためにパターン認識を活用します。

SVM はパターン認識の手法を用いて物事を分類することです。SVMの特徴として、データの次元が大きくなっても識別精度が高いことや、最適化すべきパラメータが少ないことが挙げられます。

決定木・ランダムフォレスト

事例

休日、天気などの要素がアイスクリーム購入者の行動にどれだけ影響を与えているのか分析する
Webサイト上での行動履歴や登録された個人の属性情報を用いるデジタルマーケティング
テニスの未経験者層において、今後テニスを行う見込みが高い層にはどのような特徴があるのか分析する

決定木とは、データから”木”構造（樹形図）の予測モデルを作る機械学習の手法であり、何らかの意思決定を助けるために用いられるものです。そして、複数の決定木を集めたものをランダムフォレストと言います。

画像引用：Cacco 決定木分析（ディシジョンツリー）とは？概要や活用方法、ランダムフォレストも解説

決定木は解析対象のデータの分布を仮定しないノンパラメトリックな手法であり、様々な尺度を用いることができ、外れ値にも強いという特徴があります。一方で、他の機械学習の手法に比べ分類精度は低く、線形データにはあまり適していません。過学習を起こしやすいため、いくつかのパラメータの調整も必要になります。