本記事は、データ活用に関する最新の取組みや業界動向をより多くのかたにお届けするために、Qiita投稿ページと株式会社ジールが運営するメディア「BI online」に掲載しています。
目次
はじめに
こんにちは、株式会社ジールの Suguru-Terouchi です。 いまさらAI学んでみた(第1回)の第2回目に続いて第3回目になります。 前回、以下のような形で「ネコ」という答えと共に画像データを教えていく手法を「教師あり学習」という話をしました。
「教師あり学習」というくらいなので逆に「教師なし学習」という手法があるので 今回は「教師なし学習」について書いていきたいと思います。
教師なし学習ってなに?
簡単にいうと「教師あり学習」から答えの「ネコ」という情報を与えない手法です。 え、そんな意地悪なことしなくてもええやん・・・と思うかも知れませんが、 「教師あり学習」と「教師なし学習」では用途が違います。 ではまずはおさらいからです、前回、教師あり学習の説明をする際に「ネコ」と「イヌ」を見分けるという話をしましたが、 これは別の言い方をすると入力されたデータを「ネコ」か「イヌ」に分類分け(カテゴライズ)を行っていてそこから回答を導き出していました。 ※厳密にはもう一つ、株価の予測や気象分析等に利用される「回帰」という用途もあります。 では「教師なし学習」はなにが違うのかというと、「ネコ」や「イヌ」のように明確な答えがない問題に対して使います。 あー、ナルホド意地悪したいんじゃなくて、答えを教えたくても教えられないってことですね。納得です。
・・・ただ明確な答えがない問題と言われてもパッとは思いつかないですよね?
身近な例でいうとAmaz〇nのような通販サイトでお買い物をしている時に
「この商品を買った人はこれも買ってるよ!」というような形でおススメ(レコメンデーション)された経験があるかと思いますが、
これは「教師なし学習」によるものなんですね。
正式には「アソシエーション分析」といい、データ間の関連を発見する手法になります。
・・・開店したばかりでデータが少なかったのか、おススメ失敗してしまいましたが、
データが集まって来ることによって成功率も上がってくるはずです!
まとめ
このように「教師なし学習」は入力されたデータから共通点や傾向を見出し、グループ分けするための手法となります。
「教師あり学習」と比べると「教師なし学習」は少しイメージしにくい部分があるかも知れませんが、
人間が同じことをするよりも遥かに大量のデータを読み込み、そこから想像も付かないような発見をするかも知れない可能性のある手法なんですね。
ただし、良いことだけではなく、「教師なし学習」は答えがないためにデータによっては導き出された答えが役に立たないこともあるようです。
おわりに
いかがでしたでしょうか。
第3回になり多少難易度が上がってきているかも知れませんが、このまま一緒に頑張っていきましょう。
次回は手法としては最後になる強化学習について記載したいと思います。