エーアイベーシックレベル3~機械学習の「教師」
- 目次
機械にも先生が必要
レベル3の機械学習を行う際に、重要な概念があります。それが、「教師あり学習」と「教師なし学習」です。機械学習では、学習のために与えるデータから「教師あり」と「教師なし」の2つに大きく分けることができます。ここで言う「教師」とは得たい出力に対する「正解データ」のことを言います。
イメージとしては、教師あり学習は「解答付き問題集」で勉強している状態で、教師なし学習は、過去問などのたくさんの問題から、「特定の大学の問題傾向を掴むこと」です。
よく聞かれるのが、「教師ありとなしでは、どっちが良いですか?」、「どういう時にどっちを使いますか?」といったような質問です。
まず、ポイントとなるのは、これら2つの学習は目的が違うということです。教師あり学習は、未知のデータが与えられたときに、正しい出力を予測することが目的です。対して、教師なし学習は、データの中から規則性や関係性を見つけることが目的となります。ですので、出力の予測をしたいのに、教師データがない場合は、教師データを集めなければなりません。
教師データがなければ・・・作る
おもしろい事例としては、ある眼鏡屋さんがWeb上で、おすすめの眼鏡を提案するサービスを作った際の話です。当初、ある人にどの眼鏡が似合うかどうかのデータというのは存在していませんでした。そこで、約300名の従業員が、6万枚の眼鏡をかけた人の画像に対して、「似合うか・似合わないか」を評価することで、教師となるデータを作りました。「データが無ければ集める」から発展して「データが無ければ、作る」という一風変わった事例です。
AIを活用するうえで、最先端を走る企業が持つ技術力も大事ですが、上で挙げた事例のように、データが無ければ作ったり、どこでどうやってAIを使うかというアイデアもとても重要になります。