2024年08月22日
狭義の AI ができること
狭義の AI ができることは、
虫食い問題を解く程度のことです。
過去のデータを分析し、
未来のデータを予測する…
但し、機械学習での訓練・推論では、入出力情報が主に数値 (例: 0.0 ~ 1.0) であるため、文字列などのラベル情報は数値と置き換える必要があります。例: 晴れ = 0.0、曇り = 0.5、雨 = 1.0
例えば、
今日は(晴れ 0.0)の日だから、弁当が(よく売れた 100)。
今日は(曇り 0.5)の日だから、弁当が(あまり売れなかった 50)。
今日は(雨 1.0)の日だから、弁当が(ほとんど売れなかった 20)。
機械学習のモデルでは、定型の文章は削除してしまい、数値だけ残している、という状態に通常はします。
0.0 → 100
0.5 → 50
1.0 → 20
推論の例として、
今日は(どしゃ降り 2.0)の日だから、弁当が(売れなかった 3)。
2.0 → 3
という風に「どしゃ降り」の直接的なデータは存在しないが、推論をすることはできる、というのが特徴です。
訓練に使用するデータは、因果関係が成立しているものや、相関関係が認められるものの方が良いです。
例
原因 = 雨の降り具合 0.0 〜 (晴れ = 0.0、雨 = 1.0)
結果 = 売り上げた弁当の個数 0 〜
結果の項目数は通常 1 つですが、原因の方の項目数はいくつあっても構いません。項目数や、レコード数に関係なく、よしなに訓練・推論できるのが機械学習の良さです。
原因には、「予測値」と「実測値」があります。
予測値の例: 天気予報による雨の降り具合 0.0 〜 (晴れ = 0.0、雨 = 1.0)
実測値の例: 実際の天気を観測することにより知り得た雨の降り具合 0.0 〜 (晴れ = 0.0、雨 = 1.0)
推論をしたい早朝の段階では、「実測値」の方は未知である可能性があります。
そのため、仮定を含めて推論することで情報量を増やし、その結果を元に意思決定をする、というやり方もあるかと思います。
これは、項目数を 3 にした場合の例えです:
今日は(晴れ 0.0)の予報があり、実際は(晴れ 0.0)であると、弁当が(よく売れた 100)。
今日は(晴れ 0.0)の予報があり、実際は(曇り 0.5)であると、弁当が(そこそこ売れた 70)。
今日は(晴れ 0.0)の予報があり、実際は(雨 1.0)であると、弁当が(あまり売れなかった 15)。
実測値である実際の天気の部分を、試しに「晴れ 0.0」「曇り 0.5」「雨 1.0」と仮定して推論をしてみる、という具合です。
こういった推論をするためには、毎日、天気予報と、実際の天気と、弁当の売上個数を記録して数値データ化し、日々、モデルを訓練する必要があります。
運用が大変ですが、機械学習には、こうった使い道もあるという事で理解頂ければ幸いです。
虫食い問題を解く程度のことです。
過去のデータを分析し、
未来のデータを予測する…
但し、機械学習での訓練・推論では、入出力情報が主に数値 (例: 0.0 ~ 1.0) であるため、文字列などのラベル情報は数値と置き換える必要があります。例: 晴れ = 0.0、曇り = 0.5、雨 = 1.0
例えば、
今日は(晴れ 0.0)の日だから、弁当が(よく売れた 100)。
今日は(曇り 0.5)の日だから、弁当が(あまり売れなかった 50)。
今日は(雨 1.0)の日だから、弁当が(ほとんど売れなかった 20)。
機械学習のモデルでは、定型の文章は削除してしまい、数値だけ残している、という状態に通常はします。
0.0 → 100
0.5 → 50
1.0 → 20
推論の例として、
今日は(どしゃ降り 2.0)の日だから、弁当が(売れなかった 3)。
2.0 → 3
という風に「どしゃ降り」の直接的なデータは存在しないが、推論をすることはできる、というのが特徴です。
訓練に使用するデータは、因果関係が成立しているものや、相関関係が認められるものの方が良いです。
例
原因 = 雨の降り具合 0.0 〜 (晴れ = 0.0、雨 = 1.0)
結果 = 売り上げた弁当の個数 0 〜
結果の項目数は通常 1 つですが、原因の方の項目数はいくつあっても構いません。項目数や、レコード数に関係なく、よしなに訓練・推論できるのが機械学習の良さです。
原因には、「予測値」と「実測値」があります。
予測値の例: 天気予報による雨の降り具合 0.0 〜 (晴れ = 0.0、雨 = 1.0)
実測値の例: 実際の天気を観測することにより知り得た雨の降り具合 0.0 〜 (晴れ = 0.0、雨 = 1.0)
推論をしたい早朝の段階では、「実測値」の方は未知である可能性があります。
そのため、仮定を含めて推論することで情報量を増やし、その結果を元に意思決定をする、というやり方もあるかと思います。
これは、項目数を 3 にした場合の例えです:
今日は(晴れ 0.0)の予報があり、実際は(晴れ 0.0)であると、弁当が(よく売れた 100)。
今日は(晴れ 0.0)の予報があり、実際は(曇り 0.5)であると、弁当が(そこそこ売れた 70)。
今日は(晴れ 0.0)の予報があり、実際は(雨 1.0)であると、弁当が(あまり売れなかった 15)。
実測値である実際の天気の部分を、試しに「晴れ 0.0」「曇り 0.5」「雨 1.0」と仮定して推論をしてみる、という具合です。
こういった推論をするためには、毎日、天気予報と、実際の天気と、弁当の売上個数を記録して数値データ化し、日々、モデルを訓練する必要があります。
運用が大変ですが、機械学習には、こうった使い道もあるという事で理解頂ければ幸いです。