強化学習

著者: Lewis Jackson

作成日: 11 5月 2021

更新日: 15 5月 2024

深度强化学习(1/5)：基本概念 Deep Reinforcement Learning (1/5) — ビデオ: 深度强化学习(1/5)：基本概念 Deep Reinforcement Learning (1/5)

コンテンツ

定義-強化学習とはどういう意味ですか？
Microsoft AzureとMicrosoft Cloudの紹介|このガイドを通して、クラウドコンピューティングとは何か、Microsoft Azureを使用してクラウドからビジネスを移行および実行する方法を学習します。
Techopediaは強化学習について説明します

定義-強化学習とはどういう意味ですか？

人工知能の弱点である強化学習は、報酬と罰のシステムを使用してアルゴリズムを訓練する動的プログラミングの一種です。

強化学習アルゴリズム、またはエージェントは、その環境と対話することで学習します。エージェントは、正しく実行することで報酬を受け取り、正しく実行しないと罰則を受け取ります。エージェントは、報酬を最大化し、ペナルティを最小化することにより、人間の介入なしで学習します。

Microsoft AzureとMicrosoft Cloudの紹介|このガイドを通して、クラウドコンピューティングとは何か、Microsoft Azureを使用してクラウドからビジネスを移行および実行する方法を学習します。

Techopediaは強化学習について説明します

強化学習は、行動主義心理学に触発された機械学習へのアプローチです。これは、子供が新しいタスクを実行する方法を学習する方法に似ています。強化学習は、アルゴリズムがタスクの実行方法を明示的に指示されるのではなく、それ自体で問題を処理するという点で、他の機械学習アプローチとは対照的です。

自動運転車やチェスをするプログラムなどのエージェントは、その環境と対話し、安全に目的地まで運転したりゲームに勝つなど、パフォーマンスに応じて報酬状態を受け取ります。反対に、エージェントは、道路を離れたりチェックメイトされたりするなど、不正に実行した場合にペナルティを受け取ります。

エージェントは、時間の経過とともに、動的プログラミングを使用して報酬を最大化し、ペナルティを最小化する決定を下します。人工知能に対するこのアプローチの利点は、エージェントがタスクを実行する方法をプログラマーに説明せずにAIプログラムが学習できることです。