AIは人間なしでも学習できる DeepMind論文

2023年12月13日 10:26

"Beyond Human Data: Scaling Self-Training for Problem-Solving with Language Models" は、機械学習の分野での新しい研究で、言語モデルの自己学習の可能性を探求しています。

これまで、言語モデル（LM）を人間が生成したデータで微調整するのが一般的な方法でしたが、この研究では、人間のデータに依存せずにタスクを解決するための自己学習方法を検討しています。特に、スカラーのフィードバックを利用できる数学問題などのタスクに焦点を当てています。

この研究では、期待値最大化に基づくシンプルな自己学習方法である「ReST^EM」を調査し、自己学習によるフィードバックが人間生成データへの依存を大幅に減少させる可能性を示唆しています。

簡単に言うと、AIが自分で問題を解いて、それが正しいかどうかを自分で確かめながら学ぶ方法を調べています。この方法は、AIが人間のデータに頼らなくても良くなるかもしれないということを示しています。

DeepMindの研究者らは、人間が作成したデータに依存する現状は今後のLLMにとって良くないと考えました。
そこで、LLMに自ら高品質なデータを生成させ、データセットを拡張する「自己学習」アプローチを開発しました。

結果、自己生成データによって能力向上が確認されたとのことです。

- "Beyond… pic.twitter.com/phOIqYfLL7
— AIDB (@ai_database) December 12, 2023

この記事が気に入ったらサポートをしてみませんか？