AIは人間なしでも学習できる DeepMind論文

"Beyond Human Data: Scaling Self-Training for Problem-Solving with Language Models" は、機械学習の分野での新しい研究で、言語モデルの自己学習の可能性を探求しています。

これまで、言語モデル(LM)を人間が生成したデータで微調整するのが一般的な方法でしたが、この研究では、人間のデータに依存せずにタスクを解決するための自己学習方法を検討しています。特に、スカラーのフィードバックを利用できる数学問題などのタスクに焦点を当てています。

この研究では、期待値最大化に基づくシンプルな自己学習方法である「ReST^EM」を調査し、自己学習によるフィードバックが人間生成データへの依存を大幅に減少させる可能性を示唆しています​​​​​​​​。

簡単に言うと、AIが自分で問題を解いて、それが正しいかどうかを自分で確かめながら学ぶ方法を調べています。この方法は、AIが人間のデータに頼らなくても良くなるかもしれないということを示しています。


この記事が気に入ったらサポートをしてみませんか?