オントロジーとは


Cyc プロジェクトの様な知識をコンピュータに記述することが、時間がかかって、いつ終わるかわからないということで、今度は、人工知能を研究する際に、「知識を記述すること自体」を研究するということが、行われる様になりました。それが、オントロジー研究につながりました。トム・グルーバーという人が提唱しました。


オントロジーとは、哲学用語で「存在論」を意味します。
人工知能の用語としては、「概念化の明示的な仕様」と定義されます。


知識を書くということにしても、そこに「仕様書」があった方がいいという考え方のもと、始められました。著名な研究者としては、溝口理一郎氏が有名です。
オントロジーは、知識ベースを書くときに概念を用います。


概念間の関係には、is-a関係(上位・下位)、part-of関係(全体・部分)などがあります。そこで、推移律が成り立つかということを考えるのですが、しかし、part-of関係一つ取っても、なかなか難しい問題がありました。例えば、自転車と車輪の関係は、自転車は車輪を取られると自転車ではなくなりますが、車輪は自転車の部分である時もない時も車輪です。また、森と木の関係でいうと、森から木を一本除いても森であり続けるし、木も木のままです。人間はこの様な概念をうまく処理できますが、コンピュータには難しいということが次第に分かってきます。

このように、オントロジー研究による、知識を適切に記述することは難しいということになり、その後、オントロジーは、大きく分けて2つの流派ができました。「ヘビー・ウエイト・オントロジー」と「ライト・ウエイト・オントロジー」です。


「人間が厳密にしっかりと考えて知識を記述していくにはどうしたらよいか」を考えるのが、ヘビー・ウエイト・オントロジーで、「コンピューターにデータを読み込ませて自動で概念間の関係性を見つけようとのが、ライト・ウェイト・オントロジーの立場です。


ライト・ウエイト・オントロジーは、完全に正しいものでなくても使えるものであればよいという「ややゆるい」感じでした。しかし、その考えが現実と相性がよかったのです。その後、ウェブデータを解析して知識を取り出す「ウェブマイニング」や、ビックデータを分析して知識を取り出す「データマイニング」という手法へとつながっていきます。


こうしたオントロジー研究とウェブのLinked Open Data (LOD )も関係があります。LOD とは、これまでのウェブは主に文書的情報を相互にリンクしてネットワークをつくっている、言ってみれば「文書のウェブ」であるのに対して、LOD は同様のネットワークをデータの間でつくります。このためLOD は「データのウェブ」と呼ばれます。


その後、米IBMが開発する人工知能「ワトソン」が登場しますが、「ワトソン」はライト・ウエイト・オントロジーの研究がもとになっています。

この記事が気に入ったらサポートをしてみませんか?