見出し画像

『情報哲学入門』のための練習問題 no. 3

 (3月30日午後3時より、大阪は梅田のジュンク堂で、『情報哲学入門』の刊行イベントがあります。メディアアーティストの藤幡正樹さん、情報哲学者の原島大輔さんとの鼎談です。オンラインでも視聴可能です。
詳しくは
https://online.maruzenjunkudo.co.jp/products/j70065-240330
 をご覧ください。)


 ロイターのニュースサイトで「シンガポールが「東南アジア」AIモデル開発」という記事(2024年2月12日)が飛び込んできた。
シンガポールは、いわゆるデジタル化についても勢いがあるなと改めて感嘆した。だが、同時に、おっとこれは、ChatGPTあるいは生成系AIについての理解の仕方をしっかり整えておかねばいけないという思いも頭をもたげただろう。「練習問題 no.2」でも書いた、人工知能の地政学と少しかかわるところだが、まったく別の角度から考察しておくべき課題が提示されているからである。
  いいかえれば、このニュースをどう読むかは、『情報哲学入門』にかかわってのちょっとした練習問題になるだろう。
 
  記事の内容はこういうものだ。
  ChatGPTを含む生成系AIのほとんどは、英語が対象言語となっている。結果、東南アジアの諸言語では「うまく作動しない」ことになっていて、それは懸念されることでしかない。シンガポール政府は自らが主導して、「東南アジアの言語や文化的規範で訓練した」AIを開発し活用していくべきだとし、自分たちのAIモデル「SEA-LION(Southeast Asian Languages in One Network)」を開発した。そういうことが書かれてあった。
 
  卑近なところに引きつけて問いを敷衍しておこう。
  学術関係の書物としていまたいへん評判になっている『言語の本質』(今井むつみ・、中公新書、2022年)で書かれている内容と、上記の記事内容が、興味深いかたちですれ違うからである。
  『言語の本質』、豊富なデータや資料をもとに最新の言語学の知見を丁寧に積み重ねた論述をすすめながら、人間が用いる言語とはどのようなものかについて新しい理解方法を提示している。筆者も若い頃、ソシュールなどの言語学を起点に構造主義・ポスト構造主義を一生懸命に勉強したので、『言語の本質』が論じる言語についての理解図式は、目の覚めるような別種の言語理解を説得力をもって与えていて、ずいぶん感銘を受けた。ともかくも、そのことはまず述べておきたい。
  あえて筆者の仕事に引きつけていっておけば、言語ではなく映像についてではあるが、拙著『映像論序説』(人文書院、2009年)で、それを、構造主義などの記号モデルではなく、むしろ身体性にも目配りの利いた認知言語学の新しい流れなども参考にしながら把捉した方が的確であろうと論じていたこともあって、大きな論運びでいえば、比較的すんなりと首肯できるでもあった。
 
  それを断った上なのだが、じつは、『言語の本質』では一部、マイナーな箇所ではあるが、すんなりとは入ってこなかった箇所もあった。
  ChatGPTを論じるくだりである。著者たちはどうしたものか、ChatGPTに翻訳作業をさせて、その作動結果について考察するという格好で論をすすめているのである。
  筆者のひっかかりは、きわめて素朴なものだ。ChatGPTを、日本語使用の場で作動させるのではなく、なぜ異なる二つの言語の間を行き交う作業の場に注目して考察したのか。
 
  この「練習問題」第一回でもとりあげたように、一般的にいって、ChatGPTは英語環境のうちではすでに、かなり頼りになる、つまりはかなりかゆいところに手が届くほどに精度が高い。他方、筆者も経験があるが、日本語環境の中では、あれれと思うようなぬるい結果が出てきたりすることがある。翻訳作業は、日本語環境の作動の悪さが影響しているのか、それとも、翻訳作業それ自体に何ほどかの質的な限界があるのか。平たくいえば、英語とそれ以外の言語との間で相性の良さに差があるという問題なのか、それとも、特定の言語から別の言語への翻訳作業にかかわる能力の問題なのか。
  冒頭で触れたロイターによる記事は前者の発想のもとにあるし、『言語の本質』の著者たちは、後者の発想にある、そのように映るのである。
 
  ChatGPTは、大規模言語モデルに対話型のユーザーインターフェイスをくっつけた生成系AIであり、この言語モデルを訓練するためのテキストデータそのものが基本的には、現在オンライン上で飛び交う言葉の集合からとられている。インターネット上には英語のテキストの方が日本語のものより圧倒的に数多いし、開発しているOpenAIも米国企業であることから、ChatGPTの研究開発において、英語データがかなり重視されているようなところがあるといわれている。
  そうであってみれば、英語以外の言語に対応するChatGPTの設計上の改善の課題に過ぎないといえるところがある。他方、『言語の本質』がもし、日本語なりの言語というものには、生成系AIの作動とは質的には相容れない何があるのだという主張をしているとするならば、シンガポールの開発現場の着想とは大きくすれ違っているように思われるのである。生成系AIの行方と、『言語の本質』はすれ違っているのである。
  もう少し踏み込んでおこう。『情報哲学入門』の第二部第4章でもとりあげた、ロドニー・ブルックスが提唱した、ロボティックスと連動した(センサー技術を組み込んだロボットの身体性と連動した)人工知能の開発理論なども、『言語の本質」はとりあげ、その言語理解について異論を唱えている。
だが、極論をいえば、ブルックスの議論はそもそも、人間の言語をそっくり真似して見出そうとしているものなのだろうか。ロボット自らの物質性(身体性)に合った、自らの知能システムを生み出すだけである。じっさい、ブルックスが打ち出したサブサンプション・アーキテクチャは、ルンバなどの自動掃除機を実現していて、与えられた目的にかかわって特定の知能作業をとどこおりなく勤めているだろう。有り体にいえば、この方向の人工知能開発研究者であれば、そもそも人間知能をまるごと代替するような、あるいは人間言語をまるごと大体するような言語の創生が目指されているわけではないと主張するだろう。別種の知能を実現する機械知能を開発しようとしているだけですと(筆者自身、そのようにいわれた経験がある。)
  ここでもまた、知能ないし言語にかかわる人工知能開発の発想と、『言語の本質』が論じる言語理解とは、理論的にすれ違っているのである。」
 
  いずれにせよ、ChatGPTが英語中心主義なので、それ以外の言語(たとえば日本語)については、設計上の改善措置で対応できるとするのか、いや、そこには人工知能の作動と人間の言語の間には質的な違いがあるので対応できないとするのかについて、どちらかの立場に立って考えてみる。練習問題no.3はそういったものになるだろう。
 
  加えて、中級用の練習問題も記しておこう。
 『言語の本質』の主たる論構成は、スティーブン・ハルナッドが人工知能の成立条件について哲学的に論じた際に掲げた「記号接地問題(the symbol grounding problem)」の問いを、(人工知能の側ではなく)人間の言語の側にひっくり返して活用した論構成になっている。つまり、記号接地問題を逆用して「、人間にとっての言語の特徴を炙り出すために役立たせるという格好になっているのである。
 ハルナッドは、「記号接地問題」と題された論文において、記号が人間界(ないし人間の言語による知能)に接地するための条件について、具体的には二つないし三つの要件を挙げているのだが、『言語の本質』は、そのうちのひとつ、身体性(もう少しいえば人間の身体における感覚作用)との接地を主にとりあげて論を組み立てているようだ。
  だが、おそらくは(筆者の私見では)、ハルナッドがかかげるもうひとつの要件こそが、ChatGPTが切り拓く人工知能の新しい地平に深くかかわるものだろう。当該論文を自身で読み、ChaptGPTが、記号接地条件と交差するのかしないのか、交差するとしたらどのようにか、を考察してみるのもいいだろう。ちょっと骨太の練習問題となろう。

この記事が気に入ったらサポートをしてみませんか?