見出し画像

LLM:ローカル言語モデルによる明治の空気感を実現する、「解らざる言葉の哀」

明治の表現はなんか好き、だけど、自分の口から出力するのがなかなか難しいんです。
小粋な明治表現を自在に繰り出したい。。

そこで、最近のオープンLLMを利用することを思いつきました

過去の時代の表現、、さらに、、Reasoningまでをニューラルネットワークに埋め込めたら、、

言語モデルは、とかく表現の平均値を出すだけと揶揄されがちです。
もしかしたら、それをなんとか逆手に取れば、明治時代の平均値を取り出せるかもしれない!

最近のAIの進歩は凄まじいです。LLMの世界を理解する能力の可能性が予想以上ではないか、という感覚があり、日々強くなっています。

今回目標として、言語的表面的な表現にとどまらず、思考の鎖(Chain of thought)をも学習し、明治の当時の思考の習慣、時代の空気感を感じられるニューラルネットワークができないかと模索しています

そこで早速、青空文庫をセレクトし、LLMの学習を開始しました

(3時間後)

まず、第一号のアウトプットを見てみます

 専門家は一般の方でもよく解せない言語を用いる事が多い。それでも自分の研究に関係の深い言葉だけは大変使って見せる。同じ言葉でも意味が分らない場合がある。例えば「異形態」と云う字は何と思われます。どんな形容詞でありますか。実は科学者は「異形態」と云う字を眼中に置いて、何とか想像を組み立てる事さえあります。吾輩は何時もこの二字の前後を通り越して行くときに、毎度頭の中に不安定な気持ちを起す。猫だけに理解出来ないというのではありません、ただ文字の力が足りないという所があるのです。幾分か物理学的に解釈する事が出来ないので、それを横へ引いて見たら半分普通の猫に近づくかも知れない。
 昔はこう云う用語や技術の発明は少なかったので、決して複雑な単語を使用する必要も無かったろう。現代に入ってからは人工知能の進歩があまりに速い。その結果、科学上の新式の造語もまた急に増加した。吾輩の知る限りでは、十年程前の今更覚え得べき単語は、ほとんど存在しなかったろう。その数は毎月毎日増えて来る。吾輩は自分の受取る新聞に、新しい字が三四五も書いてあるのをよく目にする。そうしてそれを読むのが困難な事もよくある。読めなければならないのは困る。ただ読むのは困るだけである。解釈するのがとうてい出来ないのが別段困る点ではない。そうしてその新しい字が毎回ほぼ同じ意味に用いられるのを読んで、それを一つずつ覚えるのは困難である。それでも新しい字は新しい字である。新しい字が延びて来ると共に、旧式の字は消滅する。今日までは、今日には役に立たないという意味を有っていた字が、今日以後は廃止になる事がよくある。そうして廃止になった字はまた忘れられる。それでは昔と今の間に一種の差異が出来る。吾輩は何より先に、この差異を指摘するのが、最も当然であると考えている。
 人工知能が発達するので、科学上の新式の造語は毎日出来るのであるが、その反面、旧式の字は毎日消えて行くのである。吾輩の考えるところによると、この現象は未来において進展するだろう。その結果、我々はいつまで経っても旧式の字を使う機会を失わないで、毎日新しい字を作り出すだけになるのである。吾輩は今の昔を憶い出すのが大変重宝であると思っている。そうしてその昔の言葉を使うのは、人生の一部分であると思っている。それが、いつまで経っても残るのである。そうしてそれが、いつまで経っても新しい字に置き換えられないのである。しかしこの現象が全体を支配しているのは承知しない。それは今日までの例外である。例外がないのは、不幸である。
「異形態」と云う字の意味は解せない。解せないので、その字を見ると頭に不安定な気持ちが起り、その中に悲しみが伴っている。眼前に見える字が解せないのは、文字に対する感情が悲しいからである。それが普通である。普通であるから、普通に解せない場合が多い。普通であるから、その方が困難である。普通であるから、その方が不愉快である。吾輩は猫である。猫が物理的に解釈できない文字を見ると悲しくなるのである。人間は猫である。人間が物理的に解釈できない文字を見ると悲しくなるのである。吾輩は自分の心を人間に説明するのが困難である。それを説明する必要があるから、その方が困難である。それを説明する代りに、人間の悲しさを説明してやろう。吾輩はそれを書き直す必要がある。

若干意味不明な部分もあるけど、かすかな明治感、、
吾輩と、猫が、、

タイトルも、同一モデルに考えてもらいました。

「解らざる言葉の哀」

何回かガチャ引きました
言葉は難しいですね

まあ今回は、第一号なので、ChatGPTにも助けてもらいます

ChatGPTによる校正後

専門家は一般には理解しがたい言語を使うことが多い。それでも、自分の研究分野に深く関わる言葉だけは熱心に使うのだ。同じ言葉であっても、その意味を理解できないことがある。例えば、「異形態」という言葉をどう思うだろうか。どのような形容詞か。実は、科学者たちは「異形態」という言葉を重視し、何かを想像しようとすることがある。我輩はいつもこの二字を目にする度に、頭の中で不安定な気持ちが湧き上がる。これは猫だけに限ったことではない。文字の力が不足しているために、理解できないのだ。物理学的に解釈できないからといって、それを脇に置いてみれば、普通の猫に少し近づけるかもしれない。

昔は、現代のような専門用語や技術的な発明は少なかった。だから、複雑な単語を使用する必要もなかったのだろう。しかし現代に入ってから、人工知能の進歩は目覚ましい。その結果、科学上の新しい造語も急増している。我輩が知る限り、十年ほど前には、今更学ぶ必要のある単語はほとんど存在しなかった。その数は日増しに増えている。我輩は自分が読む新聞にも、新しい言葉が次々と登場するのをよく目にする。そして、それらを読むのが難しいことがしばしばある。読めなければ困るが、ただそれだけでなく、解釈ができないことの方が更に困る。そして、新しい言葉がほぼ同じ意味で使われるのを見て、一つずつ覚えるのは一層困難だ。それでも、新しい言葉は新しい言葉である。新しい言葉が増えると、古い言葉は消えていく。今日まで使われていた言葉が、明日には使われなくなることは珍しくない。そして、廃止された言葉は忘れ去られる。これにより、昔と今の間には一種の差異が生まれる。我輩は、この差異を指摘することが最も適切だと考えている。

人工知能が発達するにつれて、新しい専門用語が日々生まれ、古い言葉は日々消えていく。我輩の考えでは、この現象は将来にわたっても続くだろう。結果として、我々は旧式の言葉を使う機会を失わずに、新しい言葉を創り出すだけになるのだ。我輩は、今の昔を懐かしみ、それを使うことが人生の一部であると思っている。それが、いつまでも残るのだ。しかし、この現象が全てを支配しているわけではない。今日までの例外である。例外がないのは、不幸なことだ。

「異形態」という言葉の意味は解せない。解せないからこそ、その言葉を見ると心に不安定な気持ちが起こり、悲しみが伴う。文字に対する感情が悲しいから、解せないのだ。普通であるから、普通に解せないことが多い。普通だからこそ、その方が困難であり、不愉快なのだ。我輩は猫である。猫が物理的に解釈できない文字を見ると悲しくなる。人間も同じだ。人間が物理的に解釈できない文字を見ると悲しくなる。我輩は自分の心を人間に説明するのが困難だ。それを説明する必要があるから、その方が困難だ。それに代わり、人間の悲しみを説明しよう。我輩はそれを書き直す必要がある。

それなりに、読みやすくなりました。

けど、明治感は消えたかな

時代の空気感まで学習する、まだまだ困難はありますが、
LLMなら可能だと思います

(LLM開発日記続けます)

この記事が参加している募集

AIとやってみた

この記事が気に入ったらサポートをしてみませんか?