新しいNLP技術?文章を数値化するAIが登場

サイバーメイツという企業のエンジニア「謎のエンジニアM」さんが、「APUT」という新しいNLP技術群を開発されました。

興味深いのは、中でも「ScoreAPUT」というものです。これは、ある文章を定めた規則によって数値化するというものです。具体的には

  • 検証内容 コンテキスト文

  • 検証方法 質問文

  • 単位 回答の書式や規則の指示

を与えると、数値が出力されます。

使用例

「今日は寒かったな〜帰ったらゆっくり温まりたいよ」というコンテキスト文に対し、「設定すべきお風呂の温度」という質問文と「摂氏」という単位を与えると、AIが「40」と返してくれました。

これを応用すれば、自分のことを色々お世話してくれるロボットなどを作れそうです。

その他、記述問題の自動採点などもできるのではないかと思います。

以下のようなコンテキスト文を与えて、生徒の回答を採点してもらいます。

正解:
Tは、1次遅れ系における収束の速さを表すパラメータであり、時定数と呼ばれる。

生徒の回答:
Tは時定数と呼ばれる。時定数とは、1次遅れ系における収束の速さを表す。

確かに、完璧な回答なので100点です。一方、少し間違えている回答を渡すと…

30点になりました。ちょっと減点しすぎかな🤔
まあ、この例では部分点の指定などを行わず、ただ漠然と訊いているだけなので仕方ないですね。

既存技術との比較

  • 埋め込み/Embedding 埋め込みも文章数値化のタスク/モデルですが、出力される数値は高次元のベクトルであり、また、人間が解釈できるものではありません。→APUTでは、人間が解釈できる数値を出せます。

  • 生成LLMのプロンプトエンジニアリング 「数値で出力してください」などというプロンプトを付け、同様の入力を与えれば、ChatGPTやBard等の生成LLMでも同じような事はできそうです。しかし、彼らは必ず数値を出すという確証がありません。数値を出すと思っているところで、いきなり喋られても困ります。→APUTは、数値を出力する可能性を高めるための新技術が取り入れられている(らしい??)とのこと。この点については、APUTの優位性はよく分かりませんでした🤔。

  • TF-IDF 文章を分類するための古典的な統計手法です。類似した手法もたくさんあります。しかし、これらは単語の現れる頻度を計算する程度のことしかしておらず、文脈を読み取って判断する能力に欠けます。→APUTはLLMを内蔵しているため、文脈を読み取る能力にも優れていると考えられます。

今後に期待すること

サイバーメイツは、主にメイドAI等のサービスを提供している企業です。APUTなどの技術を活用して、さらに可愛いメイドさんができればいいなと思います。

また、数値だけを出すという確証や数学的な証明ができていればさらによいと思います。

#LLM #自然言語処理 #APUT

この記事が気に入ったらサポートをしてみませんか?