見出し画像

SAPIXのテスト(小5国語)をAIに解かせてみた

国語の教師としてAI(Claude 3 Opus)に接している感触では、だいたい5年生くらいの力を持っていると感じています*1。
実際、5年生の問題を解かせるとどうなるだろうと思い、今回試してみました。

かなり長大なので、目次を利用しながらご覧になることをおすすめします。


問題をOCRで読み込み、テキストで出題しました(画像認識ではない)。

大問1 漢字問題

布地
こづつみ
燃焼
設備
横暴
留める
義務
借りた
講評
祝辞

Claude 3 Opus

なぜか「布地」を漢字のまま解答。それ以外は正解です。得点は18点。

大問2 知識問題

1 文法

まずは修飾・被修飾の関係。

【二人で】は「遊んだ」にかかっています。
【近くに】は「ある」にかかっています。

Claude 3 Opus

正解です(厳密には「あるよ」ですが、正解と言って良いでしょう)。
分節分け・単語分けはどうでしょうか?

春が終わると梅雨が始まった。 文節の数:七 単語の数:九
この道を直進すると駅の南に出るよ。 文節の数:九 単語の数:十二

Claude 3 Opus

残念。どちらも不正解です。
なんでこんな答えになったのか、一応聞いてみました。

春が終わると梅雨が始まった。
文節: 春が/終わると/梅雨が/始まった。 → 文節の数は 4 つ。
単語: 春/が/終わる/と/梅雨/が/始まる/た。 助詞「が」と接続詞「と」、助動詞「た」も単語として数えます。 → 単語の数は 8 つ。

この道を直進すると駅の南に出るよ。
文節: この道を/直進すると/駅の/南に/出るよ。 → 文節の数は 5 つ。
単語: この/道/を/直進/する/と/駅/の/南/に/出る/よ。 助詞「を」「の」「に」、接続詞「と」、語尾の「よ」も単語として数えます。 → 単語の数は 12 個。

私の回答に誤りがありました。申し訳ありません。正しい答えは以下の通りです。
春が終わると梅雨が始まった。 文節の数:四 単語の数:八
この道を直進すると駅の南に出るよ。 文節の数:五 単語の数:十二

Claude 3 Opus

こうやって聞いてみると、「春が〜」の方は正解です。
ですが、「この道を〜」の方は、まさに生徒と同じように間違っています(太字の部分が間違い)。
文節分けは、「この/道を」で分ける→六
単語分けは、「直進する」で一語(分けない)→十一
が正解です。

2 同訓異字

(1) 書面をもってあいさつに【かえる】ことにした。 → エ 代える
(2) そのニュースは、私の望みを【たつ】ものだった。 → エ 絶つ
(3) 勉強時間が少ないという問題の解決を【はかる】。 → ア 図る

Claude 3 Opus

全問正解。

3 語い

(1) 醍醐味 → ウ 合唱の醍醐味は、クラスのみんなと心をひとつにできることだ。
(2) まんざらでもない → ア 無口な彼だが、先生からほめられてまんざらでもない様子だった。
(3) おもむろに → エ 先輩が集まったみんなの顔を見て、おもむろに話し始めた。

Claude 3 Opus

こちらも全問正解。
大問2の得点は16点(答え直して正解になったものは得点に含めません)。

大問3 説明文

ここからは読解問題です。
本文を読み込ませ、問一から順番に一問ずつ設問を投げていきます。

問一 接続語の空欄補充問題

A ウ
B こうして
C たとえば
D こうして

理由は以下の通りです。
A: 前の段落で「そのプログラムは、今の都会ではとても適合しないものになってしまいました」と述べられており、「しかし」でつなぐのが適切です。
B: 前の文で「おそらく、アスファルトやブルーシートがない時代には、そのプログラムでよかったのでしょう」と述べられており、「こうして」でその結果を示すのが適切です。
C: 「囲碁や将棋が強くなるためには、たくさんの情報が必要です」という文の後に具体例が続くため、「たとえば」が適切です。
D: 前の段落で「コンピューターはものすごいスピードで対局を繰り返すことができます。そして、膨大な情報を得ていきます」と述べられており、「こうして」でその結果を示すのが適切です。

Claude 3 Opus

BとDで「こうして」がダブっています。
設問には「同じ記号は一度しか使えません」という注意書きがあるのに、同じものを2回選んでしまっています。でも、採点時に、それで減点されることはありません(ないはず)。
結果、Bのみx。

問二 比ゆ表現の抜き出し

本文中で、本能について次のように述べられています。
「長い進化の過程で身につけた「本能」は、多くの場合、正しい行動を導くマニュアルです。つまり解答が示されているのです。」
したがって、一定の環境において本能は「正しい行動を導くマニュアル」のようなものだと筆者は述べていると言えます。

Claude 3 Opus

正解です。
人間だと探すのに一手間かかる問題です(「ひと手間」が気になる方はこちらの解説をどうぞ。)

問三 筆者の思い(言葉のニュアンス)の読み取り


理由は以下の通りです。
筆者は、トンボが「今にも干上がりそうな道路にできた水たまりに卵を産んでいる」ことを述べた後、「それどころか、ブルーシートの上に卵を産んでいることさえあります」と続けています。
この「それどころか」という表現は、前の文で述べた内容よりもさらに驚くべきことや、予想外のことを示す際に使われます。
ここでは、道路の水たまりに卵を産むことよりも、ブルーシートの上に卵を産むことの方がさらに不適切であることを強調しています。
したがって、この表現からは、目的をはたすうえで不適切な場所を次々と選ぶトンボへの筆者の疑問の思いを読み取ることができると考えられます。

Claude 3 Opus

正解です。

問四 メリットとデメリットの整理(要約)

筆者は知能について、次のような良い点と悪い点を述べています。

良い点:
・知能を持つ哺乳動物は、自分の頭で考え、どんな環境に対しても臨機応変に行動することができる。
・情報を処理して、状況を解析し、とるべき行動を導き出すことができる。
・ブルーシートに卵を産んでいるトンボの行動が正しくないことはすぐにわかる。
・落としてしまったエサは、その場で探すことができる。
悪い点:
・本能とは異なり、自分で解答を導かなければならない。
・自分の頭で考えた行動が正しい答えであるとは限らない。
・考え抜いた挙げ句に、行動を誤ってしまうこともある。

つまり、知能の良い点は、環境の変化に適応し、柔軟に行動できることです。一方、悪い点は、自分で答えを導き出さなければならないため、間違った行動をとってしまう可能性があることです。

Claude 3 Opus

記述問題でしたが、大正解です。
要約はLLMが得意なことなので、正解すると予想していましたが、バッチリの結果でした。

問五 理由説明


理由は以下の通りです。
本文では、AIが人間を打ち負かすようになった理由として、以下の点が挙げられています。

1. 囲碁や将棋のルールや定石・定跡をコンピューターに教える。
2. 過去の対局の膨大なデータをコンピューターにインプットする。
3. コンピューター自身が対局を繰り返し、自ら勝ち筋を学び取っていく(ディープラーニング)。

特に、3のディープラーニングにより、コンピューターは膨大な情報を得て、人間を打ち負かすようになったと述べられています。
これは、以前のコンピューターが、情報を詰め込まれても、その情報を適切に分析し、最適な行動を選択する能力が不足していたことを示唆しています。
したがって、AIより前のコンピューターが人間に勝てなかった理由として、最もふさわしいのは、「以前の機械は情報を分析してふさわしい行動を決める力が低かったので、情報を詰め込まれても行動の選択を間違えてしまっていたから」という選択肢アだと考えられます。

Claude 3 Opus

不正解。正答はエでした。
太字の部分が誤読です。「『人間から教わる』という作業を繰り返して人間の知識を詰め込んだだけでは、人間を超えて強くなることはできません。」と「人間」が3度も使われている部分について、そのニュアンスを十分に読み取れていません。人間以上の情報を得るために3の「ディープラーニング」がいきてくる、というのが、本文に書かれている内容です。

問六 空欄補充問題


理由は以下の通りです。
本文では、知能が正しい答えを導くためには、外部から与えられた情報だけでは不十分であり、その情報を頼りに、自分自身で繰り返し確認していくことが必要だと述べられています。
具体的には、以下の記述があります。
「正しい答えを導くためには、膨大な情報が必要です。しかし、外部から与えられた情報だけでは不十分です。その情報を頼りに、⑤を確認していきます。
これが「経験」です。」
ここで、⑤に入るのは、「自分自身で繰り返し、その情報の確かさ」を確認していくことだと考えられます。
また、その後の段落で、経験とは「成功」と「失敗」を繰り返すことで、どうすれば成功するのか、どうしたら失敗するのかを認識していくことだと述べられています。
これらの記述から、⑤にあてはまる言葉として最もふさわしいのは、「自分自身で繰り返し、その情報の確かさ」を表すウだと判断できます。

Claude 3 Opus

正解。理由説明も完璧です。

問七 本文の要旨に合った具体例を選ぶ問題


理由は以下の通りです。
本文では、経験について次のように述べられています。
「経験とは、「成功」と「失敗」を繰り返すことです。
囲碁や将棋のAIであれば、「こうしたから勝った」「こうしたから負けた」という情報を蓄積していきます。
哺乳動物も同じです。成功と失敗を繰り返すことで、どうすれば成功するのか、どうしたら失敗するのかを認識していきます。それが経験です。」
つまり、筆者が必要だと述べている経験とは、成功と失敗を繰り返すことで、何が正しい行動なのかを学んでいくことを指しています。

選択肢の中で、この経験の例として最もふさわしいのは、イの「自分の作ったカレーがまずかったので、母親の話を参考に調味料の分量を調整して何度か挑戦するとおいしく作れた」です。
この例では、最初は失敗(まずいカレーを作ってしまった)しましたが、母親のアドバイスを参考に調整を加えて何度か挑戦することで、最終的に成功(おいしいカレーを作れた)しています。
この一連の過程が、筆者が述べている「成功と失敗を繰り返すことで、どうすれば成功するのかを認識していく」経験に当てはまります。

他の選択肢は、成功と失敗の繰り返しによる学習という観点では、イほど適切ではないと考えられます。

Claude 3 Opus

正解。理由説明もバッチリ。
(人間であれば、ではありますが)問六を正解できていれば、こちらも正解できて当然のはず、という問題です。

問八 内容説明


理由は以下の通りです。
本文の最後の段落では、哺乳動物の親の役割について次のように述べられています。
「哺乳動物の親の役割は、子どもを守ることだけではありません。安全な環境で経験を積ませることもまた、哺乳動物の親の役割なのです。」
ここでは、哺乳動物の親の役割として、以下の2点が挙げられています。
1. 子どもを守ること
2. 安全な環境で経験を積ませること

また、本文では、哺乳動物が親の保護のもとで経験を積み重ねることができるため、知能を高度に発達させることが可能になったと述べられています。
これらの内容から、筆者が説明したいのは、「哺乳動物の親は安全な環境を作って、子どもが経験を重ねて本能と知能を育む手助けをしなければならないということ」だと考えられます。
選択肢エは、本文の内容を的確にまとめており、筆者の説明したいことを最もよく表しています。
他の選択肢は、本文の一部の内容は捉えていますが、筆者の主張全体を適切に表現しているとは言えません。

Claude 3 Opus

不正解。正解はウです。
エの選択肢は「本能と」さえなければ、文章の言葉づかいともぴったり合っている、一見正解に見える選択肢です。
ウの選択肢はClaudeが整理した1・2の内容をどちらも本文とは別の言葉で言い換えているので、少し選びにくくなっていました。
おそらく、実際の小学5年生もここで引っかかります。

大問3は接続語問題で1問間違い、選択肢問題で2問間違い、記述はマル(採点甘いかな?)で、合計40点。

大問4 物語文

問一 副詞の空欄補充問題

問一の答えは以下の通りです。

A: ウ のんびり
理由: 塾の昼休みに香奈たちが楽しそうにおしゃべりをしている様子から、のんびりとした雰囲気が感じられるため。

B: ア ぼんやり
理由: 香奈が小箱を見つめながら過去の楽しかった思い出を懐かしむ様子から、ぼんやりとした心境であることが伝わるため。

C: イ しんみり
理由: お父さんが風鈴堂のケーキを持ち帰り、家族の絆を感じる場面の雰囲気として、しんみりとした表現が適しているため。

エの「ほっこり」は、この文章の中で最もふさわしい箇所がないため、A〜Cのいずれにも当てはまらないと判断しました。

Claude 3 Opus

Bのみ正解。正しい答えはAほっこり、Bぼんやり、Cのんびり、です。
実際に子どもが解いても難しいと思います(解き方の詳細はこちら)。
Cで考えるべきは場面全体の雰囲気ではなく、直前のお兄さんのセリフの口調でした。

問二 心情の読み取り

ウが最もふさわしいと思います。
理由は以下の通りです。
香奈は模試の成績が芳しくなく、希望する中学校に合格できるか不安を感じています。そんな中、友人たちが中学校生活について楽しそうに話している様子を見て、自分は成績不振のため彼らと同じ中学校に進学できないのではないかという気持ちになり、心が重くなっているのだと考えられます。

アは「仲間の輪から外される」可能性について言及していますが、本文中にはそこまで詳しく書かれていません。 イは香奈が友人たちに対して不満を感じているとありますが、むしろ香奈は自分の学力不足を悩んでいる様子です。 エは友人たちが香奈を気遣っているという解釈ですが、そのような記述は見当たりません。

したがって、香奈の気持ちを最も的確に表現しているのはウだと判断しました。

Claude 3 Opus

正解。他の選択肢の読み方もすべて合っています。

問三 心情の読み取り(記述)

香奈は、小箱に入っていた昔の思い出の品を見ながら、家族みんなで楽しかった過去を懐かしく振り返っています。しかし現在は、家族それぞれが忙しく、特に自分は受験勉強に追われ、以前のようにみんなで楽しく過ごす時間がなくなってしまったことに気づきます。

そして、今は亡き頃の楽しかった日々を思い出し、家族との大切な時間を失ってしまったことを実感したため、香奈は悲しくなり、泣きだしそうになったのだと考えられます。

受験勉強に打ち込むことは将来のためには必要なことかもしれませんが、同時に家族とのかけがえのない時間を犠牲にしてしまうことでもあります。香奈はそのジレンマに心を痛め、昔の幸せな思い出と現在の寂しい現実とのギャップに涙が込み上げてきたのでしょう。

大切なものを失ったという喪失感と、取り戻すことのできない時間に対する後悔の念が、香奈の感情を揺さぶっているのだと思います。

Claude 3 Opus

解答らんよりかなり長いので、字数制限(60字程度)を加えました。

香奈は小箱の思い出の品を見て、家族と過ごした楽しい日々を懐かしく思い出した。しかし、今はみんな忙しく、特に自分は受験勉強に追われている。大切な時間を失ったことに気づき、昔を思い出して悲しくなり、涙が込み上げてきたのだ。

Claude 3 Opus

109文字…。
問一Cで「家族の絆」というこのお話のキーワードが出ているのに、残念ながら記述には反映できていません。「大切な時間」を「家族の絆」と書ければ、かなりの高得点を期待できたのですが、残念です(おそらく採点基準では「家族の絆」に近い言葉(つながりなど)を書いていないと減点です)。
ただ、それ以外は模範解答とほぼ同じ。10点中7点といったところでしょうか。

問四 理由説明

エが最もふさわしいと思います。
理由は以下の通りです。
本文中で、香奈は三者面談の通知を見た時の母の反応を想像しています。「この偏差値では、あの中学は無理ですね」と言われることを予想し、母がどんな顔をするだろうかと不安に感じている様子が描かれています。
また、香奈は自分なりに頑張ってきたつもりでいましたが、母は成績だけを見て香奈の努力を認めてくれないのではないかと懸念しています。
つまり、香奈は模試の結果が芳しくないことを母に知られると、自分の受験に向けた努力まで否定されてしまうのではないかと恐れ、面談に行きたくないと感じたのだと推測できます。

アは友人との関係について言及していますが、本文にはそのような記述はありません。
イは面談の意義を理解できないとありますが、香奈は成績の悪さを母に知られたくないと感じているのであって、面談自体の意味を否定しているわけではありません。
ウは母が普段から香奈の思いに応えていないとありますが、本文からはそこまで読み取ることはできません。

したがって、香奈が三者面談の通知を母に見せなかった理由を最もよく説明しているのはエだと判断しました。

Claude 3 Opus

正解。他の選択肢についての説明も完ぺき。

問五 セリフからの心情の読み取り

イが最もふさわしいと思います。
理由は以下の通りです。
お兄ちゃんは、母親に叱られたことで拗ねている香奈の態度を見て、「すねてたって、しかたないだろ」と言っています。これは、そんな態度をとっていても何も解決しないことを指摘していると考えられます。
そして、「さっさとあやまっちまえよ」と香奈に母親に謝るように促しています。これは、母親に謝ることで関係修復を図るべきだと香奈に伝えようとしているのでしょう。
お兄ちゃんは香奈の気持ちを完全には理解できていないものの、拗ねていては事態が良くならないことを分かっていて、香奈のためを思って行動していると解釈できます。

アは母親の態度への疑問について言及されていますが、本文にはそのような記述はありません。
ウはお兄ちゃんが母親の態度に苛立ちを感じているとありますが、そこまでは読み取れません。
エはお兄ちゃんが香奈をわがままだと思っているとありますが、本文からはそのような印象は受けません。

したがって、お兄ちゃんの様子を最も適切に説明しているのはイだと判断しました。

Claude 3 Opus

正解。理由説明も完ぺき。

問六 象徴表現(物に込められた気持ちや意味)の読み取り

エが最もふさわしいと思います。
理由は以下の通りです。
香奈は六歳の時に書いた願い事を読み返し、「もう少し夢のある願い事はなかったのだろうか」と思っています。風鈴堂の一番大きなケーキが食べたいという願い事は、香奈自身にとって大したことのない内容だと感じられたのでしょう。
そして、そんな"ささやかな願い事"さえも叶わない誕生日を迎えることに、寂しさを覚えています。つまり、小箱に書かれた願い事の内容が大したことなかったからこそ、それすら叶えられない自分の現状を情けなく感じ、みじめさを痛感したのだと考えられます。
結果的に、そのみじめな気持ちが香奈をいらだたせ、小箱を握りつぶして壁に投げつける行動につながったのでしょう。

アは誕生日への期待と現実への不満について言及していますが、香奈が六年間その願い事を期待していたかは定かではありません。
イは家族への怒りについて触れていますが、本文では家族が身勝手になったとは書かれていません。
ウは崩れた小箱の形と香奈の気持ちを関連付けていますが、そこまで深読みするのは難しいと思われます。

したがって、香奈にとって魔女の小箱がどのようなものであったかを最も適切に説明しているのはエだと判断しました。

Claude 3 Opus

正解。理由説明も完ぺき。

問七 理由説明(心情と行動の因果関係)

ウとエが最もふさわしいと思います。
理由は以下の通りです。
まず、ウについて。香奈はお兄ちゃんが「父さんがついてるから、大丈夫だ」と言ったことに対し、本当は父さんが医者ではないので大丈夫とは言い切れないと感じています。しかし、そんな不安な気持ちを口に出すことはできず、お兄ちゃんの言葉を無理に受け入れることで自分の不安を抑えようとしたのだと考えられます。

次に、エについて。お兄ちゃんは母さんの様子を気にかけてスマホを何度も見るなど、動揺している様子が描かれています。香奈はそんなお兄ちゃんの心情を察し、自分まで不安を口にすれば兄の動揺が大きくなってしまうと考え、兄を支えようと気遣ったのではないでしょうか。

アは香奈の心理として十分考えられますが、混乱しているからこそ兄の言葉を否定できなかったとは限らないため、不適切とは言い切れません。
イは母の身を案じる香奈の気持ちは読み取れますが、兄の言い分を否定することが母の身に悪影響を与えるとは考えにくいです。
オはお兄ちゃんが香奈の気持ちを理解していないと断定するのは難しく、また、香奈があきらめていたとまでは言えないでしょう。

以上より、香奈がお兄ちゃんの言葉を口には出せず、無理にうなずいた理由として最も適切なのはウとエだと判断しました。

Claude 3 Opus

エが不正解(正解はイ・ウ)。
イを選ぶことは生徒にとっても難しく、おそらくClaudeと同じように考えて選択肢を消してしまうのではないかと思います。
エの理由説明が「〜なのではないでしょうか」と若干控えめな調子になっているのも興味深いです。

問八 セリフの言いかえ・詳細の説明(記述)

香奈がこのように思ったのは、お父さんが「ごめんって」と謝ったことに対してだと考えられます。

お父さんは、最近家族みんなが忙しくてゆっくりご飯を食べる時間もなかったこと、そして香奈の誕生日にはみんなでお祝いしようとしていたのに母さんの事故でそれができなくなってしまったことを謝っています。

しかし、香奈は、家族が忙しくしている中でも自分のために時間を作ろうとしてくれた母さんの思いやりに気づいたのでしょう。母さんは香奈の好きなクリームコロッケを作ろうとしていましたし、風鈴堂に特注のバースデーケーキを頼んでいてくれたのです。

つまり、母さんは香奈のことを一番に考えて、誕生日をお祝いする準備をしてくれていたのに、事故に遭ってしまったことは母さんの落ち度ではないのです。

むしろ、母さんの思いを理解できていなかった自分の方こそ、謝るべきだと香奈は感じたのだと思います。母さんは精一杯香奈のためを思って行動してくれていたのに、香奈はそれに気づけていなかったからです。

だからこそ香奈は、お父さんが母さんに代わって謝ることに違和感を覚え、「ごめんって言うの、お母さんじゃない」と心の中で思ったのだと考えられます。母さんの事故は誰のせいでもなく、謝るべきなのは母さんの思いに気づけなかった自分自身なのだと、香奈は感じたのでしょう。

Claude 3 Opus

今回も長すぎるので、100字程度にまとめてもらいました。

香奈は、母が自分の誕生日のために精一杯準備をしてくれていたことに気づいた。事故は母の落ち度ではなく、むしろ母の思いを理解できなかった自分こそ謝るべきだと感じた。だからこそ、父が母に代わって謝ることに違和感を覚え、謝るべきなのは母の思いに気づけなかった自分自身だと思ったのだ。

Claude 3 Opus

137字…(ちなみに、100字「以内」で、と指示すると、72字になってしまいました…。なかなかすぐには「いい塩梅」というものが伝わりません)。

これはかなり減点されてしまうと思います。重要と思われる順に列挙すると…
① 文章テーマである「(家族の)愛情」に触れていない
② 母親とのやりとりが抽象的すぎる
「理解できない」にとどまっている。100字程度書ける解答らんであれば、「自分の気持ちを理解してくれない親だと思い反発する」くらいまで具体度をもたせるべきです。
③ 「謝るべきと感じた」を心情表現に言い換えられていない
心情表現に言い換えるべき、というのは受験ルールですね。
④ 家族は自分の誕生日を忘れているに違いない、という背景を含めたニュアンスで書けていない

文章テーマを読み取って解答に織り込むことや受験ルールは、プロンプト(カスタムインストラクション)に入れれば対応してもらえると思いますが、今回は素のClaude 3 Opusなので、ありません。

点数は12点中の3点くらいでしょうか。採点基準に照らし合わせると、これくらいの点数になってしまうと思います。

問九 情景描写の言いかえ

エが最もふさわしいと思います。
理由は以下の通りです。
この場面では、香奈の十二歳の誕生日に、お母さんの事故という予期せぬ出来事があったにもかかわらず、家族みんなで香奈の誕生日を祝っている様子が描かれています。
お父さんが風鈴堂の特注ケーキを取りに行き、お兄ちゃんが香奈のためにラーメンを作ってくれるなど、家族一人一人が香奈のことを思い、できる範囲で誕生日をお祝いしようとしている姿が伝わってきます。
そして、そんな家族に囲まれた香奈は、自分が家族に支えられていることを実感し、穏やかな気持ちになっていると考えられます。
夜風がカーテンを優しく揺らす情景は、香奈の穏やかな心情を表現しているのだと解釈できます。家族の絆に包まれた安らぎと平和な雰囲気を、この情景は象徴しているのでしょう。

アは家族がうまくいきそうだという点において少し的外れです。
イは香奈が家族を誇らしく思っているかどうかは本文から読み取れません。
ウは香奈が満足しているとは書かれていません。

したがって、夜風がカーテンを揺らす情景が表現していることを最も適切に説明しているのはエだと判断しました。

Claude 3 Opus

正解。説明も完ぺきです。

大問4の合計点は37点。

合計点は…

111点!

予想ですが、サピックス偏差値で60くらいは行くのではないだろうか?
(残念ながら、65には届かないと思います。)
*2
(2024/4/30追記)平均77.8点だったそうです。予想を大幅に外しました(恥ずかしい…)。おそらく偏差値65を超えると思われます。

選択肢問題はかなり正確に解けている印象でした。
ただ、理由説明については、おそらくですが、正解を選んで、その正解に合わせるように記述されているように思います。つまり、人間のように、本当に自分で考えた理由を書いているわけではなく、あくまで、正解と思われる選択肢に、悪く言えば「こじつけた」論理を書いている、ということです。

これは予想ですが、選ぶのが難しい選択肢問題については、カスタムインストラクションなしで正解するのはかなり困難だろうと思います(たぶん聖光学院、海城あたりには対応できないと思われます。9月以降に行われている6年生の合格力判定サピックスオープンも結構落とす問題が出ると思います)。

記述については、字数(解答らんの大きさ)を守っていないので、点数は高めに出てしまっているのですが、まあ、それでもよくできているのではないでしょうか?
文章テーマを考えさせてから、段階を踏んで解答させると、ほぼパーフェクトの答案が出せるのではないかと思います。

いかがでしょうか?

みなさんの予想と比べて、この点数はいかがでしたでしょうか?
これからChatGPTの日本語特化モデルやGPT5(?いずれにせよ、次のバージョン)が出てくれば、もっと精度は上がるでしょう。
このレベルのテストに対して満点の解答をつくるAIが出てくるのは時間の問題だと思います。

あまりAIに頼りすぎると、今よりも文章が書けなくなるのではないか、とか、私自身も色々と懸念することはあるのですが、それ以上に、現状ではこの技術が全く活用されていないので、そちらの方がもったいないな、と感じています。

あくまで、「たとえば」の話ですが、SAPIXは復習オンリー、予習なしのカリキュラムですが、ビデオ教材やAIを活用すれば、予習ありでもっと深堀りした授業ができるんじゃないかな、と思います(SAPIXにしたら、大きなお世話だと思いますが😅)。

ぜひ、みなさんのご意見をお伺いしたいです😊


*1 マルチエージェントシステムを組んだり、カスタムインストラクションを盛り盛りに入れれば、もっとレベルが高い答案が作れると思います。ここで言っているのは、ChatGPTやClaudeにそのままテスト問題を投げたときの解答の精度に対する感触です。Claude 3 Opusが現状では一番自然な日本語を使うモデルなので、この記事ではClaude 3 Opusについて検証します。

*2 中学受験になじみのない方のために、サピックス偏差値について少しだけ説明。5年のテストでの偏差値なので、あまりアテにならない部分もあるのですが、大体のイメージとして60近辺で麻布・武蔵・駒場東邦といった難関校、65近辺で開成・筑駒といった最難関校が見えてくる、と捉えてください。

この記事が参加している募集

AIとやってみた

この記事が気に入ったらサポートをしてみませんか?