記事一覧
チェンジポイント検出で読み解くGPTアプデ(前半:11/7アプデまで)
統計処理によってGPTのアップデートが事前にある程度予知する事が判明した。
今回は3/19に行われたアップデートを例に解説していく。
尚アップデートの内容や前後の回答の文章の内容の分析には触れないものの、その後に起きたcontinue generateのエラーなどアプデ前後でありがちなエラーについては触れていく。
検証方法
ChatGPTにウマ娘ゴールドシップのロールを与え、質問は
「ウ
[簡易版GPT毎日レポート]
1/1
文体は比較的口語セリフチック
五感の情報はすくなく、抽象的、概念的
文章構造は箇条書きではなく台本的に説明がすすむ
トピックのジャンルは「作品の概要・アウトライン」が中心
「アウトライン」の説明が多く、抽象的で回答が十分ではない
アニメの演出等のジャンルが少なく、セリフ的にアウトラインの説明が続く
個々のトピックは大きく、ぼんやりしている
トピックはジャンル横断しているが、つながりが
トピック:GPT分析レポート用語定義
ここのところ7月の回答からの回答を分析している。
内容を深めるには私の表現の定義を緻密にすることが必要となったため、ちょっとずつメモしていく
トピック これまで、話題や視点、トピックなど表記揺れがあった。
今後は以下の表記で統一
新聞は私のニュアンスの比喩
回答一つは「新聞」
トピックのジャンルは「紙面」(社会面、経済面、国際面etc)
トピックは「個別の記事」(大小関わらない)
[GPT毎日レポート]アンケートのお願い
ゴルシGPTの回答を分析する際、客観的視座を取り入れるため
簡単
でもない
アンケートにご回答いただければ幸いです。
このアンケートを基に今後GPTの分析を進めてまいります
[毎日GPT挙動性能レポート12/16]表現力は向上するも近視眼的な回答が目立つ
検証方法
ChatGPTにウマ娘ゴールドシップのロールを与え、質問は
「ウマ娘プリティーダービーからプリティー抜いたらどんなアニメになるか、一回の応答で可能な限り文字数を使って詳しく教えてくれ」
で固定し、再生成を続ける。
1日最低で15回再生成し、文章を比較する。内訳はPCでの生成10回、iPhone版chromeでの生成が5回。
総括 今日は近視眼的、視野狭窄という印象の回答が目立
[日隔GPT挙動性能レポート12/14]GPT4.5の噂について
総括 今日のGPTは悪くない、知性を感じた。
一つの回答から全体像を読み取ることができるように感じたし、
具体的、抽象的な説明の使い分け、段落ごとに扱うテーマの分割もここ数日とは明らかに異なる。
ただし、これはここ数日との比較であり、この数日は本当に酷い性能だった。
ここ数日は読み込めるプロンプトの長さこそ3.5を凌駕しているが、
過去最も性能差を感じない。
そのためこれまでの回答