見出し画像

国立大学の生成AI指針をデータベースにした

国立大学が2023年に発表した生成AIの指針をデータベースにしました。
(最終更新:2023年11月末)

データベースは自由に利用していただいて結構です。
(コピペしてだけなので整形、クリーニングが未完です)
引用していただける場合は下記の書誌情報をお願いします。

福島宙輝(2023) 「2025年にむけた生成AIへの大学の対応-国立大学指針の分析と情報セキュリティの標示方法の提案-」, 『大学教育研究』,(32).

データベースの内容

  • ウェブ上で公開されている指針のテキストデータを収集しました。

  • 国立大学86校のうち、60校から約80件の文書を入手しました。

  • 異なる文書を提示したり、学生向けと教職員向けに分けて提示したりしているものは、個別のケースとして収集しました。

  • 86校のうち26校では公開された指針を確認できませんでしたが、これには非公開の学内文書を提示している大学や、文科省の文書を大学の指針に代えている大学が含まれています。

データベースの概観

テキスト分析にKH Coder(樋口, 2004)を活用しています。
諸事情で神戸大に囲みがついていますが気にしないでください。

データベースの詳細

総語数:59,047
異なり語数:3,136
文:2,082
段落数:1,230
文書数:80

文字数

全大学の平均文字数は1387文字でした。

データベースの構造

多次元尺度構成法によるグラフです。
どういったテーマが語られているかの分析。

  • 生成AIとは(図の真ん中あたり)

  • 利用方針、技術への期待

  • リスクや使用条件を確認しましょう

  • 機密事項の入力への注意喚起

  • 著作権への注意喚起

  • レポートで使うときには出力結果を確認しましょう

  • 授業で使うときには教員の指示に従いましょう

  • 指針の内容は状況に応じて検討していきます

大体捉えられていると思います。

バブルチャートによるトピックの分析

四角の大きさは各大学内での相対的な割合を示します。
色については、トピックの軸で見たときに、赤色が濃いほど、そのトピックへの言及割合が多い大学であることを示します。

トピックは多次元尺度構成法のグラフなどを参考に筆者が設定しました。(後述)

バブルチャートを見ると、例えばいち早く指針を公表した東京外国語大学は「生成AIの説明」が赤いことから、そのトピックへの言及割合が多いことがわかります。

東京医科歯科大は語の総量は多いですが、
色を見ると満遍なく(各トピックに同じような文字数で)言及しています。

複数の文書を提示している大学がいくつかあります。
トピックを見てみると、例えば

宮城教育大は教員向けと学生向けでほとんど内容が同じ
福岡教育大は教員と学生で内容を分けている
愛媛大学は2つの文書で異なる内容を示している

といったことがわかります。

神戸大(四角囲み)は、
・「技術的対策、活用方法、バイアス」に関する言及がない
・色の濃いものがない(=満遍なく言及している)
となっています。
単語量(かなり少ない)とあわせて考えると、全体として特徴のない文章であることがわかりますね。

トピックの設定

先ほどのバブルチャートで使用したトピックは、下記のキーワードを含んだ文があるかどうかで判定しています。

*大学の指針
本学 or 方針 or 留意事項 or 踏まえる or 教育 or 研究 or 利活用 or 運用 or 社会
*業務改善
業務 or 効率化
*生成AIの説明
公開 or 発表 or 現在 or 提供 or サービス or 利用者 or 回答 or 質問 or 対話 or 言語モデル
*情報漏洩への注意
意図 or 漏洩 or 流出 or 入力 or 個人情報 or 機密情報 or セキュリティ
*著作権への注意
侵害 or 著作権 or 著作物 or 剽窃
*結果を確認して提出しましょう
レポート or 出力 or 結果 or 提出 or 生成物 or 内容 or 確認 or 責任 or ペースト
*教員の指示に従ってください
指示 or 担当教員 or 従うor 判断 or 禁止
*リスク
懸念 or 留意 or 注意 or 倫理 or リスク
*バイアス
価値観 or バイアス or 差別 or 格差
*活用方法
壁打ち or ブレインストーミング or ブレスト or ブレイン or 校正 or 翻訳 or アイデア
*技術的対策
オプトアウト or プロンプト or 再学習 or ハルシネーション or Hallucination or インテグリティ

神戸大の文書が「技術的対策、活用方法、バイアス」に関する言及がない、というのは、それぞれのトピックのキーワードが使用されていない、ということです。

データベースの活用と今後

今集まっているデータは2023年末の段階で、各大学は生成AIへの初動対応としての大まかな「方針」を示した、というところでしょう。
2024年以降、各大学はより詳しいガイダンス的な資料や、FD研修の資料を作成、公表していくことになります。
現段階ではあまりトピックごとの特色はなくても、これから

  • 推進派

  • 慎重派

  • EdGPTを取り入れる

  • 事務業務に導入する

  • LMSに組み込む

  • 学生の評価に活用する(名古屋大が言及している)

など、大学ごとの取り組みに差が出てくると思います。そうなったときには、このトピック分析がより活躍するのではないかと思います。

現在は国立大だけを集めていますので、私立大を集めていきたいですが、なにしろ個人でやっているので、できるかなあ…

データベースは、随時更新していきます。


この記事が気に入ったらサポートをしてみませんか?