見出し画像

書籍データの二次利用 その3 〜学参組版とデータベース〜

2019年6年21日、東京、青海で開催された「第10回 学校・教育 総合展」に行きました。
https://www.edix-expo.jp/ja-jp.html

この日、
「AI時代を生きる子供達のこれからの教育とは
〜世界で採用されるGoogle for Educationの成功事例とともに考える〜」
https://d.edix-expo.jp/tokyo/seminar/tab2/
というセミナーに参加しました。
その内容がとても興味深く面白かったので、そこで思った事を書きます。

参加動機

Googleが教育事業に乗り出しているという話は聞いていたのですが、具体的にどんなことをしているかは知らず、前々から興味がありました。
ただ、僕の職業はDTPオペレーター(学参専門ではありますが)。
正直なところ、僕には直接は関係ないだろうな〜、とは思っていました。
学参の仕事をしている人間の末端として聞いておいて損はないだろう、あと無料だし。
みたいな軽めの興味が動機でセミナーに申し込んだ、というのが参加の経緯です。

Googleの取り組みについて

ここは、簡単に説明します。詳しく知りたい人はサイトを見て下さい。
https://edu.google.com/intl/ja_ALL/?modal_active=none

まず、教育現場向けのアプリケーション集の「G Suite for Education」です。
このアプリはみなさんご存知のGoogleの「スプレッドシート」とか「Googleドキュメント」など、みなさんがよくお使いであろうツールにプラスして、教育現場の管理ツールの「Classroom」というアプリが加えられています。
管理ツールでは採点、集計、出席の確認なんかができるようです。
アプリはすべてクラウドとなります。

そして、専用端末の「Chromebooks」。
子供向けなので頑丈とか、設定が楽とか、とかそんな感じの端末で、各メーカーで出しているようです。
専用端末じゃなきゃいけない理由については、サイトをみるとあれこれ書いてありますが、別に専用じゃなくてもよいのでは?
と、思ったりましますがどうでしょう?
多分、大量に生産できて、配りやすい、あたりが専用端末にする理由なのかな?と憶測したりしなかったり。(あくまで憶測)

アプリは全てクラウドなので、アカウントを切り替えるだけで端末は生徒のものになります。
このアカウント切り替えによる運用方法がキモみたいですね。

気になったこと

セミナーでは「G Suite for Education」を使ったいくつかの事例をあげていて、その中で個人的に気になったことが1点ありました。
現在、教育現場では「Googleフォーム」を使って小テストを作成していることがあるそうです。
「Googleフォーム」はWebでアンケートとかを行うアプリなのですが、
採点する機能が搭載されているため小テストにも適したアプリなのだそうです。

下記サイトでサンプルを公開しています。
https://iteacher.hatenablog.com/entry/2018/07/26/180000#%E5%95%8F%E9%A1%8C%E3%81%AE%E3%82%B5%E3%83%B3%E3%83%97%E3%83%AB

サンプル
https://docs.google.com/forms/d/e/1FAIpQLSf6mtLFWyfe0zsGGipRAG2h28TGaiXZYVkJsfUfW0RGsO_CDg/viewform

そして、その小テストに記載する問題は「スプレッドシート」で管理しているとのことでした。
「Googleフォーム」での採点結果を「スプレッドシート」に追記することにより、各生徒の成績もデータベース化できます。
このデータを利用することにより各生徒向けに「系統学習」を行うことができます。
(「系統学習」についてはセミナーでは言ってませんでしたが、おそらくこれをやろうとしているのではないかと思います。たぶん。)
系統学習」については詳しく知りたいのであればググって欲しいのですが、簡単に説明すると、
生徒1人1人のテストの結果を見て、生徒が苦手な問題を、次のテストでもう一回出題して、苦手を克服してもらおう。みたいなことです。
(あってる?あってるよね?詳しい人!)
つまり、Googleが提案する未来の教材は「Googleフォーム」と「スプレッドシート」を行ったり来たり、くるぐる回って、生徒1人1人に向けた最適な教育を提供するようになるのだと思います。

あと、「Googleフォーム」の教材に特化したやつとかが出ればもっと広がるかなー。とも思いました。

組版に何ができるか

未来の教材が「Googleフォーム」と「スプレッドシート」の行ったり来たりだけになるとすると、
「紙いらなくね?」
「むしろ、紙が無い方が効率よくね?」
と、なりそうですよね。普通に考えて。(笑)
ですが、僕は紙の組版がこのぐるぐるに食い込む方法があるとおもいました。
1.「スプレッドシート」からの「組版」への変換。
2.「組版」から、「スプレッドシート」への変換。
」は、スプレッドシートをデータベースとして使い、必要な情報のみ抽出した後、自動組版を行うイメージです。
」は、新規組版後、校正や変更を加え、校了した組版データから必要なデータを抽出しスプレッドシートへ反映させるイメージです。

上記の2つが可能であれば、
紙の組版はアウトプットの1つの提案として存在し続けるのではないか?
まだ、紙の学参組版に需要はあるのではないか? と思いました。

機能的に考えて紙がすぐに無くなるとは思いませんが、今後、紙の需要が大幅に増えるとも思えません。
未来の組版ではシステムと足並みを揃えて、適材適所で紙をチョイス出来るような環境が必要なのではないかと思います。
(これは愚痴ですが、定年待ちの逃げ切り体制の方々に、この手の話をすると怒ってごまかします人いますよね。なんなんですかねー。)

この2つを可能にするためには

まず、「」だけを行うとするのであれば「スプレッドシート」のデータを読み取り、単純に自動組版を行えばよいと思います。

次に、「」ですが、これを行うのは一筋縄では行きません。
通常の組版では、目視で紙面を見て内容が理解出来るようにレイアウトされています。
ただ、通常の組版ではデータを抽出するためには作られていません。
データを抽出したとしてもテキストが抜きとれるだけですね。

学参書籍の問題集などをデータベース化しようとすると「章」「単元」「大問」「小問」「解答」などの項目の情報が必要になります。
データ抽出を行うためには上記を組版データに含めることが必要です。
そして、その情報には範囲の設定と、親子関係が明確になるような階層の設定を行う必要があります。
平たく言うとHTMLのタグの構造のようなイメージです。

通常の組版では安全性や制作スピードなどの制作工程が優先されるため、余分なデータは極力含めません。余計な情報は事故の元になしますしね。
ただ、データ抽出を行うためにはこれらの情報は必須となります。
データをどう格納するかがポイントです。

このように、組版データにHTMLのタグのような「目印」を付加した組版を構造化組版と呼称します。

僕は会社員時代、この構造化組版をクライアントに提案し、実際に制作を行った経験があります。
クライアントは関西のとある学参系出版社で、制作を行ったのはとある地方自治体のドリル教材の紙版です。
この時は上記の「」のような要件を目指して組版を行いました。
要件は「組版」から「CSV」へ出力を可能とするための組版です。
組版で構造化を行うために、まず、InDesignのテキストフレームへ名称を設定を行いました。
テキストフレームの名称はHTMLでいうところもタグの名称みたいなイメージです。
そして、そのテキストフレームの中にテキストフレームを格納することで親子関係を再現しました。
「単元」の中に「大問」を格納し、さらにのその中に「小問」が入っている、といった構造です。

このテキストフレームの名称を目印にデータを正確に抽出できるようにしました。
上記のような構造化組版では通常の組版より制作時間が長く必要となります。
この時は予算をつけていただき、通常の組版に何割か加えた費用を頂戴しました。
なぜこんな実験的なことに予算がついたかについては内緒です。(笑)

なぜ、テキストフレームに名称をつける手法を行ったのか?

上記のテキストフレームに名称を設定する構造化に行き着くまでには結構時間かかかりました。
InDesignにはそもそもXMLタグを付加する機能があるのですが、この機能は大変使いづらく却下となりました。
ちなみにタグ機能をつかって出力したデータからDBアプリを開発したことがあったのですがめちゃくちゃ大変でした。
また、マークダウンのようにスタイルを活用した構造化も考えたのですが、この方法では親子構造が再現できない箇所があるため却下となりました。
テキストフレームに名称を設定する方法が最善であるとは思わないのですがInDesignで構造を再現するためにはこの方法がしかないと思い、この手法をとりました。

同様のケース

これと同じようなソリューションを求められている出版社は他にもありました。
ご提案をさせていただくとクラアントの反応は上々だったのですが、話はまとまりませんでした。
組版の単価が多少上がるくらいであればさほど問題はなさそうな感じでしたが、データベースを一から立ち上げるとなると結構な予算が必要となります。
そう、やすやす決断できることではありません。
今回のセミナーでは「スプレッドシート」がデータベースとなるとのことなので、開発をどこまでやるかによるとは思いますが、導入のハードルは下がるのではないかと思います。

今後について

もし、自分がこれから構造化組版を作るチャンスがあるなら、「」の自動組版の時点で構造化組版を行いたいなと思います。

「1」の時点で構造化さえされていれば後はデータを抜き取るだけなのでさほど難しくは無いと思います。
これにより、構造化組版の制作コストは抑えられるのではないかと思います。

課題

数式
学参の組版の構造化を行う上での最大の課題は数式の組版だと思います。
テキストベースで数式を保持するのであればLaTex、MathJax、MathMLなどの形式となると思います。
これらの形式であればブラウザで数式の表現を行うことができます。
これらはXML構造となっており、InDesignでそのXML構造を保持するのはとても大変です。(個人的には不可能では無いはずだとは思っています。)
ちなみに、MC-Smartなら数式がいけるのですが構造化がクリア出来るかがわかりません。
あと、InDesignではMathMagicがありますがスクリプトでコントロールできなかったので不可能です。

学参組版特有の表現
国語の漢文などに使用されるレ点や一二点、英語の発音記号、社会の記号など学参組版には特有の表現が沢山あります。
テキストで再現できないものは画像として保管することになるとは思います。
これらの表現方法についても取り決めが必要となると思います。

最後に

ここまでで「自動組版」とか「データ出力」とか当たり前のように書いていましたが、この処理はスクリプトじゃないとできません。(笑)
この記事を読んで下さって、ちょっと試してみようかな〜と、お思いの方がいらっしゃっいましたら、お気を付け下さい。
スクリプトはソリューションを提供してくれるだけでなく、新しい需要も掘り起こせるはずなのでこれからも色々と挑戦していきたいです。

この記事が気に入ったらサポートをしてみませんか?