見出し画像

『小説家になろう』全作品分析レポート ~前書き・先行研究について~

これは小説家になろう』の全数調査を行い、各種傾向を掴むための分析レポートである。
基本的には作者様に向けたものであるが、読者の方及び『小説家になろう』に興味はあるけど似たようなものばっかりじゃないの? といった疑問をお抱えの方にも是非目を通していただきたい。
全体として文体は堅いものになるが、グラフ等を多用し技術的なことを最小限にすることで見やすさにも配慮した。軽い気持ちで読んでいただければ幸いである。

【目次】
・はじめに
・目的
・分析方法
・先行研究について ◀今回はココまで

ジャンルの割合比較
・あらすじ文字数・頻出単語比較
 ・『恋愛』ジャンル分析
 ・『ファンタジー』・『文芸』・『SF』ジャンル分析
 ・『総合』分析・『あらすじ』文字数分析

小説内会話率・1話あたり字数の比較
・投稿年度から見るトレンド比較
・結論

【はじめに】

小説家になろうは数多くのオリジナル小説が無料で投稿・閲覧できるサービスであり、書籍化・アニメ化のブームもあってネット小説投稿サイトの中でも知名度が非常に高いものである。

しかし、その知名度から来る投稿作品の多さによって、投稿してみたものの期待よりも評価されないといったことが多々起こりうる。

作品の内容(面白さ)が同じくらいである筈なのに、何故評価されないのか?
ジャンルやあらすじ、また文体としての会話率(「」で囲まれた文の割合)からその理由を考察する。

今回の分析では以下の環境、言語及びツールを使用した。

・Microsoft Visual Studio 2019
・Python 3.7
・MeCab 0.996

※注記
・2020/03/24 時点での分析結果になります。
・著者は統計学もプログラミングも専門ではありません。化学はいいぞ。
・論文やレポートの形式からは逸脱しています。あくまで読み物です。
・項目ごとに分けて投稿します。目次・本文最下部のリンクを活用下さい。

【目的】

今回の分析では総合ポイントが高い作品に共通する要素を比較及び考察することにより、『小説家になろう』における各種の傾向をつかむことを目的とする。

【分析方法】

今回の分析では、なろう小説を6つのグループに分けて分析を行った。グループ分けは以下に示すように総合評価ポイントにより行い、それぞれ以下に示す5つのジャンルによってさらなる細分化も行った。
また、投稿年度による分析では第1話の投稿年度によってグループ分けを行った。

グループ1:100,000 pt以上
グループ2:100,000 pt未満、50,000 pt以上
グループ3:50,000 pt未満、10,000 pt以上
グループ4:10,000 pt未満、5,000 pt以上
グループ5:5,000 pt未満、500 pt以上
グループ6:500 pt未満
F:ハイファンタジー、ローファンタジー
L:異世界(恋愛)、現実世界(恋愛)
B:純文学、ヒューマンドラマ、歴史、推理、ホラー、アクション、コメディー
S:VRゲーム、宇宙、空想科学、パニック
O:童話、詩、エッセイ、リプレイ、その他

評価ポイントによってグループ分けを行ったが、これは分析のために便宜上行ったものであり、これは作品の優劣と直接関係するものではないことを明記しておく。

小説家になろうの投稿作品データは『なろうデベロッパー』様のなろうAPIを使用して行った。取得するためのコードは『なろう分析記録』様のコードを参考にした。

今回の分析ではMeCabを使用した形態素解析から頻出単語の抽出を行う。
これは簡単に言えば、日本語の文を品詞ごとに分ける、というプログラムであり、頻出単語の抽出とはその結果を数え上げるということである。
なお、後述するが1作品あたりの単語のカウント数は1回までとした。これは1つの作品で連呼されたワードが全体に影響を及ぼすのを避けるためである。

【先行研究について】

『小説家になろう』では数多くのデータ分析が為されてきている。
その中でも、『小説家になろうを知ろう ~小説家になろうをグラフ化してみた~』や『ブックマーク獲得条件の重要度をAIを使って解析してみた【2019年版】~とりあえずブクマ欲しいなら、異世界(恋愛)かVRゲーム書いとけ~』は非常に分かりやすく様々なデータがまとまっている。
特に前者は、他の分析記録へのリンクも豊富なので興味がある方はぜひ確認してほしい。

また、形態素解析を使ったものとして『なろう小説の人気作品のタイトルで最も使われている単語をCOTOHAの形態素解析で調べる』や『小説家になろうのランキング上位作品を可視化してみた【形態素解析】』、『Doc2Vecを使って小説家になろうで自分好みの小説を見つけたい話』などがある。
特に一番下のものなどは専門性が高く非常に難しい内容だが、一度目を通してみると良いかもしれない。難しすぎて私には良く分からなかった。

上記サイトやかずなしのなめ氏(@nonamenonumber)のツイートを受け、
今回はあまり分析されていない『あらすじ』について主に扱い、小説家になろうに投稿されている作品の全数調査を行うこととする。


次回
ジャンルの割合比較


【以下蛇足】
見出し画像はレビュー数と総合ポイントの関係をプロットしたものである。
Twitter上や掲示板上での相互レビューがあることからも考えられるように、レビュー数はあまりあてにならなそうだ。そもそも分散が大きすぎる。

とはいえ飛び抜けてレビュー数の多い作品は『本好きの下剋上 ~司書になるためには手段を選んでいられません~』や『Re:ゼロから始める異世界生活』のように、書籍の評判もすごぶる良いものが多い。
構成力や文章力が非常に高いと感じられるものばかりなので、未読であれば是非一度読んでみてはどうだろう。

【以下宣伝】
Twitterやってます。もしよかったら。
あれ、Twitterしか宣伝するものが無い……そもそもこれ自体を宣伝したい……

この記事が気に入ったらサポートをしてみませんか?