見出し画像

[論文] NISTEP関連の論文3本


書誌情報

①小柴 等,伊神 正貫,伊藤 裕子,林 和弘,重茂 浩美. (2020). COVID-19 / SARS-CoV-2 に関する研究の概況 ─ 2020 年4 月時点の論文出版等の国際的なデータからの考察. NISTEP. NISTEP DISCUSSION PAPER,No.181,文部科学省科学技術・学術政策研究所, 東京. http://doi.org/10.15108/dp181

② 小柴等, 林和弘, & 伊藤裕子. (2024). COVID-19 / SARS-CoV-2 関連のプレプリントを用いた研究動向の試行的分析 [Preliminary analysis of research trends using preprints related to COVID-19/SARS-CoV-2]. NISTEP DISCUSSION PAPER, No.186. 文部科学省科学技術・学術政策研究所. DOI: http://doi.org/10.15108/dp186

③Okamura, K. (2019). Interdisciplinarity revisited: evidence for research impact and dynamism. Palgrave Communications, 5(1).

①COVID-19 / SARS-CoV-2 に関する研究の概況 ─ 2020 年4 月時点の論文出版等の国際的なデータからの考察

要約

bioRxiv, medRxivみたいなプレプリントの論文のタイトルとアブストでトピック分類→トピック分類が疫学調査のステップによくあてはまる+週単位の分析から、トピックの時系列的な変化は、疫学調査の段階的な進行状況を反映している可能性。国・地域別によるトピックの分布から、感染拡大の時期によって、各国・地域の研究活動の重点が異なる。論文数は中国アメリカ→ヨーロッパで日本は17位だが、感染者数で正規化すると上位

ポイント

・Fast text → kmeans++ →Umap+ワードクラウド
←これをひな型にしてほかの手法も混ぜながら再現してみたい

・論文ごとにデータ量の偏りが大きいからTFIDF各論文の特徴語上位20 件までを算出して解析に用いた.←正規化の手法の一つとして参考になる

・分散表現の辞書は,別途pubMed の2019 年データ(約6 千万の論文タイトル・概要データ)を用い,fastText[Bojanowski17, Joulin16] で算出した300 次元のものを用いた←別で作るのが大事なのかな?

・論文に国の情報も足している。
←自分が可視化したさいはすべてのノードに色を付けて一枚の図にしたせいでごちゃごちゃになっていたが、複数枚にしていたので見やすかった。

・トピックの移行をヒートマップで表している。
←やり方が分からない。

疑問

・引用ネットワークとの違いを見てみたい。

・First suhotr以外の情報もいれるとして、どうやって反映させる?

②COVID-19 / SARS-CoV-2 関連のプレプリントを用いた研究動向の試行的分析

要旨

引用情報ではナウキャストができないという観点から①と同じくNLP(Fast text)+プレプリントで分析したところ、前回の傾向を引継ぎつつも、対象ジャーナルの多さから人文社会系などの検知も可能になった。

ポイント

・arXiv, bioRxiv, chemRxiv , medRxiv, SSRN, SSRN Lanceが対象

・①と違いTF-IDFによる剪定を行わずアブストの全てを使った。

・マッピングの結果、基本的にはジャーナルごとに固まっている(=クラスタリングも対応)がmedRxivが懸け橋となっている

・時系列の結果は概ね1と合致したが、①と異なり人文社会系も含まれてた結果、社会・経済・政策のトピックも検出され、また、chemRxivが含まれた結果治療薬やワクチン開発の検出もできた

疑問

・これは即応性からプレプリントに限定していたがコロナが収束した今なら普通の論文でも分析かのうなのでは?

③Interdisciplinarity revisited: evidence for research impact and dynamism

要約

学際性と論文のインパクトには正の相関があり、前者が1領域増えると後者は20%上昇する。また、knowledge integrationとknowledge diffusionの2つの指標を統合し、クラスタリングの仕方に依存しない学際性の指標を生み出した

ポイント

・②で学際性の指標を考える論文として引用されていた。

・RF(Research Front)の論文に焦点を当てている
①研究分野の動向のスナップショットが撮れる
②知識融合による新しい知の創造が分かる
③ちょっとわからない

・Web of ScienceのESIの22分野からここ5-6年のTop 1%の論文を持ってきた

・インパクトの指標はRFレベルで正規化

・従来は以下の形で学際性(IDR)は測られていたが
knowledge integration:異なる分野からの引用
knowledge diffusion:異なる分野からの被引用

①Variety(かかわっている分野の数)
②balance(分布の偏り)
③dissimilarity(やっていることの違い)

学際性の指標

③が<Mab>に相当して、ジャッカード指標の平均らしい。
全体の中での分野Aの論文数*全体の中での分野Bの論文の割合*ABの被り具合
ってことだと思う

・きちんと正規化されているので、どんなRFの取り方をしても比較できる

疑問

・社会科学が含まれていないのが残念+分野の分け方が少しおおざっぱすぎ?

・RFは自然科学じゃないと使いづらい?

・この論文を引用している論文を絶対見る

https://www.sciencedirect.com/science/article/pii/S1751157720306416



この記事が気に入ったらサポートをしてみませんか?