大衆向けビデオゲーム内の市民科学による微生物系統学の改善

本文へスキップ
ネイチャーバイオテクノロジー
検索
ログイン
コンテンツ
Natureについて
掲載
記事
PDFダウンロード
記事
オープンアクセス
出版:2024年4月15日
大衆向けビデオゲーム内の市民科学による微生物系統学の改善

https://www.nature.com/articles/s41587-024-02175-6


ロマン・サラザン=ジェンドロン、パーハム・ガセムルー・ゲイダリ、ボーダーランズ・サイエンス開発チーム、ボーダーランズ・サイエンス選手、...ジェローム・ワルディスピュール 著者一覧を見る
Nature Biotechnology (2024)この記事を引用する

9486アクセス

210 Altmetric

指標詳細

概要
市民科学ビデオゲームは、主に科学に貢献する気のあるユーザーを対象として設計されているため、世界中に30億人いると推定されるゲーマーのコミュニティにとって、その利用しやすさは大きく制限されている。我々は、数千万人のゲーマーがプレイする人気の商用ビデオゲームにシームレスに統合された市民科学活動であるボーダーランズ・サイエンス(BLS)を作成した。この統合は、市民科学ゲームの斬新なゲーム・ファースト・デザインによって促進され、ゲーム・デザインの側面が最優先され、適切なタスクがゲーム・デザインにマッピングされる。BLSは、ヒトマイクロバイオーム研究から得られた100万個の16SリボソームRNA配列のマルチプルアラインメントタスクをクラウドソーシングしている。2020年4月7日の最初のリリース以来、400万人以上のプレイヤーが1億3,500万以上の科学パズルを解いた。これらの結果を活用し、我々の多重配列アライメントが、最先端の計算手法と比較して、微生物の系統推定とUniFracの効果量を同時に改善することを示す。この成果は、ハイパーゲーム化された科学的タスクが大勢の貢献者を惹きつけ、科学コミュニティに貴重なリソースを提供することを示している。

他の人が閲覧している類似コンテンツ
市民科学者によるデノボタンパク質デザイン
記事 2019年06月05日
ブライアン・ケプニック, ジェフ・フラットン, ... デビッド・ベイカー

ポケモンの時代に生物多様性保全を進めるためのファイロカードゲームの利用
論文 オープンアクセス 2019年07月16日
ミーガン・M・キャラハン、アレハンドラ・エチェヴェリ、...テレ・サターフィールド

オーストロネシア語のゲーム分類学: 歴史的ゲームの異文化データセット
論文公開 2021年5月12日
サラ・M・ライステラー=ピープルズ, スザンネ・ハーデッカー, ... ダニエル・B・M・ハウン

メイン
2022年、世界で30億人以上がビデオゲームをプレイした1。このコミュニティの成長は今後も続くと予想される。ゲーマーコミュニティの規模と多様性は、ビデオゲームが世代、性別、文化を超えた普遍的な娯楽活動であることを示している2。

ビデオゲームのユビキタス性は、科学的概念を伝えたり教えたりする新たな機会を生み出し3,4,5,6,7、このメディアの最も注目すべき応用例のひとつが、実際の科学データの分析に参加者を参加させる市民科学ゲーム(CSG)の開発である。タンパク質の構造予測に協力するオンライン市民科学者を募集した2008年のFolditで紹介され8、CSGはその後、比較ゲノム学9、RNA折りたたみ10、ニューロン分割11、量子物理学12,13に応用されてきた。過去10年間で、CSGは市民科学の実践に劇的な影響を与え、科学活動への参入障壁を下げ、何十万人もの新しい参加者をコミュニティにもたらした。しかし、このコンセプトの成功には、潜在的な参加者へのリーチや参加者のエンゲージメントの維持など、独自の課題も伴う14,15。

CSGを設計するための古典的なアプローチは、ゲーミフィケーションに依存している。つまり、アクティビティを完了するために必要な専門知識の習得を促進し、エンゲージメントを高めるようなゲームデザインの要素を導入することである16,17,18。このようなCSGのデザインは、科学的課題の定型的な提示に強く根ざしているため、その娯楽的価値、ひいては一般市民の参加を妨げる可能性がある。そのため、ターゲットとなるユーザーは、科学に以前から関心のあるユーザー15に絞られ、最終的に市民科学プロジェクトで観察される人口統計的な偏りを増幅させている19。

市民科学におけるユーザーの獲得と参加という課題に答えるため、2015年にMMOS(Massively Multiplayer Online Science)は、大規模なゲーマーコミュニティ20によってプレイされる商用ビデオゲームに市民科学活動を組み込むことを提案した。このコンセプトの最初の形は、2016年の多人数同時参加型オンラインゲームEVE OnlineにおけるProject Discoveryであった(参考文献21)。EVE Onlineは、科学的ナラティブを歓迎するスタンスのユーザーベースを持っており、市民科学があらゆるタイプのビデオゲーム、特に科学的ナラティブに馴染みのないゲーマーコミュニティで機能することはまだ示されていなかった。

本研究では、商業ゲームにおける市民科学の統合という課題を克服するために、ゲームデザインの重要性を強化する。また、これまでのPhylo9,22,23の経験を活かし、「ゲーム・ファースト・デザイン」の原則に従ったマイクロバイオームデータ解析のためのCSGを開発する。このアプローチは、既存の科学研究手法を適応させるのではなく、科学的計算メカニズムをゲームプレイの中核に組み込んだ純粋なゲームを作成することを目的としている(補足情報、セクション6)。最終的に、この方法論は、科学的タスクの複雑さがアクセシビリティを難解にしたり、ユーザーエクスペリエンスを変化させたりしないように、データの正規表現に根本的な変化をもたらすことができる。私たちは、「訓練されていない」新鮮な目で元の課題を再設計するというこのアプローチが、ゲームや物語デザインといった他の分野から価値ある改善をもたらすことを発見した。

このアプローチは、収集された答えの妥当性を犠牲にすることなく、一般市民の参加に大きな利益をもたらす。さらに重要なことは、従来のCSGでは実現不可能であった、大規模な科学データセットに対する複雑な計算タスクを実行できる、新たな人間の計算リソースへのアクセスを提供することである。

ボーダーランズ・サイエンス(BLS; 図1)24は、ボーダーランズ3(全世界で7,700万本以上を売り上げたビデオゲーム・フランチャイズの最新作)の無料ダウンロードコンテンツとして2020年4月7日にリリースされたタイルマッチング・ミニゲームである。BLSは、腸内微生物のゲノムデータを収集する市民科学イニシアティブであるThe Microsetta Initiative(TMI)のAmerican Gut Project(AGP)25から得られた100万個の16SリボソームRNA(rRNA)配列の参照用マルチプルアラインメントを改善するように設計されている。

図1:BLSゲーム
図1
aに、BLSのゲームプレイを示す。プレイヤーは、核酸塩基を表す色のついたレンガを、黄色の隙間レンガを挿入して左側のガイドに揃える。列が揃うとボーナスが与えられ、次のパズルに進むにはパースコアに到達しなければならない。bでは、データ収集からアラインメント出力までのBLSパイプライン、特に100万配列の初期アラインメントから本稿で取り上げる解析結果までのデータの流れを示す。補足情報には、ゲームデザイン、パズル生成、フィルタリング、再アラインメントに関する各ステップの詳細が記載されている。

フルサイズ画像
発売以来、400万人以上のゲーマーがBLSをプレイし、1億3,500万問以上のパズルを解きました。我々の結果は、BLSから得られた多重配列アライメント(MSA)(図1bおよび方法)が、他のアライメント手法と比較して微生物の系統推定を改善し、ヒトの消化器系の健康に重要であることが知られている多くの変数について、UniFrac26の効果量推定を改善できることを示している。これらの結果だけでなく、BLSは、大規模なゲノムデータセットの手作業によるキュレーションと解析のために、市販のビデオゲームが大規模な人的処理リソースを提供できることを示している。

結果
タスクとデータ
本論文で取り上げるデータは、AGP25の参加者から提出された便サンプルから配列決定された953,000個のrRNA断片からなるもので、Powered by TMI (https://microsetta.ucsd.edu/)による。断片は150塩基長で、16S rRNA遺伝子のV4領域に由来する。

BLSミニゲーム(図1a)では、プレイヤーは4-10ヌクレオチドの配列を7-20個見る。各配列はレンガの縦積みとして表示され、各色はヌクレオチドを表す(色とヌクレオチドの間のランダムマッピングによって)。レンガは折り畳まれ(隙間はすべて取り除かれる)、プレイヤーはガイドに正しく整列したレンガの数によって決まるスコアを向上させるために、有限の数の隙間を挿入するよう求められる。左側にあるこれらのターゲットは、対応するアライメントの列で最も一般的なヌクレオチドを表示します。ギャップ・トークンを挿入することで、プレイヤーは生まれつきのパターンマッチングのコツを使い、スキャフォールド・アラインメントの領域を整列し直すことになる。トークンの数には限りがあり、素朴で貪欲な人工知能(AI)プレイヤーが、いかに簡単にアライメントを改善できるかに基づいて設定するため、プレイヤーは厳しい選択を迫られる。この貪欲なプレーヤーは、次のパズルに進むためにプレーヤーが打ち勝たなければならない目標スコアも設定し、最小限の努力を強いる。

このイニシアチブの最初の1年間で、私たちは約7,500万個のパズルの解答を集めた(1パズルあたり平均43個)。解答は、足場アライメントの潜在的な誤りに対するプレイヤーの「投票」として使用され、修正されたアライメントが生成された。ここでは、我々のBLSアライメントと、いくつかの最先端のde novoマルチプルアライメントプログラム(PASTA、MUSCLE、MAFFT)によって生成されたベンチマークアライメント、および貪欲アルゴリズムによって生成されたアライメントの結果を報告する(方法と補足情報、セクション12-15)。

複雑な市民科学タスクはビデオゲームに組み込むことができる
何百万本も売れているフランチャイズの商業用ビデオゲームに科学的課題を組み込むことは、リスクを伴う。ロールプレイングゲームの重要な要素である没入感を壊す可能性があるからだ。特に、『ボーダーランズ3』のようなシューター・ローターのロールプレイングゲームにパズルゲームを組み込む場合、プレイヤーはテンポの速いアクションとユーモアに直面することになります。BLSは、この潜在的な問題に対処するため、ボーダーランズ世界のキャラクターとの対話を統合することで、特別に設計されました。バーチャル・アーケード・ブースは、ゲーム世界内のバーチャルな研究室に設置され、専属の科学者のものとして表示される。ゲームプレイはシューター・ローターゲームと同じテンポになるよう簡略化され、ビジュアルはすべてイン・ユニバースで意味をなすよう特別にデザインされた。

発売から3年後の2023年5月時点で、445万人のプレイヤーがアーケードブースを訪れた。このうち、400万人以上が10分間のチュートリアルと少なくとも1つの実作業を完了した。これは90%のエンゲージメント率に相当し、エンゲージメント率が10%程度であった前シーケンス・アライメントCSGのPhyloを大幅に上回っている。このレベルのプレイヤーの関与は、タスクの超ゲーム化が機能し、商用ゲームへの統合がシームレスであったことを示している。

BLSは高品質のMSAを出力
BLSのアライメント出力の評価は、ベンチマークとなる普遍的なグランドトゥルースがないために複雑です。とはいえ、高品質なアライメントから一般的に期待される品質がいくつかあり、それを調査することができる。実際、相同ゲノム配列の高品質なアライメントは以下の傾向がある:

a.
高い対スコア

b.
RNAファミリーのインデル頻度に適合するギャップ頻度を持つ。

c.
そのファミリーの最新技術に類似した系統樹を推定できる。

d.
宿主の異なる疾患、行動、プロファイルに関連する分類群を適切に分離する。

e.
そのファミリーの構造的特徴に適合していること。

我々は、BLSアライメントがこれらの基準をすべて満たしており、したがって高品質のMSAを構成していると断言する。

表1(上)では、ギャップが大きい列をスコアリングから除外した場合、BLSはすべてのベンチマークと比較してペアスコア合計が向上し、a.を満たしていることを示している。

表1 系統とアライメント情報
フルサイズの表
図2bに、BLSとベンチマークについて、サブアラインメントからサンプリングしたギャップ頻度を示す(Greengenes、Rfam、BLSの配列数の違いを考慮してサブアラインメントをサンプリングしている)。これらのベンチマークには、PASTA27、MUSCLE28、MAFFT29、Greengenes32データベースからのpyNAST30とSSU-ALIGN31アラインメント、構造Rfam33アラインメントが含まれます。すべてのアラインメントは、PASTA、Rfam、pyNASTと同じ桁のギャップ頻度であった。この低いギャップ頻度は、微生物間で数塩基対しか長さが変わらないV4領域の強い構造的性質と一致する。したがって、BLSアライメントは、V4領域に関する我々の最先端の知識に適合するギャップ頻度を示しており、基準bを満たしています。

図2:アライメントの評価。
図2
a, 6つの異なるアライメント方法について、列ごとのギャップ密度を示す。x軸はアライメント位置に対応し、色はこの位置での対数ギャップ頻度に対応する。すべてのアラインメントが同じ長さになるように、ギャップの多い列は除外した。 b, BLSと他の手法で観察されたギャップ頻度。50配列のサブアラインメントをサンプリングして平均したもの。ボックスプロットは分布の概要を示している。ボックス内の上から下への3本の水平線は、それぞれ上位四分位、中位四分位、下位四分位の境界を示している。箱の高さの合計は四分位範囲(IQR)を表す。ひげは、箱の両端からIQRの1.5倍の位置にある。ひげの外側の点は外れ値である。c,参照Greengenesツリーとの複合距離。この複合指標は、Kendall-Colijn距離とTriplet距離のスケール平均として得られた。詳細は補足情報、セクション12a,bおよび13cに記載。GG、Greengenes。

フルサイズ画像
表1と図2の結果は、PASTA、MAFFT、MUSCLE、貪欲アルゴリズムと比較して、BLSによって挿入された追加ギャップが、ツリー構造の改善につながったことを示している。

以下のサブセクションで、基準c、d、eについての検討を示す。

BLSアライメントによるde novo系統樹の改善
微生物ゲノム配列のアラインメントを改善する中心的な目的は、その系統をより良く理解することであった。この目的が達成されたかどうかを評価するために、我々はFastTree34を用いてアラインメントから系統樹を推定し、次にSEPP35を用いてGreengenes 13.5(文献32)の系統樹に我々の配列を配置することによって構築された参照樹との類似性を評価した。Greengenesは以前に断片挿入のベンチマークが行われており、Greengenesを用いたSEPPは、高品質のツリーとアライメントがすでに利用可能な場合、de novo系統推定を上回ることが示されている36。

Kendall-Colijn距離37とTriplet38距離の2つの距離指標について表1に示す系統類似性の結果は、BLS系統樹が標準的なMSAアプローチよりもリファレンスに近いことを示している。この結果は、BLSアライメントが信頼性の高い系統樹を推定するタスクにおいて他の手法よりも優れており、基準cを満たしていることを示している。

BLS系統樹はUniFrac効果量の改善につながる
我々はまた、アラインメントの改善(ひいてはde novo系統樹)によって、異なる行動、プロファイル、病気に関連する分類群の分離が改善されるという仮説を立てた。これを確認するために、シーケンスに使用されたサンプルに関連するAGPメタデータで利用可能な74の非技術的変数について、UniFrac26距離の効果量を測定した。これらの変数は、宿主のライフスタイル、健康状態、食物、または一般的なプロフィールに関連している。

観察された最も強いエフェクトサイズは、歯磨き頻度とClostridium difficile感染歴であった(全リストは図3および補足情報14節)。図3に、BLSとGreengenes + SEPPの平均的なペアワイズ効果量を示す。我々は、腸内微生物の多様性とヒトの健康に関連するいくつかの変数を含む多くの変数において、BLSがSEPPを上回ることを観察した25,39,40,41,42。デルタが大きい上位5つの変数は、それぞれ、歯磨き頻度、糖尿病、植物の種類数、抗生物質歴、アルコール頻度である。

図3:効果量
図3
デルタは、各変数におけるBLSとSEPPの一対の効果量を意味する。透明で示された有意性は、シャッフルされたメタデータに対する両側Mann-Whitney U検定から得られたP値を意味する。詳細は補足情報の14節に記載されている。

フルサイズ画像
我々は、得られた効果量が、無作為にカテゴリーをサンプルに割り当てた場合に観察されうるものとは有意に異なるかどうかを評価することによって、この分析を裏付けた。図3には、我々の結果がランダムな結果と一致するという帰無仮説に関連するP値を注釈した。我々は、高い効果量を持つ変数での有意な結果の充実を観察し、特に、BLSがSEPPより高い有意区分を達成した13の変数を観察した。

ほとんどの変数で観察されたこれらの改善は、以前に報告された系統学の改善がメタアナリシスで知覚できることを確認する。年齢区分などの重要な変数ではSEPPが依然としてBLSを上回るため、SEPPに対する全体的な改善は限定的であるが、BLSはSEPPを上回っており、2つのアプローチは腸内細菌の系統とヒトの健康への影響に関する理解を深める上で補完的な異なる解を導き、基準dを満たしている。

BLSアライメントは16S rRNA構造の支持を向上させる
前述したように、構造は強く構造化されたRNA領域の高品質なMSAの重要な要素である。BLSアライメントには約99%のバクテリア配列が含まれていることから、そのカラムをComparative RNA Web43で定義されている16SバクテリアrRNAの最先端の構造モデルの塩基にマッピングすることが可能である。

このようなマッピングの質を推定するために、構造へマッピングできない非ギャップヌクレオチドの割合を報告する(表1の下を参照)。BLSやPASTAのようなアラインメントはかなり簡単にマッピングされるのに対し、MUSCLEやMAFFTはかなり多くの情報を失うことがわかった。

よくマップされる2つのアラインメントの構造的な質の評価を深めるために、BLSとPASTAのアラインメントの違いがモデルと一致する傾向があるのか、一致しない傾向があるのかを列ごとに調べました。図4では、特にS8やS15結合部位などの重要な機能部位に関連する領域や、30Sアセンブリー中にコンフォメーションの再調整を受ける領域44,45,46,47,48,49において、ヒトプレーヤーによって加えられた変化が16S構造モデルと一致する傾向があることを示している。CRWモデルは長距離塩基対を考慮するため、この一致はBLSアライメントを支持する強い論拠となる。図2aに示すように、最もギャップがあり、手法間で最もばらつきがあるアライメントの領域は、V4ステムの上部であり、この分析ではBLSのマッピングがかなり改善された領域であるため、これは重要である。

図4:16S rRNA構造モデルとの一致。
図4
BLSとPASTAのアラインメントを16S構造モデルにマッピングした結果、BLS、特に重要な機能部位付近で高い保存性が観察された。図は注釈付き16S二次構造で、V4領域とその近傍のみが示されている。着色した塩基は連続したバックボーンを形成している。CRW, Comparative RNA Web。

フルサイズ画像
これは、BLSによって追加されたPASTA足場への修飾が、アラインメントの構造的・機能的シグナルの改善につながり、基準eを満たしていることを示している。

さらに、図2aに、BLSと我々のベンチマークであるPASTA27、MUSCLE28、MAFFT29を含む、異なるアライメント手法の列ごとのギャップ頻度(高ギャップ列を除く)を示します。これらのギャップ頻度は、基準a-eを満たすだけでなく、BLSアラインメントと代替手法の違いを明らかにするのに役立ちます。

考察
2008年にFolditがリリースされて以来、EteRNA10、Project Discovery、EyeWire、Phylo、Sea Hero Questなど、多くのインパクトのあるCSGがリリースされてきました(図5)。

図5:プレイヤーの参加
図5
この図は、プレイヤーのエンゲージメントに関する状況を示している。a, ゲームリリース後、月ごとにプレイヤーから寄せられた解答の数を示しており、最初のラッシュが終わった後も継続的にエンゲージメントが得られたことを示している。b に示した数値の出典については、補足情報のセクション 11 を参照のこと。

フルサイズ画像
今日に至るまで、50 万人のプレイヤーを獲得する CSG は大成功と見なされている。この評価は、科学チームが科学のためのゲームに興味を持ちそうな人々にリーチすることの相対的な難しさを考慮してなされたものである。

ギャラクシーZoo50は、この種の活動で10年後に参加者100万人を突破した最初の取り組みである。シーヒーロー・クエストは、3億人の顧客を持つドイツテレコム社51と協力し、1年足らずでこの偉業を達成した最初の例である。BLSは、非科学的な企業との協力を通じてリーチを向上させるというこのアイデアを基に、ゲーマーがいる場所、つまり有名なビデオゲームの仮想世界の中で直接リーチするという、次の段階に進んだ。

パズル形式のCSGが知名度の高いゲームにシームレスに統合され、プレイヤーを惹きつけることができることを示した今、他のプロジェクトがこの機会を利用し、ミリオンプレイヤーのCSGがもはや例外ではない時代に突入することを期待している。

Phyloは、数パズル以上プレイヤーを維持するのに苦労し、ユーザーが完了したタスクの平均は5.7個、中央値は2個であった。このように、ファイロは熟練プレーヤーに大きく依存している。実際、ファイロでは、エキスパートプレイヤーは、カジュアルプレイヤーが解いたタスクのごく一部をこなす小さなグループであるにもかかわらず、アラインメントによっては、カジュアルゲーマーを最大40%も上回ることができる。一方、BLSのプレイヤーは平均35個のタスクをこなし、中央値は12個である。高いスコアを達成した専門家が科学的貢献の骨格を形成するPhyloとは異なり、BLSはプレイヤー間のコンセンサスに基づいてタスクをフィルタリングし、目標スコアに到達するだけで報酬を提供する。したがって、BLSは同程度には専門家に依存していない。実際、最もアクティブな10%のプレイヤーの貢献をすべて削除しても、同じ量のデータをランダムに削除した場合と比較して、評価指標は14%しか低下しない。

このような専門家への依存度の低さは、専門家に依存した軽いゲーム化 CSG から、誰もが貢献できる新しいカテゴリの CSG へのパラダイムの変化を示している。

CSGの設計には、プレイヤーの関与を最大化することと、ゲームの科学的妥当性を最大化することという2つの中核的な目的がある。残念ながら、この2つの目的はしばしば相反する。最適な科学的関連性を持つゲームは、Stardust@homeの画像注釈のように、ゲーム要素のない純粋なクラウドソーシングの科学的タスクとなる。タスクをゲーミフィケーション化すると、設計上、プレイヤーの解決策を科学的貢献に対応させることが難しくなる。しかし、タスクがゲーム化されればされるほど、実際のゲームのようにプレイでき、プレイヤーのエンゲージメントとリテンションを刺激するほど楽しくなる可能性が高くなる。BLSは非常に高いレベルのプレイヤーの関与を達成したが、1つのタスクの平均的な科学的貢献は、数百のパズルで小さなアライメントを改善するのに十分なファイロよりも低かった。ここでは、数百万のタスクが組み合わされてアライメントが改善される。とはいえ、BLSの超ゲーム化によって、プレイヤーのエンゲージメントとリテンションはファイロよりもはるかに高くなり、このマイナス面は強く緩和された。

CSGの成長の可能性を示すもう一つの側面は、プレイヤーから寄せられたフィードバックだと考えています。品質保証テストのフィードバック、ブログへの投稿、電子メール、ソーシャルメディア(補足情報、11.5節)という形でのゲーマーとの交流を通じて、私たちが受け取った最も一般的な反応は、科学に対する熱意と好奇心でした。このような態度を定量化することは独自の研究であるため、今後の研究に委ねられるが、このプロジェクトでの経験から、プレイヤーの参加は、ゲームファーストのデザインと一般の人々の科学に対する純粋な関心の組み合わせによって推進されたと考えられる。

さらに、上記のトレードオフの最適化だけでなく、科学リテラシーの向上や一般市民と科学的世界とのつながりの増加など、市民科学イニシアティブに参加することの本質的なメリットは、トレードオフの余分なゲーミフィケーション領域の探求をさらに正当化する。

本研究では、初年度のデータを含むBLSの第1フェーズに焦点を当てた。したがって、分析すべきデータは2年分残っている。これらのデータには、配列アライメントCSGの効率化を研究することを目的とした、様々な種類のパズルが含まれています。フェーズ1の後、代替の足場を使ったパズルを作成し始めましたが、ここで紹介する分析はこれらに当てはまらないため、この研究には含まれていません(補足情報、セクション5)。

さらに,ユーザーに送られたパズルの一部には,ガイドのオフセットが含まれていた(補足情報,セクション5.2.6).より刺激的なゲームプレイを提供すると同時に、これらのガイドオフセットにより、ユーザーはより大きなスケールでスキャフォールドのアラインメントの潜在的なエラーを修正することができる。その結果、通常のパズルよりもノイズが多くなる(補足情報、セクション8.5.4)。オフセット・パズルで構築されたBLSアライメントは、年齢カテゴリーなどのいくつかの重要な効果量変数でBLSを上回るため、可能性を示す。とはいえ、これらは異なるタイプの分析を必要とするため、その調査は今後の研究に委ねられる。

将来的な検討事項のもう1つは、ゲームに合成データを統合することである。実際、本研究では、Greengenesの系統樹をグランドトゥルースの代理として利用した。この系統樹はよく理解されており、この分野の最先端ではあるが、完全ではない。今後のこの種のプロジェクトでは、合成データをゲームのデザインに組み込んで、グランド・トゥルースの代理を補完するよう努めるつもりである。とはいえ、合成データは、特に木のさまざまな部分における異種置換モデルや、RNAの二次構造が存在する場合など、真の進化過程とあまり一致しない仮定を埋め込むことが多いことを述べておかなければならない。

最後に、我々は並行して、強化学習エージェントを訓練してプレーヤーの戦略を再現させることで、プレーヤーの参加による影響を拡大する戦略にも取り組んでおり、最近、この問題に関する2つの研究を発表した。最初の研究52では、強化学習エージェントがBLSパズルを解くためのプレイヤーの戦略を学習することが可能であることを立証し、このようなプレイヤーの戦略をゲーム外のデータに伝播する可能性を解き明かした。2つ目の研究53では、Q学習アルゴリズムに人間の解答を注入することで、純粋なAIを上回る性能を発揮することを実証した。本研究で紹介したアグリゲーション技術と組み合わせることで、これらの結果は、16S rRNA配列の大規模アライメントの自動化パイプラインを設計するための有望な手段を示唆している。

結論
本研究では、ゲームに特化したCSGの道を開くことを目的とした配列アライメントゲームBLSを紹介した。このプロジェクトは、同カテゴリーのゲームとしては前例のないプレイヤーのエンゲージメントを達成し、ゲーマーを集めて大規模な集団課題を解決するという目標を達成すると同時に、大規模な科学アウトリーチの取り組みとしても機能した。我々は、これまでの取り組みとは比べものにならないほどゲーム化されているにもかかわらず、プレイヤーの貢献が最先端の配列アライメント手法の明確な改善につながり、ゲームに焦点を当てた新世代のCSGの可能性を解き放ったことを示した。

方法
本稿で取り上げるデータは、AGP25の参加者から提出された便サンプルから塩基配列を決定した953,000個のrRNA断片から得られたもので、Powered by TMI (https://microsetta.ucsd.edu/)によるものである。断片は150ヌクレオチド長で、16S rRNA遺伝子のV4領域に由来する。

953,000個の150ヌクレオチドV4断片は、まずCD-HIT54を用いて10,200クラスターにクラスタリングされた。少数の配列(約5,000)を代表する非常に類似性の低いクラスターは除去され、最終的に9,667のクラスター代表配列が得られ、これは初期データセットの946,740配列に相当する。

これらの9,667配列はPASTA 1.9(文献27)でアラインメントされ、非常にタイトな(183列)初期アラインメントが生成され、CSGパズル作成の足場となった。

ゲームデザイン
BLSミニゲームでは、プレイヤーは4-10個のヌクレオチドからなる7-20個の配列を見る(グリッドの大きさは難易度によって変わる)。各配列はレンガの縦積みとして表示され、各色はランダムな塩基を表す。レンガは折り畳まれ(隙間はすべて取り除かれる)、プレイヤーはガイドに正しく整列したレンガの数によって決まるスコアを向上させるために、有限の数の隙間を挿入するよう求められる。左側にあるこれらのターゲットは、対応するアライメントの列で最も一般的なヌクレオチドを表示します。ギャップ・トークンを挿入することで、プレイヤーは生まれつきのパターンマッチングのコツを使い、スキャフォールド・アライメントの領域を再整列させることになる。トークンの数には限りがあり、素朴で貪欲なAIプレイヤーは、いかに簡単にアライメントを改善できるかに基づいて設定するため、プレイヤーは厳しい選択を迫られる。この貪欲なプレイヤーはまた、プレイヤーが次のパズルに進むために打ち勝たなければならないパースコアも設定し、最小限の努力を強いる。ゲームデザインに関する詳細は補足情報(セクション6)を参照されたい。

パズルの構築
パズルは定期的に追加された.本稿で紹介する結果は、2020年4月から2021年7月までにプレイヤーに提出された最初の140万パズル(合計約7500万のプレイヤータスク)の解答を使用している。解答が十分に広く分布するように,各パズルは3つの異なるバージョンでリリースされ,それぞれ利用可能なギャップ・トークンの数がわずかに異なる.各バージョンは約15人、1パズルあたり合計45人のプレーヤーがプレイできることを目指した。

各アラインメント領域(可変長のアラインメント列のシーケンス)に対して、シーケンスがPASTAアラインメントからサンプリングされる。縦方向の偏りを補正するため、パズルは左から右、右から左の両方から作られる。さらに、各パズルの各配列は、小さな確率(~0.15)で短くなったり長くなったりして、異なる長さのパズル配列が表示され、プレイヤーは削除をシミュレートすることができる。

最後に,ガイドとパズル配列の間にオフセットが導入されることがある.オフセットが1であれば、10-14列のシークエンスを使ったパズルでは、9-13列のガイドが表示され、ユーザーのアクションスペースを広げることができます。このようなパズルのバリエーションを通して、プレイヤーはPASTAアルゴリズムが行ったアライメントの決定を再評価する機会を与えられる。

パズルと解のフィルタリング
パズルは、開始時の重力効果によってすでに局所最適が得られているため、レンガを動かす動機付けがほとんどない場合は破棄される。このため、いくつかのアライメント領域は、より高い受理率によってパズルに過剰に含まれることになり、これらの領域はパズルによって改善の余地があると解釈した。

各パズルについて,20-60(目的,45;実際の平均,43.4)のユーザー解が,そのパズルに提出されたすべての解のギャップ位置の分布との類似性によってフィルタリングされた.プレーヤーの解は、2つの基準でフィルタリングされた: (1)解が最適性からどれだけ離れているか,(2)解がプレイヤーのコンセンサスからどれだけ離れているか.(1)の最適性からの距離は,そのパズルで同じ数のギャップを使い,最もスコアが高かった解とのスコア差として定義された.(2)のプレイヤー・コンセンサスは、解の分布の重心として定義された。この結合目的から遠すぎる解は除外され,除外しきい値は,質の高いプレイヤーの解のアンサンブルを最も代表するサブセットを維持するために,解の約3分の2を除外するように設定された.この閾値は、棄却された解の目視調査に基づいて実験的に選択した。明らかな外れ値が含まれず、除外された解がすべて明らかな外れ値である閾値を選択した。

アライメントの改善
パズル解答は位置配列アノテーションに変換され、カバレッジのばらつきを考慮して正規化され、アノテーションされていない位置はPASTAおよび/またはRfamバージョン14(参考文献33)のアラインメント情報で埋められる。

私たちは、1人のプレイヤーが解いた1つのパズルからの高品質なアノテーションを1票と見なします。私たちのアルゴリズムは、Needleman-Wunsch55と投票システムの間の妥協によって動的計画法を活用し、投票配列に配列をアライメントする。

検証
BLSが生成するアラインメントは、MUSCLEバージョン5.1(参考文献28)やMAFFTバージョン7.490(参考文献29)のような最先端のソフトウェアが生成するアラインメントとは大きく異なるため、アラインメントとして公平に比較することは困難である。したがって、我々の手法の検証プロセスは、アラインメントから推定された系統樹をFastTree 2.1(参考文献34)と比較することが中心となっている。

スモールアラインメントベンチマーク
パズルの足場として計算したPASTAアライメントとともに、同じ9,667配列に対してMAFFTとMUSCLEを標準と最も遅い設定の両方で実行した。その後、FastTreeの標準設定ですべての系統樹を作成しました。これらの木を、古細菌をアウトグループとして、Greengenes 13.8(文献32)に対してQIIMEバージョン2のq2-feature-classifier56でナイーブベイズ分類した配列を用いて再ルートした。

SEPPとの比較
アラインメントから系統樹を構築する最先端の方法は、腸内細菌叢データにおいて、SEPP35,36を用いて既存の樹に配列を配置することにより、十分なデータが利用可能な場合には、アラインメントからのde novo系統樹推定を上回ることが示されている36。参照系統を構築するために、9,667の配列クラスター代表をSEPPでGreengenes 13.5の系統樹に配置し、その後、他のすべての先端を削除し、古細菌に再ルートした。この木をGreengenes-SEPP参照木と呼ぶ。

このGreengenes-SEPP参照木に対してde novoアライメント法を比較するために、de novo木と参照木のランダムにサンプリングした部分木間の距離を、2つの距離メトリックスを用いて計算した:

Kendall-Colijnメトリック37は、各先端のペアの最も最近の共通祖先の配置を比較するもので、特に進化パターンの類似性を評価するために設計され、ロビンソン-フールズ距離が十分に敏感でない状況用に特別に設計されている。

Triplet距離38は、2つの系統樹の構造的な非類似性を測定する指標で、片方の系統樹ではなく、両方の系統樹に出現するちょうど3つの葉を持つ根付き木の数をカウントする。

大きな木を比較する場合、これらの距離は非常に計算コストがかかるため、Kendall-Colijnでは400ノード、Tripletでは100ノードをサンプリングする。このプロセスをそれぞれ100回と5回繰り返す。これらの評価は、R treeDist57ライブラリ、バージョン2.7.0を用いて行った。木はPython 3.8とscikit-bio version 0.5でリサイズとシアリングを行った。

メタアナリシスへの応用
腸内細菌叢を含むメタアナリシスへのBLSアラインメントの影響を評価するために、アラインメント結果をクラスター代表から他の配列に伝播させ、946,740配列のアラインメントを構築し、FastTreeを用いて系統樹を推定した。エフェクトサイズを評価するために、AGPデータを表すフィーチャーテーブルをredbiom version 0.3.5(文献58)から取得し、ブルームフィルターをかけ、サンプルあたり1,000配列に希釈し、各ツリー(例えば、BLSツリー、de novoツリー、SEPPフラグメント挿入ツリー)について重み付けなしのUniFrac26距離を計算した。そして、Evidentバージョン0.4.0(文献59)を用いて、各樹木のCohenのd分布を用いた距離行列から、一対の効果量を計算した。74の非技術的変数の一対効果量を調査した(QIIME 2で利用可能なすべての変数が、50サンプルを含む最低2つのカテゴリを満たす)。メタデータをシャッフルしてこれらの実験を再現し、有意性を評価した。また、2つの技術的変数(サンプルプレートとリキッドハンドリングロボット)を調査したが、有意な変化は観察されなかった。

プレーヤーの解の集約とアライメントの作成は、効果量に関する性能のために最適化されたものではないことに注意すべきである。この選択は、これらのデータのサイズが比較的小さいため、表現型に最適化するトレーニングによるオーバーフィッティングを避けることを目的としている。さらに、以前の研究で、木の品質と観察された表現型(効果量)の間に関係があることが立証されている36。従って、アライメントは木の評価基準で最適化され、効果量は独立した評価として維持された。以前の研究から予想されたように、最良のツリーメトリクスを持つBLSアラインメント(表1に記載)は、最良のエフェクトサイズも持っていた。

倫理声明
プロジェクトへの参加は、ボーダーランズ3ゲームを通じて、完全にバーチャルで行われた。参加は完全に任意であった。参加者の募集は行わず、参加希望者には、ゲームプレイ前に流されるプレゼンテーションビデオを通じて、データがどのように使用されるのか、なぜ使用されるのかを説明した。収集されたのはゲームプレイデータのみである。参加者の識別情報や個人情報は収集されず、参加者は研究チームに対して完全に匿名とされた。

報告概要
研究デザインに関する詳細は、本記事にリンクされているNature Portfolio Reporting Summaryを参照されたい。

データの入手可能性
本論文で取り上げたデータはすべて、https://games.cs.mcgill.ca/bls/、科学者や個人が一般に入手可能である。データはミラーサイト(https://gitlab.com/borderlands-science/BLS1)とhttps://doi.org/10.6084/m9.figshare.24962349(参考文献60)でも公開されている。これらのデータには、プレイヤーが解いたすべてのパズル、プレイヤーが提出したすべての解答、パズルを解くために手を動かした順番などの関連データが含まれる。これらのデータはビデオゲームを通じて収集されたため、個人情報を共有するインフォームド・コンセントを得ることができなかったため、プレイヤーは固有の英数字の文字列で識別されている。

コードの利用可能性
本稿で紹介するデータの生成、データの処理、結果の計算に使用したコードはすべて、プロジェクトのウェブサイトhttps://games.cs.mcgill.ca/bls/、GitLabリポジトリとして自由に利用できる。また、このコードは https://gitlab.com/borderlands-science/BLS1 (ref. 61) と https://doi.org/10.6084/m9.figshare.24962349 (ref. 60) のミラーサイトでも公開されている。

参考文献
Newzoo Global Games Market Report 2022 (newzoo, 2022); https://newzoo.com/resources/trend-reports/newzoo-global-games-market-report-2022-free-version

ビデオゲーム産業に関する重要な事実。Entertainment Software Association https://www.theesa.com/resource/2022-essential-facts-about-the-video-game-industry/ (2022).

Nebel, S., Schneider, S. & Rey, G. D. Mining learning and crafting scientific experiments: a literature review on the use of Minecraft in education and research. J. Educ. Technol. Soc. 19, 355-366 (2016).

Google Scholar

Santos, D., Zagalo, N. & Morais, C. プレイヤーのビデオゲーム『No Man's Sky』における化学の知覚。Simul. Gaming 54, 375-394 (2023).

グーグル・スカラー

The use of serious games in science education: a review of selected empirical research from 2002 to 2013. J. Comput. Educ. 2, 353-375 (2015).

論文

Google Scholar

Muehrer, R. et al. Challenges and opportunities: Using a science-based video game in secondary school settings. Cult. Cult. Sci. Educ. 7, 783-805 (2012).

論文

Google Scholar

Stegman、M. Immune Attackのプレイヤーは、対照的なビデオゲームをプレイするクラスメートよりも、細胞免疫学のテストや自信のテストで良い成績を収めている。Faraday Discuss. 169, 403-423 (2014).

論文

論文

PubMed

パブメドセントラル

Google Scholar

多人数参加型オンラインゲームによるタンパク質構造の予測。Nature 466, 756-760 (2010).

論文

論文

パブコメ

パブメドセントラル

Google Scholar

Phylo:複数配列アライメントを改善するための市民科学的アプローチ。PLoS ONE 7, e31362 (2012).

論文

論文

パブコメ

パブメドセントラル

Google Scholar

Lee, J. et al.大規模なオープンラボから得られたRNA設計ルール。Proc. Natl Acad. USA 111, 2122-2127 (2014).

論文

PubMed

パブメッドセントラル

Google Scholar

Kim, J. S. et al. 網膜の方向選択性を支える時空間配線の特異性。Nature 509, 331-336 (2014).

論文

論文

PubMed

パブメドセントラル

Google Scholar

Jensen, J. H. M. et al. Crowdsourcing human common sense for quantum control. Phys. Rev. Res. 3, 013057 (2021).

Wootton, J. R. Quantum Error Correctionに一般市民を参加させる。Preprint at https://arxiv.org/abs/1712.09649 (2017).

Kreitmair, K. V. & Magnus, D. C. Citizen Science and gamification. Hastings Cent. Rep. 49, 40-46 (2019).

論文

PubMed

グーグル・スカラー

Miller, J. A. et al. 市民科学ゲーム体験の調査。Citiz. Sci. 7, 34 (2022).

Google Scholar

Miller, J. A. et al. Expertise and engagement: re-designing citizen science games with players' mind in mind. In Proc. 14th International Conference on the Foundations of Digital Games https://doi.org/10.1145/3337722.3337735 (Association for Computing Machinery, 2019).

Miller, J. A. & Cooper, S. Barriers to expertise in citizen science games. In Proc. CHI Conference on Human Factors in Computing Systems https://doi.org/10.1145/3491102.3517541 (Association for Computing Machinery, 2022).

Franzoni, C., Poetz, M. & Sauermann, H. Crowds, citizens, and science: a multi-dimensional framework and agenda for future research. Ind. Innov. 29, 251-284 (2022).

Allf,B.C.ら:関与の生態系としての市民科学:学習と参加拡大の意味合い。バイオサイエンス 72, 651-663 (2022).

論文

パブコメ

パブメドセントラル

Google Scholar

Szantner, A. in Levelling Up: The Cultural Impact of Contemporary Videogames (eds Kuhn, B. & Bhéreur-Lagounaris, A.) 103-110 (Brill, 2016).

Sullivan, D. P. et al. Deep learning is combined with massive-scale citizen science to improve large-scale image classification. Nat. Biotechnol. 36, 820-828 (2018).

論文

CAS

PubMed

Google Scholar

Singh, A. et al. Lessons from an online massive genomics computer game. In Proc. AAAI Conference on Human Computation and Crowdsourcing https://doi.org/10.1609/hcomp.v5i1.13309 (PKP, 2017).

Kwak, D. et al. Open-Phylo: a customizable crowd-computing platform for multiple sequence alignment. Genome Biol. 14, R116 (2013).

論文

論文

パブメドセントラル

グーグル

Waldispühl, J. et al. 市民科学をレベルアップする。Nat. Biotechnol. 38, 1124-1126 (2020).

論文

PubMed

Google Scholar

McDonald, D. et al. American Gut: an open platform for citizen science microbiome research. mSystems 3, e00031-18 (2018).

論文

CAS

PubMed

パブメドセントラル

Google Scholar

Lozupone, C. & Knight, R. UniFrac: 微生物群集を比較するための新しい系統発生学的手法。Appl. Microbiol. 71, 8228-8235 (2005).

論文

論文

PubMed

パブメドセントラル

Google Scholar

PASTA:塩基配列およびアミノ酸配列の超大規模多重配列アライメント。J. Comput. Biol. 22, 377-386 (2015).

論文

論文

PubMed

パブメドセントラル

Google Scholar

Edgar、R. C. MUSCLE: 高精度・高スループットの多重配列アライメント。Nucleic Acids Res. 32, 1792-1797 (2004).

論文

論文

パブコメ

パブメドセントラル

Google Scholar

MAFFTマルチプル配列アライメントソフトウェア第7版:性能と使いやすさの向上。Mol. Biol. Evol. 30, 772-780 (2013).

論文

論文

PubMed

パブメッドセントラル

Google Scholar

PyNAST: 配列をテンプレートにアラインメントするための柔軟なツール。Bioinformatics 26, 266-267 (2010).

論文

論文

PubMed

Google Scholar

RNAのアラインメントを推定するInfernal 1.0。Bioinformatics 25,1335-1337 (2009).

DeSantis、T. Z. et al. Greengenes、ARBと互換性のあるキメラチェック済み16S rRNA遺伝子データベースおよびワークベンチ。Appl. Environ. Microbiol. 72, 5069-5072 (2006).

論文

論文

PubMed

パブメドセントラル

Google Scholar

Kalvari, I. et al. Rfam 14: メタゲノム、ウイルス、マイクロRNAファミリーのカバー範囲拡大。Nucleic Acids Res. 49, D192-D200 (2021).

論文

論文

PubMed

Google Scholar

遺伝子発現を解析した結果が掲載されている。PLoS ONE 5, e9490 (2010).

論文

論文

パブメドセントラル

Google Scholar

SEPP:SATéを利用した系統配置。日本学術振興会特別研究員。Symp. Biocomput. 247-258 (2012).

Janssen, S. et al. 正確なアンプリコン配列の系統的配置は、臨床情報との関連を改善する。

論文

論文

PubMed

PubMedセントラル

Google Scholar

系統樹をマッピングして進化のパターンを明らかにする。Mol. Biol. Evol. 33, 2735-2743 (2016).

論文

CAS

PubMed

パブメドセントラル

Google Scholar

系統樹の「投げ縄」I:基本的性質、シェリング、カバー。J. Math. 生物 65, 77-105 (2012).

論文

PubMed

Google Scholar

炎症性腸疾患における口腔衛生の役割。Dig. Dis. Sci. 56, 170-175 (2011).

論文

PubMed

グーグル奨学生

糖尿病と腸内細菌叢。Semin. Nephrol. 41, 104-113 (2021).

論文

CAS

パブコメ

Google Scholar

Capurso, G. & Lahner, E. 喫煙、アルコール、腸内マイクロバイオームの相互作用。ベストプラクティス。Res. Clin. Gastroenterol. 31, 579-588 (2017).

論文

CAS

PubMed

Google Scholar

Mutlu, E. A. et al. アルコール依存症では大腸マイクロバイオームが変化する。Am. J. Physiol. Gastrointest. 302, G966-G978 (2012).

論文

CAS

PubMed

パブメドセントラル

Google Scholar

リボソームRNA比較構造モデルの精度。Curr. Opin. Struct. Biol. 12, 301-310 (2002).

論文

CAS

パブコメ

Google Scholar

大腸菌リボソームタンパク質S8のrRNA結合部位に変異を持つ機能的リボソームのin vivo選択:進化的意味合い。Proc. Natl Acad. USA 97, 605-610 (2000).

論文

論文

PubMed

パブメドセントラル

Google Scholar

16SリボソームRNAの中心ドメインの折り畳みにおける形状の変化と協同性。Proc. Natl Acad. Sci. USA 118, e2020837118 (2021).

16SリボソームRNAの中心ドメインとリボソームタンパク質S15との結合相互作用を分子動力学シミュレーションにより決定した。Nucleic Acids Res. 31, 629-638 (2003).

論文

生物学

PubMed

PubMedセントラル

Google Scholar

S15-rRNA複合体の結晶構造。Nat. Struct. 7, 273-277 (2000).

論文

論文

パブコメ

Google Scholar

Serganov, A. A. et al. 高度好熱菌リボソームタンパク質S15の16S rRNA結合部位:大腸菌S15との比較、最小部位と構造. RNA 2, 1124-1138 (1996).

CAS

PubMed

PubMed Central

Google Scholar

楊 秉, 王 毅, 銭 淇. 系統解析における16S rRNA遺伝子の超可変領域の感度と相関。BMC Bioinformatics 17, 135 (2016).

論文

PubMed

パブメドセントラル

Google Scholar

マスターズ、K. L. 銀河動物園の12年。Proc. IAU 14, 205-212 (2019).

Spiers, H. J., Coutrot, A. & Hornberger, M. Explaining world-wide variation in navigation ability from millions people: Citizen Science project Sea Hero Quest. Top. Cogn. Sci. 15, 120-138 (2023).

論文

PubMed

グーグル

Mutalova, R. et al. システムを遊ぶ:パズルプレイヤーは難しい問題の解き方を教えてくれるのか?In Proc. 2023 CHI Conference on Human Factors in Computing Systems https://doi.org/10.1145/3544548.3581375 (Association for Computing Machinery, 2023).

このような問題に対して、プレイヤーはどのような解き方を教えてくれるのだろうか?In Proc. ACM Collective Intelligence Conference https://doi.org/10.1145/3582269.3615597 (Association for Computing Machinery, 2023).

CD-HIT:次世代シーケンシングデータのクラスタリングを加速する。Bioinformatics 28, 3150-3152 (2012).

論文

論文

PubMed

PubMedセントラル

Google Scholar

2つのタンパク質のアミノ酸配列の類似性の検索に適用できる一般的な方法。J. Mol. Biol. 48, 443-453 (1970).

論文

論文

PubMed

Google Scholar

Estaki, M. et al. QIIME 2は、多様なマイクロバイオームデータの包括的なエンドツーエンド解析と、一般公開データとの比較研究を可能にする。Curr. Protoc. Bioinformatics 70, e100 (2020).

論文

PubMed

パブメドセントラル

Google Scholar

系統樹空間のロバスト解析。日本学術振興会特別研究員。生物71, 1255-1270 (2022).

論文

PubMed

Google Scholar

McDonald, D. et al. redbiom: a rapid sample discovery and feature characterization system. mSystems 4, e00215-e00219 (2019).

論文

PubMed

PubMed Central

Google Scholar

Rahman, G. et al.大規模マイクロバイオームデータベースを用いたマイクロバイオーム研究の検出力解析のための効果量の決定。Genes 14, 1239 (2023).

Sarrazin-Gendron, R. & Waldispühl, J. Borderlands science Git repository. figshare https://doi.org/10.6084/m9.figshare.24962349 (2024).

(1)研究者、(2)研究者、(3)研究者、(4)研究者、(5)研究者、(6)研究者。GitHub https://gitlab.com/borderlands-science/BLS1 (2024)。

参考文献のダウンロード

謝辞
Borderlands Scienceの制作に直接的・間接的に貢献したGearbox Entertainment社の全メンバーと、残念ながら個別に謝辞を述べることはできないが、このプロジェクトがなければ実現しなかった数百万人のBorderlands Scienceプレイヤーに感謝する。また、Massively Multiplayer Online Science (MMOS)の元主要協力者であり、MMOSの初期開発に貢献したZ. Bányaiにも感謝する。私たちは、Borderlands Scienceの全プレイヤーが本書に不可欠な貢献者であると考えているが、個別に名前を挙げることはできないため、著者リストではグループとして記載している。この研究は、J.W.、A.Sz.、M.B.、S.C.に対するGenome CanadaとGénome Québecの助成金(Genomic Application Partnership Program)の支援を受けている。R.K.は、National Institute of HealthのDirector's Pioneer Award(DP1AT010885)の一部支援を受けている。

著者情報
著者および所属
マギル大学コンピューターサイエンス学部(カナダ、モントリオール

Roman Sarrazin-Gendron、Parham Ghasemloo Gheidari、Alexander Butyaev、Timothy Keding、Eddie Cai、Jiayue Zheng、Renata Mutalova、Julien Mounthanyvong、Yuxue Zhu、Elena Nazarova、Chrisostomos Drogaris、Mathieu Blanchette、Attila Szantner、Jérôme Waldispühl

多人数同時参加型オンライン科学、グリヨン、スイス

Kornél Erhart & Attila Szantner

Gearbox Studio Québec(カナダ、QC州ケベック

David Bélanger、Michael Bouffard、Mathieu Falaise、Vincent Fiset、Steven Hebert、Jonathan Huot、Jonathan Moreau-Genest、Ludger Saintélien、Amélie Brouillette、Gabriel Richard、Sébastien Caisse

ギアボックス・エンターテインメント(米テキサス州フリスコ

ジョシュア・デヴィッドソン、ダン・ヒューイット、スン・キム、デヴィッド・ナジャブ、スティーブ・プリンス、ランディ・ピッチフォード

カリフォルニア大学サンディエゴ校小児科(米国カリフォルニア州ラホヤ

ダニエル・マクドナルド&ロブ・ナイト

米国カリフォルニア大学サンディエゴ校ラホヤ校コンピューターサイエンス科

ロブ・ナイト

米国カリフォルニア大学サンディエゴ校バイオエンジニアリング学科(カリフォルニア州ラホヤ

ロブ・ナイト

カリフォルニア大学サンディエゴ校マイクロバイオームイノベーションセンター(米国カリフォルニア州ラホヤ

ロブ・ナイト

コンソーシアム
ボーダーランズ科学開発チーム
David Bélanger、Michael Bouffard、Joshua Davidson、Mathieu Falaise、Vincent Fiset、Steven Hebert、Dan Hewitt、Jonathan Huot、Seung Kim、Jonathan Moreau-Genest、David Najjab、Steve Prince & Ludger Saintélien
ボーダーランズ・サイエンス選手
貢献
R.S.-G.はゲームのデザインに貢献し、ゲーム内で使用されるパズルをデザインし、パズル生成パイプライン、解答処理および解析パイプライン、解答フィルタリングおよびアライメント改善パイプラインの初期バージョンに関連するコードのアルファ版をデザインおよび執筆しました。R.S.-G.はまた、検証プロセスを設計・実装し、結果の大部分を計算し、図の大部分を執筆し、論文の大部分を執筆した。P.G.G.は、アライメント改善パイプラインの最終バージョンの大部分を設計・実装した。A.B.はデータベースシステムの多くを設計・実装し、データとハードウェアシステムを管理し、データリリースの準備をした。T.K.はパズル生成とアライメント改善パイプラインに貢献し、プロジェクトのコードベースの多くの実装を改善した。E.C.は、解のフィルタリングパイプラインの最終バージョンの多くを設計し、実装した。J.Z.、R.M.、J.M.、Y.Z.、E.N.、C.D.は、特定のスクリプトや図の設計および/または実装に貢献した科学チームの他のメンバーです。このグループは、マギル大学コンピューターサイエンス学部のJ.W.とM.B.の監督のもとで研究を行った。M.B.は結果の分析に貢献し、論文のレビューを行った。J.W.はゲームと方法の設計、結果の分析、原稿執筆、資金獲得に貢献した。Borderlands ScienceミニゲームはGearbox Entertainment Borderlands Science開発チームによって開発された。ゲームデザインはG.R.の監督の下、チームとして行われた。Borderlands Scienceの全体的な開発とBorderlands 3への統合は、S.C.とR.P.のリーダーシップの下、A.B.がコーディネートした。データ収集とシーケンシングは、D.M.とR.K.が率いるThe Microsetta Initiativeが行った。彼らはデータ、系統、効果量の計算と検証に関連する側面でプロジェクトの科学的側面に貢献し、論文のレビューを行った。A.Sz.はボーダーランズ・サイエンスのコンセプトの最初のアイデアを提示し、論文執筆に貢献した。A.Sz.とK.E.は、科学チームとゲーム開発チームをつなぐ技術的枠組みを設計、開発、維持した。

筆者
Jérôme Waldispühlまで。

倫理宣言
利益相反
J.W.は、Gearbox Studio Québec, Inc.とMassively Multiplayer Online Science (MMOS Sàrl)の共同出資によるGenome Canada助成金(Genomic Applications Partnership Program)の支援を受けている。J.W.は武田薬品工業の科学コンサルタントを務め、収入を得ている。本契約は、マギル大学の利益相反ポリシーに基づき審査・承認されている。A.Sz.は、スイスのイノベーター企業であるMMOSのCEO兼創設者であり、市民科学とビデオゲームとの最初の大規模なコラボレーションを発表し、これら2つの主体をつなぐ基礎的な技術サービスを提供している。MMOSはGearbox Studio Québec, Inc.から運営費を受け取っている。S.C.は、ゲーム「ボーダーランズ3」と市民科学ゲーム「ボーダーランズ・サイエンス」を開発するGearbox Studio Québec, Inc.の共同スタジオ責任者。R.P.は、ゲーム『ボーダーランズ3』と市民科学ゲーム『ボーダーランズ・サイエンス』を開発するGearbox Entertainment Company, Inc.の社長。ボーダーランズ・サイエンスはボーダーランズ3ゲーム内で利用可能な無料ミニゲームだが、ボーダーランズ3はプレミアムゲームとして販売されている。R.K.はBiomeSense, Inc.の科学顧問委員会メンバーおよびコンサルタントであり、株式を保有し、収入を得ている。GenCirq社の科学顧問委員であり、株式を持っている。DayTwo社のコンサルタント兼科学顧問委員であり、収入を得ている。Cybele社に資本参加し、コンサルタントを務める。Biota社の共同設立者であり、持分を保有。Micronoma社の共同設立者であり、持分を有し、科学諮問委員会メンバー。D.M.はBiomeSense, Inc.のコンサルタントであり、持分を保有している。これらの取り決めの条件は、カリフォルニア大学サンディエゴ校の利益相反ポリシーに従って検討され、承認されている。

査読
査読情報
Nature Biotechnology誌は、本研究の査読に貢献したPaul Gardner、Firas Khatibおよびその他の匿名の査読者に感謝する。

その他の情報
出版社注:Springer Natureは、出版された地図の管轄権の主張および所属機関に関して中立を保っています。

補足情報
補足方法、結果、考察。
報告概要
権利と許可
オープンアクセス 本論文は、クリエイティブ・コモンズ表示4.0国際ライセンスの下でライセンスされており、原著者および出典に適切なクレジットを与え、クリエイティブ・コモンズ・ライセンスへのリンクを提供し、変更が加えられた場合にはその旨を示す限り、いかなる媒体または形式においても、使用、共有、翻案、配布、複製を許可する。この記事に掲載されている画像やその他の第三者の素材は、その素材へのクレジット表記に別段の記載がない限り、記事のクリエイティブ・コモンズ・ライセンスに含まれています。この記事のクリエイティブ・コモンズ・ライセンスに含まれていない素材で、あなたの意図する利用が法的規制によって許可されていない場合、あるいは許可された利用を超える場合は、著作権者から直接許可を得る必要があります。このライセンスのコピーを見るには、http://creativecommons.org/licenses/by/4.0/。

転載と許可

この記事について
アップデートを確認する。CrossMarkで通貨と真正性を確認する
この記事の引用
Sarrazin-Gendron,R.、Ghasemloo Gheidari,P.、Butyaev,A.ら、大衆向けビデオゲーム内の市民科学による微生物系統学の改善。Nat Biotechnol (2024). https://doi.org/10.1038/s41587-024-02175-6

引用文献のダウンロード

受領
2023年8月21日

受理
2024年02月05日

掲載
2024年4月15日

DOI
https://doi.org/10.1038/s41587-024-02175-6

この記事を共有する
以下のリンクを共有すると、誰でもこのコンテンツを読むことができます:

共有可能なリンクを取得
コンテンツ共有イニシアチブSpringer Nature SharedItにより提供されています。

対象分野
計算生物学とバイオインフォマティクス
微生物学
ネイチャーバイオテクノロジー (Nat Biotechnol) ISSN 1546-1696 (オンライン) ISSN 1087-0156 (印刷)

サイトマップ
ネイチャー・ポートフォリオについて
ネイチャーについて
プレスリリース
プレスオフィス
お問い合わせ
コンテンツを見る
ジャーナルA-Z
テーマ別記事
プロトコル
ネイチャー・インデックス
出版ポリシー
Natureポートフォリオポリシー
オープンアクセス
著者・研究者サービス
別刷りと許可
研究データ
言語編集
科学編集
ネイチャー・マスタークラス
研究ソリューション
図書館・機関
図書館員サービス&ツール
図書館員ポータル
オープンリサーチ
図書館への推薦
広告とパートナーシップ
広告
パートナーシップとサービス
メディアキット
ブランドコンテンツ
プロフェッショナル育成
ネイチャー・キャリア
ネイチャーコンファレンス
地域ウェブサイト
ネイチャー・アフリカ
ネイチャー・チャイナ
ネイチャー インド
ネイチャー・イタリア
日本のネイチャー
ネイチャー 中東
プライバシーポリシー クッキーの使用 お客様のプライバシーの選択/クッキーの管理 法的通知 アクセシビリティに関する声明 利用規約 お客様の米国におけるプライバシー権
シュプリンガー・ネイチャー
© 2024 シュプリンガー・ネイチャー

閉じる
その日最も重要な科学記事を無料でお届けします。
Nature Briefingに登録する: 微生物学

この記事が気に入ったらサポートをしてみませんか?