見出し画像

【Power Query】著作権登録情報でBTS曲データベース作成

【追記:2024/5/5】ホビの『i wonder…』追加により、楽曲数を修正


楽に楽曲データを調べたい!

前回、ボーカルライン4人分の著作権者登録楽曲を調べてみました。
次はお誕生日に合わせて、SUGAの登録データを取りたいなと思ったんですけど、ラップライン3人てめちゃめちゃ登録数多いんですよね……。しかも重複してるし💦

JIN(10005243) 15
SUGA(10005239) 169
J-HOPE(10003800) 143
RM(10003681) 218
JIMIN(10005241) 17
V(10005240) 19
JUNG KOOK(10005242) 22

BTS曲データ:韓国音楽著作権協会」での調査結果(2024/5/5時点)

どうやってまとめるのが早いかと考えた結果、著作権登録されている楽曲を、自分用にデータベース化することにしました。
楽をするための苦労を厭わないタイプのオタクです。

ちょうどいい楽曲一覧を見つけられなくて、手元に欲しかったんですよね。まだ出会えていないだけでどこかにあると信じてるんですが。
どこかにARMY専用スプレッドシート部屋とかないのかな………。

どこにニーズがあるのか全くわからない記事ですが、備忘録代わりに書いておきますね。
何ができるのかだけ知りたい方は、画像だけ拾い見でどうぞ。

データベース作成手順

データを取る

韓国音楽著作権協会のデータベースは自動化ツール使用禁止とのことなので、原始的に手動でいきます。
メンバーの登録番号で検索して、出た結果をメモ帳にペタペタ。
単純作業なので、その間バンタンのかわいい動画を流しっぱなしにして、再生リストを増やすのも忘れずに。

著作権者名に登録番号を入れて検索
検索結果を丸ごとメモ帳にコピーして、データベースの元を作成

今後もここの検索にはお世話になりそうなので、登録番号は辞書登録しました。

登録単語が順調に増加中

ExcelのPower Queryで加工する①

家のPCで作業するので、ツールは簡単なやつでいきましょう。ExcelのPower Queryで、データの抽出と整形だ!
あっ、「BTSで学ぶPower Query」みたいな流れではないです。3分間クッキングに近いと思っていただければ。

データ作成時に使うキー列は、楽曲とメンバーの登録番号です。
名称系は表記揺れが避けられないので、データはID管理が基本。
[大衆]で始まる行に、「タイトル」「登録番号」が含まれていますので、まずは「条件列」の追加で、これを抜き出しましょう。

「条件列」でタイトル行を抽出→「フィル」→「列の分割」「抽出」→キー情報ゲット

[大衆] SNOOZE(FEAT.RYUICHI SAKAMOTO,GIM U SEONG OF THE ROSE) - 100004972898
[大衆] PROMETHEUS(THWI GYEO)(FEAT.DOK2,JUVIE TRAIN,DOUBLE K,RAP MONSTER OF BANG THAN SO NYEON DAN ,TOPBOB,DON MILLS) - 100001082319

この2行だけ上手く取得できなかったので(多分長すぎ)、手動補正

後の手順は、クエリを使える人ならあまり悩まないと思われます。

データを切り分けて、整頓して、マージしたデータがこちら(はしょりすぎ)

とりあえず曲別のリストが完成。
「公表日・登録番号(楽曲)・タイトル・サブタイトル・アルバム名・参加人数」が入ってます。
アーティスト・歌い出し歌詞も取れたので、コラボ情報が欲しい時や、何の曲かわからなくなった時の検索用に、置いておきましょう。

ここまではわりと簡単。

データを修正する

韓国音楽著作権協会のデータベースとはいえ、人間が入力していますので、たまに何それって思うようなのもあります。JASRACでも似たようなゴホゴホ
というわけで、コーヒーブレイクついでに表記揺れを手修正。

「JEONG GUG」これはナムさんとグクが参加した曲のはず……。ゲルググか!
「防 弹 SO NYEON 団」さすがにこの表記は初めて見ましたw

この作業は今後も発生するので、「著作権者名」「アーティスト名」をチェックするためのリストや、置換用のテーブルも作成しておきます。
長期戦の構えは万全。

データ整理楽しい。かっこよく言うと「データクレンジング」。

ExcelのPower Queryで加工する②

次は、もっと詳しい楽曲参加状況を取りましょう。
誰が何の役割でこの楽曲の作成に参加したか、というやつです。
「管理」で終わっている行から、A・C・CA・ARで始まるものを取ればわかります。

A : AUTHOR 作詞
C : COMPOSER 作曲
CA COMPOSER & AUTHOR 作詞、作曲
AR : ARRANGER 編曲
E: PUBLISHER 出版社
SE: SUB-PUBLISHER サブ出版社
T: TRANSLATION 翻訳家

韓国ヨギ イッソヨさんの「K-pop:韓国著作権サイトで作詞・作曲家の検索方法」より

ここまでの段階で最低限のデータはもうできているため、単純に集計するだけならこれで充分です。

各メンバーの役割分類別登録状況。全員、作詞作曲の両方に関与しているのがすごい。

ただオタクとしてはもうちょっといい感じで出してみたいですね。見るデータと集計するデータの両方が欲しい。
欲張りな自分は嫌いじゃないです。LOVE MYSELF。
というわけで、メンバー別にデータを切って、曲ごとの参加情報を統合。

こういうふうになってるデータを
「列のピボット」→「列の結合」で1人1列に整形。
AR(編曲)登録があるSUGAは、パターンが一番多い。レアパラメータにときめくオタク心。

こんな感じでしょうか。ここまでで6時間くらいでした。

もし曲が増えたら、検索結果をテキストに追加するだけで更新できます。
元データにはメンバー以外の著作権者情報が含まれてるから、やろうと思えばPdoggさん達のデータを出すことも可能。

足りないデータを補完

さて、一応データはできたんですが、重要なものが欠落しています。
韓国音楽著作権協会の登録データには、タイトルが「英語」「韓国語読みのアルファベット記述」しかないんです。上に貼った画像をご覧いただければわかりますね。
日本人が使うためにはタイトル情報を追加しないと……!( ;∀;)

よし、日本語やハングル表記のタイトル名などの付随情報を追加しましょう。
あと、ソロ曲かユニット曲か、誰が歌ってるのかの情報も欲しいところ。
時々発作的に、「テギのデュエットが見たい!」とかなる時ありますからね!

本題に全く関係ないですが、『Jingle Bell RocK』のかわいいテギ置いときますね。2:30~です。
このクリスマスステージ、他にもホプジンとかミニモニとか、レアな組み合わせの歌が多くて至福です。ホビの歌声がたまらん……!

閑話休題。
前に「BTSメンバーの作詞作曲参加率」を書いてた頃に、曲一覧データを何パターンか作ったので、それらをPower Queryで合体させます。

mojim登録情報から取ったデータベース
上のデータベースから派生した曲一覧
これらを鍋に入れて煮込んだのがこちらのデータです。合体!

日英韓の言語差もあり、データベースによってタイトル表記が違うので、この合体作業が最大の難関です。
英語タイトルを大文字表記にしてスペースや記号を全部抜いた、照合用の文字列を作るのが早いと思います。
公式の英語タイトルがないっぽい曲の場合は、歌詞を検索して一番ヒットしたやつを採用。

同じタイトル名の別曲があるので、見分けるための手がかりとして、日付やアルバムの情報もあると便利。

登録番号の割り振りミスに気を付けましょう。

更に6時間くらいかけて完成。半日仕事でしたね~。
並行して、SUGAの著作権登録曲一覧も無事完成しました。

次にナムさんかホビの著作権登録曲一覧を作る時にでも、できたデータの検証をしたいと思います。
何事も、見直しが一番大事ですからね……!

次の課題

今回はメンバーが関与してる曲だけを取るつもりだったんですが、どうせならそれ以外のBTS曲も取りたくなりました。
いけそう、と思うと欲が出ますね!

でも、確実な検索方法がわからない……。
メンバーは登録番号があるから確実に検索できるんですけど、アーティスト名(BTS)には登録番号がないので、特定できないのが難点。
とりあえず「BTS」「防弾少年団」は基本として、後は思いついたら対応。

個人名検索は、記述が自由すぎて引っかけられないですね。「V」で5963件ヒットしちゃって笑いましたw
アルバム名も完全一致が難しい。今あるデータからの逆引きが早いのか?
検索仕様を研究しないといけないですね……。

ちなみに、韓国音楽著作権協会のデータベースは、サイトの言語選択でKoreanを選んだ時だけ、作品名の「前方一致」「後方一致」検索オプションと、公表日の日付絞り込みが使えました。φ(._. )メモ

現在の取得件数:331件

  • 著作権者名:メンバーの登録番号(7人分)

  • アーティスト名:「BTS」「BANG THAN SO NYEON DAN」

  • アルバム名:「LAYOVER」他、BTSアルバムとソロアルバム

今のところ、韓国音楽著作権協会のデータベースから上記の条件で取った曲データは、重複除いて353件。
正解数がわかりませんが、とりあえず大量ですね!
353曲のうち、メンバー参加数0の曲は32曲、BTSアルバムに限ると20曲でした。BTSの楽曲は、ほぼ彼らの血、汗、涙と言っていいでしょう。更に愛しくなるわ……。

登録された曲に著作権情報がなくても、同じ曲のDEMO版にはあったりするので、ノータッチの曲がほぼないと思われます。

早く皆の新曲を登録したくて、登録枠用意して待っています!


関連リンク

この曲何かわからない、タイトルの翻訳違い? カバー? 誰が歌ってるの? など、色々迷った時、大体検索に出てきて新規ARMYを助けてくれる三女神。
本当に助けられております。ありがとうございます。


コーヒー一杯奢ってください( *´艸`)