MKBHDの動画がきれいな理由を考察してみた

 今回はアメリカのユーチューバーMKBHDさんの動画がきれいな理由を考察してみました。(5分でオートマティズム的に即興で書いた記事なので、文章が変なのはお許し下さい)
 MKBHDさんというのは、アメリカのガジェット系の動画配信者で、ハイクオリティーな映像や音声でテック系のレビューや考察を発信されている方です。今回は彼の動画がなぜきれいなのか考えるということが主題になります。というのもYouTubeに関心のある人であれば、一度は「YouTubeには実は裏設定があって、特定の有名な配信者だけ、特別にビットレートの高い動画を配信することができる」というような噂を聞いたことがあるかと思います。あまり詳しくない方向けに説明すると、YouTubeやその他の動画配信プラットフォームでは、アップロードされた動画ファイルの容量を削減するために圧縮するという操作がほぼ必ずかけられるということになっています。もちろん、動画作成者は撮影された動画を編集して書き出すときにすでにある程度の圧縮をかけることになるのですが、さらにYouTubeなどのプラットフォームに投稿する際に再圧縮がかけられるということになるのです。こうすることで、時間や通信速度、予算を含む有限のリソースのなかで、より多くの人に最善のクオリティーや価値を提供するということができるということなのです。つまり、先述の『噂』というのは、この再圧縮の設定自体が、実は特定のクリエイターのみにしか許されない裏設定のあるものとなっていて、MKBHDなんかはその裏設定を利用しているから、彼が意図した画質を損なわずに鑑賞者にまで動画が届いているのだというような主張をするものなのです。私もこれが確実にありませんとは言えませんが、とりあえずこうしたことはないというふうに仮定して、私たちにもできる一般的な話として以下に議論を進めたいと思います。
 それでは早速結論から申し上げたいと思います。つまるところ、彼の動画は圧縮のプロセスを逆算して、情報量を少なく保つことによって高画質を保っているというふうに考えます。もう少し具体性を上げると①ライティングと色、ボケやレンズの描写がきれいで統制がとれている、②モーションが滑らか、③ノイズが少ない、ということが彼の動画がきれいに見える要因だと思うのです。
 ラインティングがきれいで色がきれいでノイズが少なければきれいなのはわかるよ! という方もいらっしゃるかもしれませんが、ちょっと待ってください。私が言いたいのはそういうことではなく、再圧縮をかけられる際にこうした動画は有利であるということを言いたいのです。
 このことを説明するためには、圧縮の仕組みを簡単に説明することが必要かと思います。動画の圧縮は基本的に時間軸と平面の2種類で起こります。時間軸での圧縮というのは、前のフレームから変化していないところを省くということで行われます。平面における圧縮というのは一定の明るさや色彩が平面的に一定の面積とともに連続している場合に、その部分の解像度を落としてしまうということで行われます。とてもはしょって説明しているので厳密さを欠きますが、今回の記事に必要最小限の説明という意味では本質を捉えているものではあると思います。
 ここまで説明すると、勘の良い方なら先に挙げた3つの点がなぜ重要かお分かりになる方もいらっしゃるかもしれません。つまり、ライティングが決まっていて、色がきれいでボケや描写がきれいで統制がとれているということは、平面的な圧縮できる面積を増やすということにつながるのです。例えば背景や壁の白い部分がしっかりと白く飛んでいて、また暗いところがきっちりと一様に暗くて、ボケがざわついていなくて、変に不必要な部分で細かい明るさや色の変化がないということは、一つの画面の中で情報量を取る部分が減るということを示します。そのことで、人間の顔とか写している商品といった本当に重要なディテールに情報量=ビットレートが割り振られるということなのです。
 また、彼のカメラのワークも非常に滑らかであるということは、このようにして平面的に圧縮できた部分というのが、フレームの前後でもあまり著しく変化しないということにもつながります。つまり、平面的にうまいこと背景や周辺の画角に割く情報量を圧縮することを成功させるとともに、その状態を時間的にも連続させているのです。
 さらに、最後のノイズの少ない映像ということについては、これは平面と時間の双方に言えることです。まずは平面に注目すると、動画や画像の圧縮という観点からいうと、同じ赤一色の画面であっても、ベタ塗りの赤とノイズ混じりの赤ではそれを再現するために必要なビットレートが異なります。ベタ塗りの赤であれば、(誤解を恐れずに凄い大胆なデフォルメとともに言えば)赤一色の四角があります! という記述でそれを再現することができます。しかし、細かいノイズが混じっている場合、それを再現するためには、全体的には赤なんだけど、右上のピクセルには白いノイズが混じっていて、その左隣には灰色があって、そのまた隣には黒があって……、などと永遠にノイズを描写していかなくてはなりません。そのために、このブロックは赤一色です! と言える場合よりも圧倒的に多くの情報量が本来であれば概念的には赤一色の部分に割かれてしまうということなのです。
 これは時間的な観点からはさらに厄介で、カメラのノイズというものはフレームを横断して生じるのではなく、一コマ一コマ、テレビの砂嵐のように基本的には位置を変えて生じます。なので、時間的な圧縮という観点からも、常にノイズの位置を再記述し続けるということを要求するのです。なので、彼のREDで撮影された、極めてノイズが少なく、ライティングや画面の構成が非常に安定してきれいで、統制のとれた色使いのなかで、ボケのきれいなレンズで撮影された映像は、単に圧縮の時に背景や画面の周辺が圧縮されやすいようにするという点で優れているのです。そのために、余剰分の情報量が彼の指や顔、プロダクトや文字といった本当に重要なディテールに豊かに割り振られることになり、このことで彼の映像の独特の解像感が出ているのだと考えます。

写真と写真機が好き