見出し画像

ドラマシリコンバレーの"ミドルアウトによるロスレス圧縮"とは何か?

ドラマシリコンバレーのシーズン5がアマゾンプライムで見れるようになりました。かなり面白いので、起業家を目指していたり、スタートアップに興味のある方には非常にオススメです。

さて、ドラマの舞台はまさしくシリコンバレー。パイドパイパーという架空の会社が登場します。主人公が、たまたま音楽SNSを作る為に開発した【ミドルアウトによるロスレス圧縮技術】が、実は世の中を変えてしまう凄い技術だったのだが、本当にソレで世界を変えることができるのか?という話です。

しかし、「ミドルアウト」も「ロスレス圧縮技術」という言葉も初めて聞く僕にとってよくわからんので、少しでも理解してみようと色々情報を調べて見ました。

「ロスレス圧縮技術」とは何だったか?

まずは、言葉の意味そのものを理解しましょう。(僕自身、聞き流していただけで正確にどういう意味か理解していなかった。)

ロスレス圧縮技術とは、<ロス(消失)の発生しない圧縮技術>ということです。

通常、いわゆるZipだとか、いろんな形式でデータを圧縮するのですが、その場合データを粗く削り取り、データ容量を軽くするために、データそのものもある程度消失してしまいます。当たり前の話ですよね。

しかし、そういったデータの消失なしにデータ容量を軽くするという技術が、ロスレス圧縮技術、と呼ばれるものです。

Cf.ちなみに、Dropboxでもこの技術は採用されているようで、そういえばパイドパイパー初の製品(ビデオチャットのひとつ前)は、こういったクラウドにデータを保存するようなものでしたね。

「ミドルアウト」とは?

ざっと調べたところ、「ミドルアウトの…」というのがテクノロジー界隈ではちょろちょろ出てくる単語のようです。ミドルアウト開発だとか、ミドルアウト型組織だとか。要は中心から外向きに動いていくのが「ミドルアウト」という意味のようです。

一応、下記はミドルアウト圧縮技術を開発している技術の説明です。

ミドルアウトされたビットは、解凍されたビットの終端にある。このアルゴリズムは、JPEGが作る8×8ピクセルのブロック2つの境界を見る。そのとき、片方のブロックはすでにデコードされている。まだデコードされていない方のブロックはその明度が、それの中央部(middle)からの…middleからoutにかけての…グラデーションに合っている傾向がある。そこでアルゴリズムは、その前提に従って明度値を予測する。そして、その予測値と実値のデルタのみを保存する。VP8コーダーの演算に適した形式で。

噛み砕くと、画像データをピクセル8*8のデータに切り分けて、出力したいブロック(8*8)の隣のブロック(8*8)の明度値を参考に、出力したいブロックの明度値もそれに合わせる、ということをしているらしいです。

つまり、それぞれのピクセルに保存されている値(色彩・明度など)を周囲から予測して出力しているために、画像データの見た目を変えずにデータ量を減らすことに成功しているみたいですね。

作中ではこれを人工知能で高度化

これを調べながら思ったことなんですが、これは明らかに人工知能の領域ですね。大量の画像を読み込みデータを学習する中で、「どういった明度が続いたらばどうなるのか?」「どういった色の次にはどういった色が来やすいのか?」などを学習することで、より早く・より複雑なアルゴリズムで情報を軽量化できてしまうのではないでしょうか。

また、これは当然、作中でもそうであったように、画像だけではなく音声や動画といった情報についても、こうした学習によって瞬発的にアルゴリズムで情報を軽量化・補完することができるはずです。

既にミドルアウトのロスレス圧縮技術はある


前述もしましたが、ミドルアウトによるロスレス圧縮技術はすでにDropboxが「lepton」という形で開発しています。

こちらのGitにソースも公開されているようなので、気になる方はみてみてはいかがでしょうか。(僕は見てもさっぱりわかりません)

まとめ


だいぶ浅い調査と解説に終わりましたが、なんとなくどういう動きをするものなのかがわかればOKだったので自分的には満足です。この分野に特化して動いている会社ってDropbox以外にもあるんでしょうか?

比較的規模が大きくデータのクラウドストレージサービスなんかやってるGAFAあたりが、うちうちに開発し導入してそうですよね。



この記事が気に入ったらサポートをしてみませんか?