見出し画像

データは分散したままSSOTを実現する:仮想的データ統合アプローチ【データの信頼性#3】

お疲れ様です。冷房にすると湿度が上がり、除湿にすると寒すぎる、空調管理ハードモードのShinです。

今回は前回に引き続き、SSOTを実現するためのソリューションについて整理していきます。前回はデータの一元集約という方法に着目して、DWHとMDMによるSSOTの実現について触れました。

今回は、データを一元集約せずに分散させたままでSSOTを実現する方法を考えてみたいと思います。

データ連携基盤 or iPaaS

データ連携は、システムアーキテクチャをSSOTの概念に近付けるためのひとつの方法であると言えます。源泉システムが散在した状態においても、同じようなデータを二重・三重管理することなく、データ連携によって全く同じデータを使いまわすことができるようになるためです。データ連携により「同じような」データは不要になるため、データは正確性と一貫性を持つことになります。

データ連携基盤は、オンプレミス環境(データセンターまたは仮想サーバ)において構築されることが一般的でしたが、昨今ではSaaSのようなサービス型でデータ連携機能が提供されています。このようなサービス型のデータ連携基盤は "Integration Platform as a Service" を略して "iPaaS" と呼ばれています。サーバの維持保守等を行いたくない場合や、資産として持ちたくない場合には、これらiPaaSの利用も検討の対象になるかもしれません。

データ連携とデータ連携基盤の必要性については、似たような話を以前に別の記事でまとめていますので、よければこちらも見てみてください。

しかし、データ連携だけでは、探索性の問題を解決することができません。なぜならデータの発生源である源泉システムは、データの種類によって異なるためです。あくまで、ある場所で発生したデータを他の場所で使いまわしているだけであり、その所在は分散しています。

探索性の問題を解決するためには、別のアプローチが必要です。

データカタログ

近年では「データメッシュ」の概念のような、データの集中管理でなく分散管理を良しとする考え方もあります。こうした考え方のもとでは、DWHへの一元集約化は受け入れられません。(MDMの場合は、MDMシステム自体を1つの源泉システムと見なすので、概念としては受け入れ可能です)

データメッシュについては以前にもこちらで取り上げました。

そこでデータカタログの出番です。データカタログは、企業内に存在するあらゆるデータの所在と属性情報(メタデータ)を一元管理するためのツールです。データ活用者は、データカタログを参照すれば自分が求めるデータがどこにあるのかをすぐに見つけることができるようになります。

分散的なアーキテクチャにおける探索性の問題は、データカタログの導入により概ね可能であると考えられます。

おわりに

以上、データ連携とデータカタログの組み合わせによって、データが分散したままでもSSOTの効果を期待できることに触れてみました。

今回では、iPaaSとデータカタログについてデータの分散管理アーキテクチャのもとでの利用を想定して記載しましたが、いずれも集中管理アーキテクチャにおいても利用可能であり効果を充分発揮するものと考えられます。

個々の企業のシステム環境と考え方に従って最適なソリューションの選択がなされることを望ましく思います。

最後までお読みいただきありがとうございました。


この記事が気に入ったらサポートをしてみませんか?