データのライフサイクルは、計画、設計・実装、生成・収集、保管・維持(場合によって破棄)、利活用、改善・強化という流れです。
具体的に言うと、まず、業務上必要なデータを計画し、データの構造(データモデル)やデータの流れ(データフロー)を設計し(データアーキテクチャ)、それをデータベース(以降、DB)などデータ管理基盤上に実装します。
次に、業務活動を通して発生するデータが、データ管理基盤に上で生成・収集、保管・維持されます。
データ管理基盤上のデータは、企業価値を高めるために利活用され(データドリブン経営)、その結果を受けて改善・強化されます。
ここでは、データライフサイクルを構成する各フェーズで何をするのか整理します。
計画
データマネジメントの目的は、ビジネス要件を満たすために、それに関連するデータの品質とセキュリティ、および、経済性を維持、向上させることです。
ビジネス要件は、戦略マップの設計を受けて、次の3つの観点で定義します。
- 各種戦略目標の実現(有効性)
- 各種報告の信頼性確保(信頼性:内部統制)
- 各種法規の遵守(安全性:コンプライアンス)
このうち、戦略目標の実現する、つまり、企業価値最大化に寄与する(経済性の高い)構造化データ(戦略マップの情報資本)は次の2つに分けることができます。
- トランザクションデータ
バリューチェーン(価値を創る活動、価値を伝える活動、価値を届ける活動)を構成する活動の事実を記録し、ビジネスの状況を確認したり改善するために必要なデータ。 - 分析データ
ビジネスの進行状況を追跡し、必要に応じて戦略やアクションを調整するために必要なデータ。
データライフサイクルの計画フェーズでは、まず、各企業において、企業価値最大化に寄与する(経済性の高い)データは具体的に何か明確にし、何のためにデータマネジメントを行うのか、データマネジメントの目的を明確にする必要があります。
次に、いつまでに、データマネジメントのレベルをどうしたいのか(データマネジメントの成熟度)、データマネジメントのビジョンを設定します。
その上で、データマネジメントシステム構築計画、データマネジメントシステム運用計画を策定し、それを実施します。
設計
計画フェーズでは、企業価値最大化に寄与する(経済性の高い)データは具体的に何か明確にしました。
設計フェーズでは、経済性の高いデータのアーキテクチャ(データアーキテクチャ)を設計します。
データアーキテクチャは、企業全体のデータの構造を表すエンタープライズデータモデルと、企業全体のデータの流れを表すデータフローによって構成されます。
エンタープライズデータモデルを構成する個々データには、データ品質上の要件や、データセキュリティ上の要件がメタデータとして定義されます。
次に、データデーアキテクチャを実装する基盤であるデータ管理基盤を設計します。
企業のデータの論理的基盤となるデータアーキテクチャに対して、データ管理基盤は、企業のデータの物理的基盤になります。
実装
実装フェーズでは、設計フェーズで設計されたデータアーキテクチャとデータ管理基盤を実装します。
データ管理基盤の実装とは、データ管理基盤を構成するデータレイクやデータウェアハウス、NoSQLを導入、構築することであり、データアーキテクチャの実装とは、エンタープライズデータモデルをテーブルなどの形でデータ管理基盤上に展開することです。
なお、データ管理基盤を構築することでデータフローの物理モデルであるデータパイプラインが構築されます。
生成・収集
データ管理基盤が構築されると、データパイプラインを通して、データが生成、収集されます。
業務活動によって生成されたデータは、設計フェーズで設計されたデータ統合方式や、データ連携方式に従って統合、連携されます。
保存・維持
業務活動によって生成され、収集されたデータは、それが永続的に保存されるよう、データ管理者によってアーカイブ、バックアップされ、維持されます。
利活用
保存、維持されたデータは、データドリブン経営によって利活用されます。
改善・強化
データドリブン経営によって利活用されるデータは、データプロファイリングによって評価され、データクレンジングやデータ強化などの方法で改善、強化されます。