データは、計画、設計・実装、生成・収集、保管・維持(場合によって破棄)、利活用、改善・強化という活動を通して変遷します。
具体的に言うと、まず、業務上必要なデータを計画し、データの構造(データモデル)やデータの流れ(データフロー)を設計し(データアーキテクチャ)、それをデータベースなどデータ管理基盤上に実装します。
次に、業務活動を通して発生するデータが、データ管理基盤に上で生成・収集、保管・維持されます。
データ管理基盤上のデータは、企業価値を高めるために利活用され(データドリブン経営)、その結果を受けて改善・強化されます。
ここでは、データライフサイクルとデータマネジメントのマネジメントサイクルのマトリクスで、データライフサイクルを構成する各活動で具体的に何をするのか整理します。
計画
設計フェーズ
データマネジメントの設計フェーズでは、データマネジメントの目的、体制、方法など、データマネジメント行う上で不変的な型を設計します。
データマネジメントの目的は、ビジネス要件を満たすために、それに関連するデータの品質とセキュリティ、および、経済性を維持、向上させることです。
ビジネス要件は、戦略マップの設計を受けて、次の3つの観点で定義します。
- 各種戦略目標の実現(有効性)
- 各種報告の信頼性確保(信頼性:内部統制)
- 各種法規の遵守(安全性:コンプライアンス)
このうち、戦略目標の実現する、つまり、企業価値最大化に寄与する(経済性の高い)構造化データ(戦略マップの情報資本)は次の2つに分けることができます。
- バリューチェーンを構成する活動の事実を記録し、業務プロセスがどこまで進行しているか状況を確認し、必要に応じて状況を改善するために必要データ
- 事業の進行状況を追跡し、必要に応じて戦略やアクションを調整するために必要なデータ
データライフサイクルの計画では、まず、各企業において、企業価値最大化に寄与する(経済性の高い)データは具体的に何か明確にし、何のためにデータマネジメントを行うのか、データマネジメントの目的を明確にする必要があります。
次に、データマネジメントの目的の実現を担う役割、ジョブを定義します。
データマネジメントを行う代表的なジョブには、データスチュワード、データアーキテクト、データサイエンティストがあります。
最後に、データマネジメントジョブがどのようにしてデータマネジメントの目的を実現するのかデータマネジメントのプロセスを定義します。
設計フェーズでは、なぜ(目的)、誰が(ジョブ)、どのように(プロセス)データマネジメントを進めるのかという本質的な部分を設計します。
戦略フェーズ
データマネジメントの戦略フェーズでは、設計フェーズで定めたデータマネジメントの目的、体制、方法を具体的な戦略に展開します。
具体的には、まず、いつまでに、データマネジメントの成熟度レベルをどの段階にしたいのか、データマネジメントのビジョンを設定します。
次に、データマネジメントジョブを具体的なデータマネジメント部門に展開し、データマネジメント組織を策定します。
データマネジメント組織を立法、行政、司法という観点で考え、データマネジメントを実施する職務と監督する職務に分掌して構成することで、監督側が実施側を統制することができ、データガバナンスを効かせることができます。
最後に、データマネジメントプロセスを、データマネジメント計画に展開します。
データマネジメント計画は、主に、いつ、誰がデータの改善・強化の活動を行うのかという観点で策定します。
設計
データの計画では、企業価値最大化に寄与する(経済性の高い)データは具体的に何か明確にしました。
データの設計では、そのデータを管理するための論理的基盤であるデータアーキテクチャと物理的基盤であるデータ管理基盤を設計します。
データアーキテクチャは、企業全体のデータの構造を表すエンタープライズデータモデルと、企業全体のデータの流れを表すデータフローによって構成されます。
また、データ管理基盤は、個別のシステムのデータベースや、企業全体でデータを一元管理するためのデータウェアハウスやデータレイクなどのデータ基盤、データを連携するためのデータ連携基盤、データを分析するためのデータ分析環境から構成されます。
設計フェーズ
データマネジメントの設計フェーズでは、まず、業務の本質的な構造や流れをベースにした概念レベルのデータアーキテクチャを設計します。
概念レベルのエンタープライズデータモデルを構成する個々データには、ビジネス上のデータ要件、データ品質上の要件や、データセキュリティ上の要件がビジネスメタデータとして定義され、データカタログとして利用されます。
次に、データ管理基盤をどういう方針で導入するのか導入方針を定義します。
戦略フェーズ
データマネジメントの戦略フェーズでは、概念レベルのデータアーキテクチャを論理レベルのデータアーキテクチャに展開します。
例えば、データモデリングスキームがリレーショナルスキームの場合、概念データモデルを正規化された論理データモデルに展開します。
次に、設計フェーズで定義された方針に基づいて、戦略フェーズでは、データ管理基盤の具体的な製品を選定します。
実装
データの実装は、データマネジメントの構築フェーズの活動になります。
データの実装では、データ管理基盤の製品を導入し、その上に物理レベルのデータアーキテクチャを実装します。
その際、物理レベルのテクニカルメタデータと運用レベルのオペレーショナルメタデータを定義します。
データ管理基盤の導入とは、データ管理基盤を構成するデータレイクやデータウェアハウス、NoSQLを導入、構築することであり、データアーキテクチャの実装とは、エンタープライズデータモデルをテーブルなどの形でデータ管理基盤上に展開することです。
なお、データ管理基盤を構築することでデータフローの物理モデルであるデータパイプラインが構築されます。
生成・収集
データ管理基盤が構築されると、業務活動によって生成されたデータが、データパイプラインを通して収集されます。
業務活動によって生成されたデータは、設計フェーズで設計されたデータ統合方式や、データ連携方式に従って統合、連携されます。
保存・維持
業務活動によって生成され、収集されたデータは、それが永続的に保存されるよう、データ管理者によってバックアップ、アーカイブされ、維持されるとともに、不要になったデータは破棄されます。
利活用
保存、維持されたデータは、人やAIによって利活用されます。
社員一人ひとりがデータやAIを利活用してマネジメントサイクル(PDCA)を遂行し、自律的に業務課題を解決することができる経営をデータドリブン経営といいます。
データドリブン経営によって仮説検証を繰り返すことで企業は成功力を高め継続的に企業価値を上げることができます。
改善・強化
データドリブン経営によって利活用されるデータは、データプロファイリングによって評価され、データクレンジングやデータ強化などの方法で改善、強化されます。
データの改善、強化ではデータ管理基盤上の実データの改善、強化だけではなく、アプリケーションを構築する段階のデータ要件やデータ設計の内容も検証し、改善、強化します。