楽水

人々の創造が自由に表現できる舞台づくり

DX データ

データマネジメント

投稿日:


これは、データマネジメントの全体像を表した図です。

ここでは、データマネジメントについて次の観点で解説します。

データの重要性

変化が激しく、不透明で先行きが予測できない昨今の経営環境を、

  • Volatility(変動性)
  • Uncertainty(不確実性)
  • Complexity(複雑性)
  • Ambiguity(不透明性)

の頭文字をとってVUCA(ブーカ)という言葉で表すことがあります。
それは、SNSやモバイル技術によって人と人がつながる時間や距離が短くなったことで、個人の欲望や考えが、複雑なネットワークを介してすぐに世界中に広がり、いつどこで、どんな需要が生まれるか読みづらく、欲求の新陳代謝も激しくなっているからではないでしょうか。
このように、先行き不透明で予測困難な時代、経験や勘に頼るのではなく
稼ぐ力を持つ資産としてのデータをどう利活用してくか
ということが会社を発展させていくための重要な課題となっています。
「データは新しい石油(Data is the new oil)」と言われています。
会社に眠っているデータを、人やAIが、いかにうまく利活用して企業価値を生み出すことができるかが重要なのです。

最近では、「DATA is BOSS 収益が上がり続けるデータドリブン経営入門」という書籍で、データドリブン経営に舵をきり、売上右肩上がりの急成長をとげた「一休.com」の例が話題になっています。
さて、経営にデータを活用することの重要性は理解しているものの、多くの企業が、

  • 会社にはさまざまなデータがあるのに活用されていない
  • 会社にデータを活用できる人材がいない
  • コストをかけてデータ基盤を構築したのに有効活用されていない

という状況にあるようです。
これは、

  • ビジネスにとってどのようなデータが重要かわからない
  • 必要なデータはどこにどういう状態で存在しているかわからない
  • 必要なデータを取得するためにはどうすればよいかわからない
  • 必要なデータを分析できる状態にするためには何をすればよいかわからない

など、データを経営に活かすための知識や仕組が十分に整備されていないからではないでしょうか。
データとは、人や物、事象に関する事実を表したものです。
データマネジメント知識体系(DMBOK)では、

データは万物に関する事実を表現する

と説明しています。
この事実としてのデータを経営に活かすことでデータは経済価値を持つ資産になります。
データマネジメントは、データを経営に活かすための知識や仕組を整備する方法を提供します。

データマネジメントとは何か

DMBOKでは、データマネジメントを、

データという資産の価値を提供し、管理し、守り、高めるために、それらのライフサイクルを通して計画、方針、スケジュール、手順などを開発、実施、監督すること

と定義しています。
これを、

  • なぜ(WHy)
  • だれが(Who)
  • どのように(How)
  • 何をするのか(What)

で並び替えると、次のように言い換えることができます。
データマネジメントとは、

  • データの品質、セキュリティ、経済性を維持、向上するために(Why)
  • データマネジメント組織が(Who)
  • データマネジメントプロセス(開発、実施、監督)に従って(How)
  • データのライフサイクルを管理すること(What)


データのライフサイクルは、計画、設計・実装、生成・収集、保管・維持(場合によって破棄)、利活用、改善・強化という流れです。

具体的に言うと、まず、業務上必要なデータを計画し、データの構造(データモデル)やデータの流れ(データフロー)を設計し(データアーキテクチャ)、それをデータベース(以降、DB)などデータ管理基盤上に実装します。
次に、業務活動を通して発生するデータが、データ管理基盤上で生成・収集、保管・維持されます。
データ管理基盤上のデータは、企業価値を高めるために利活用され(データドリブン経営)、その結果を受けて改善・強化されます。
なお、ここではDBやESBなどデータの保管や連携を管理するIT基盤をデータ管理基盤と呼んでいます(企業全体で一元的にデータを管理するIT基盤を狭義的なデータ管理基盤と呼びます)。
データライフサイクルを通してデータを管理する組織とプロセスを、それぞれ、データマネジメント組織、データマネジメントプロセスといいます。
データマネジメント組織は、データマネジメントプロセスに従って、データを設計、実装し、データ管理基盤を構築、運用するだけでなく、それらを通して、データの品質、セキュリティ、経済性を評価し改善します。
データマネジメント組織を、データマネジメント実行する役割と、それが適切に遂行されているか監督する役割に分掌することで、データガバナンスを確立、維持することができます。
データマネジメントの対象には、データアーキテクチャという論理的基盤と、データ管理基盤という物理的基盤があります。
よく見受けられるのが、高額なデータウェアハウスを導入して、「後は、業務部門が自由に使ってください」、というアプローチです。
いくら箱(物理的基盤)だけ用意しても、
なぜ、どのようなデータを、どのように記録し、活用すべきなのか
というデータアーキテクチャ(論理的基盤)が整備されていないと、業務部門も困惑するだけで、どうデータ利活用すればよいかわからず、宝の持ち腐れになってしまうのです。
目的がなく手段だけあるという状態です。
データアーキテクチャとデータ管理基盤が両輪となってデータドリブン経営を実現することができるのです。

データマネジメントの必要性

さて、データのライフサイクルの中で、データが直接経済価値を生む活動(プロフィットセンター)は「データ利活用」で、あとの活動はコストがかかるだけのコストセンターです。

データマネジメントは、データライフサイクル全体を通して、データの品質とセキュリティと経済性を管理します。
データの経済性とは「データのライフサイクルを管理するためのコストを最小限に抑えながら、データが持つ経済価値を最大化できる度合」のことです。
なので、データマネジメントを導入することで品質とセキュリティの高いデータを「データ利活用」のためにコストをかけずに迅速に準備することができるようになります。
例えば、社員が「こんなデータ分析をしたい!」と考えても、実際にデータ分析ができるようになるまでにはさまざまな準備(プロビジョニング)のステップが必要です。

例えば、身近に次のような問題はないでしょうか。

これは、業務活動によって発生する事実としてのデータはあるものの、データが資産になっていない(稼ぐ力を持っていない)、つまり、ビジネスにとって重要な(経済価値を持つ)データがすぐに活用できる状態になっていないということです。
データマネジメントが導入されると、さきほどの問題は次のように解決することができます。

データカタログの整備

データアーキテクチャを設計し、各データのメタデータ(データに関するデータ)を定義し、データカタログとして整備することで、データ分析者は、必要なデータに関する情報(データの有無、所在、構造、来歴、品質の状態、セキュリティレベル、利用するときの連絡先など)を得ることができるようになります。

データの統合・連携

多くの会社が、
ビジネスの変化が加速し、ビジネスとITが密接化する中、全体の設計図もなく、必要に応じてシステムを導入してきた結果、

  • 大規模で複雑なシステムがサイロのように乱立している
  • 重複して整合していないデータが散在している
  • 個別の業務やシステムは詳しいが全体を理解できる人や資料がない

というカオスで雁字搦めな状況に陥っています。

データマネジメントでは、散在して存在する共通データを統合、連携し、会社全体として一元管理するのでデータの信頼性を高めることができます。

データ品質の管理

データ分析をするためには、データがきれいな状態でなければなりません。
次のようなケースを考えてみましょう。

例えば、あるエリアの不動産物件の適正な家賃を推定する場合、広さや駅からの距離、築年数といった変数の影響が大きくなります。
このとき、とある物件の建築年のデータが抜けたまま分析した場合、プログラムがどう判断するのかというと「建築年=””」→「西暦00年に建てられた」→「2024年前に建てられた物件」と捉え、広くて駅近なのに、ものすごく古い物件なので「適正家賃は0.01円」という分析結果を出してきたりするのです。

「DATA is BOSS 収益が上がり続けるデータドリブン経営入門」より引用
このように品質の悪いデータは、間違った意思決定をもたらすかもしれず、経済価値を生む状態とは言えません。
DMBOKでは、セキュリティや品質が確保されていないデータがもたらす事象として以下の例をあげています。

  • 誤請求
  • 顧客サービスコールの増加とそれを解決する能力の低下
  • 事業機会の逸失による収益損失
  • 合弁・買収の間に発生する業務統合の遅延
  • 不正行為発覚の増加
  • 不正なデータに起因する業務上の意思決定不備がもたらす損失
  • 良好な信用力の欠如による事業の損失

データ分析に必要なデータを取得しても、多くのデータには欠損や誤謬があり、そのままの形では利用できないので、まず、データをクレンジング(破損または不正確なデータを検出して修正すること)してきれいにしてから使う必要があります。
特に、データがバケツリレーのようにコピーされ使い回されていると、

  • 誤変換
  • 必要な情報の欠落
  • 情報の欠損や誤謬の継承

という問題が発生し、会社全体のデータ品質の低下を加速させていきます。

書籍「DATA is BOSS 収益が上がり続けるデータドリブン経営入門」の中で、株式会社一休 代表取締役社長の榊さんは次のように言及しています。

  • データクリーニングや、データクレンジングといった言葉を聞いたことがあると思います。データドリブンな意思決定をするには、扱うデータの質が高いことが前提です。データの質が高くないと、「人間なら絶対こんな返答しないよね」という結果を平気で返してくることがあるので、それを踏まえた活用が大事です。
  • データの質の担保は、AIによってデータドリブンがしやすくなるだけに、今後さらに重要になるはずです。経営としては、社でこれらを維持できるよう、努めなければなりません。

このデータの質(データクオリティ)を定義し、体系的に維持、管理する仕組がデータマネジメントなのです。
データマネジメントでは、データの品質要件をメタデータとして定義し、実際のデータをプロファイリング(データを検査し、品質を評価するために行われるデータ分析)し、継続的に品質を改善するのでデータの品質を維持、向上することができます。

データセキュリティの管理

上述したようにデータが散在していると、それだけ機密データの漏洩、破壊、改ざんなどのリスクが高くなります。
データマネジメントでは、データアーキテクチャで設計されたデータのセキュリティ要件(機密性レベルなど)をメタデータとして定義し、それに応じたセキュリティ対策(認証、認可、アクセス制御、監視、データのバックアップと復旧、機器・設備の冗長化、監査、緊急事態計画と実施など)を実施することで、データの機密性、完全性、可用性を保証します。
なお、データを統合するとき、コマンド・クエリ責務分離(CQRS)パターンを適用すると、データの読み込みや書き込みに対するアクセス制限の設計が容易になりデータのセキュリティを上げることができます。

書籍「DATA is BOSS 収益が上がり続けるデータドリブン経営入門」では、日本でデータドリブンが機能していないケースの最初に「見たいデータが見られない」ケースをあげています。

こうした場合は、そもそもデータを整備するケイパビリティが不足しています。
具体的には、どういったデータやどんな分析ができれば顧客の姿が見えてくるか描いた上で、収集するデータの定義、データインフラの整備、データの更新方法などを交通整理していく必要があります。
それは事業の特性や組織の状況によって変わってくるので、社内外のリソースをうまく使って、継続的にデータを整備していくための体制づくりから、しっかり取り組むのが得策です。

「DATA is BOSS 収益が上がり続けるデータドリブン経営入門」より引用

データマネジメントは、主に

  • ビジネスとして経済価値のるデータを特定する方法
  • 企業全体のデータ構造(データ同士の関係)やデーフロー(データのライフサイクルを通した流れ)を可視化し、データの見取り図(データアーキテクチャ)を作成する方法
  • データをカタログ化して必要なデータに関する情報(データの有無、所在、構造、来歴、品質の状態、セキュリティレベル、利用するときの連絡先など)をすぐに入手できるようにする方法
  • データを統合・連携することでデータの品質やセキュリティを向上させるとともにデータ利活用の効率を上げる方法
  • データのライフサイクルを通してデータの品質(一意性、完全性、一貫性など)やセキュリティを組織的に統制する方法

を提供します。
なので、データマネジメントを導入することで、データのプロビジョニングサイクルを極限まで早くすることができ、データドリブン経営による仮説検証の回転速度を上げることができます。

データマネジメントは、会社にあるカオスな状態のデータを整備し、企業価値を生む状態に資産化します。
つまり、会社に眠っている負債としての(維持するためのコストがかかるだけの)データを経済価値のある資産としての(稼ぐ力を持つ)データに変えることができるのです。

データの資産化とは、ビジネスにとって重要な(経済価値を持つ)データがすぐに活用できる状態になることであり、データドリブン経営の回転速度を上げることで組織が学習スピードを上げるということです。
ピーター・M・センゲの「最強組織の法則」という書籍に、
競争相手より早く学べる能力、それが競争力を維持する唯一の鍵である
と書かれています。
データマネジメントによって競争相手より早く学べる能力をつけることで企業の競争優位性を上げることができるのです。

データマネジメントの導入アプローチ

それでは、企業にデータマネジメントを導入するにはどうすればよいのでしょうか。
最後に、データマネジメントの導入プロセスについて見ていきましょう。
次の図は、DMBOKのデータマネジメント成熟度モデルを、各分野別に詳細化したものです。

データマネジメント成熟度モデルに合わせて、次の図のように、データ利活用の成熟度も上がります。

データマネジメントは、次の図のように一つの戦略サイクルで導入されます。

※データマネジメントが導入された後も、新しく戦略サイクルが開始する都度、このデータマネジメントプロセスが実行されます。
DM成熟度でいうと、設計フェーズで、データマネジメントモデルを設計した段階で、レベル3,定義された状態になり、
DM戦略を策定し、それにもとづいてDMシステムを構築し、1回以上運用することでレベル4、管理された状態になります。
そして、この段階で、データ利活用の成熟度もレベル4になり、データドリブン経営が実現された状態になります。
データマネジメント導入プロセスの概要は次のようになります。

  1. データマネジメントモデルの設計
    データマネジメントの目的、体制、方法など本質となる型を設計します。
    その際、あるべき(To-Be)データアーキテクチャ、データ管理基盤、データマネジメント組織、データマネジメントプロセスを概念レベルで設計します。
  2. データマネジメント戦略の策定
    データマネジメントモデルを具体的にどう実現するのか戦略を策定します。
    その際、データマネジメントのビジョン、および、あるべき(To-Be)データアーキテクチャ、データ管理基盤、データマネジメント組織を論理レベルで設計します。
    その上で、現行(As-Is)のデータアーキテクチャ、データ管理基盤、データマネジメント組織とのギャップを明確にします。
    その結果を踏まえて、データマネジメントシステムの構築計画を策定します。
  3. データマネジメントシステムの構築
    戦略フェーズで策定したデータマネジメントシステムの構築計画に従ってデータマネジメントシステム(データ管理基盤およびデータマネジメント組織)を構築します。
  4. データマネジメントシステムの運用
    設計フェーズで設計したデータマネジメントプロセスに基づいてデータマネジメントシステムを運用します。

データマネジメント導入のアプローチは次のようになります。

  • 概念レベルのモデルの設計(①)
    まず、概念レベルのあるべき将来モデルを設計します。
  • 論理レベルのモデルの設計(②)
    次に、論理レベルのあるべき将来モデルを設計します。
  • 論理レベルのモデルのギャップ分析(③)
    次に、論理レベルのあるべき将来モデルと現行のモデルのギャップを分析します。
  • システムの構築と運用
    論理レベルのモデルのギャップ分析の結果を踏まえて、システムを構築、運用します。
    システムを構築する場合、次の2つの方法があります。
    • 既存のシステムをベースに構築する場合(④-a)と、
    • 新規にシステムを構築する場合(④-b)があります。


ポイントは、まず、概念レベルのモデルを、全社レベルで広く粗く明確にし、それから粒度を細かくしていくトップダウンアプローチをとることで、漏れなくダブりなく、企業全体で最適なシステムを構築することができます。
粒度の細かい現行の物理レベルのモデルから現行の論理レベルのモデルを抽出するというボトムアップアプローチをとると、経験則上、そこで疲弊してしまい先に進めなくなります。
なので、最初に現行の論理レベルのモデルを網羅するのではなく、論理レベルの将来モデルをベースに、それと比較できる現行モデルの部分だけ可視化するようにします。
それから、データマネジメントはDXの一環として導入される場合もあり、DXのプロセスの中で考えると次の図のようになります。

-DX, データ

執筆者:

関連記事

【DMBOKで学ぶ】データセキュリティ

ここでは、データセキュリ&#12 …

会社の業務とシステムを体系的に整理する方法

ここでは、次の観点で、会&#31 …

データサイエンスとは【わかりやすく解説】

5Gが普及すると、ますます、Io …

データドリブン経営

これは、データドリブン経&#21 …

事業ライフサイクル

これは、事業ライフサイク&#12 …