エンティティ解決

エンティティ解決による経営改革

あいまいなデータは収益成長の壁

企業の情報システムやツールの多様化により、顧客データ管理が複雑になりました。CMS、CRM、ERPなどのようなクライアントと直接対応するシステム、バックオフィスのシステム、マーケティングの自動化システムの1つひとつに顧客データが分割されて格納されています。注文、ポリシー、支払い、クレームのような取引データ、カスタマーサービスコール、オンラインストアと実店舗へのアクセスなどのチャネルとのやりとりのデータがその内容です。

これらのリポジトリーの多くは、氏名、住所、電話番号などのマスターデータも保持しています。このすべてのデータには多くの重複と一貫性のなさが見られ、41%を超えるB2Bマーケターがそれを最大の課題として挙げています。

1-10-100のルールに示されているように、プロセスのより早い段階で問題を見つけて修正する方が、より適切でありコストも安価で済みます。レコードを入力時に確認するのにかかる費用は1ドルですが、クレンジングするには10ドル、何もしない場合は結局100ドルが必要になります。不十分な品質のデータの影響は結果から明らかです。マーケティングリーダーは、クリーンで一貫性およびつながりのある顧客データが不足しているため、予算の26%が効果のないチャネルや戦略に費やされていると考えています。

収益成長の壁となるデータ管理
従来のデータ管理システムの弱点

従来のアプローチはデータの曖昧さの解消には不向き

従来のMDM(マスターデータ管理)システムは、リレーショナルデータベースを基盤に構築されているので、アカウント、コンタクト、リード、キャンペーン、案件などの情報が、事業区分の種類別に別々の表に保存されています。

これらのリレーショナルデータベースは、データのインデックス作成と検索、トランザクションのサポートと基本的な分析の実行には適したツールです。ただしそれらは、実世界のひとつのエンティティに対して複数のデータエントリがもたらす大量のデータを処理するには十分な機能を備えていません。

データのあいまいさがあるこの環境では、アナリストはクエリを実行し、分析データを収集するために、大規模な表形式データを多数結合する必要があります。このようなクエリの実行には数時間または数日かかる可能性があり、有意義なパターン分析を行うことは事実上不可能になります。

エンティティ解決にTigerGraphを活用

グラフデータベースはエンティティ解決に理想的

さまざまなデータソースから顧客データをマージすることは一概にたやすい作業とは言えません。問題のひとつに挙げられるのがエンティティ解決で、これは別々のデータソースから得られた複数のエンティティがどの物理的な実体と一致するかを見極めて、そのエンティティに集約することです。

例えば、データソースが3つあって、次のような種類の顧客情報を格納しているとします。

  • ソース1(SSN、Eメール、住所)
  • ソース2(SSN、電話番号、名前、年齢)
  • ソース3(Eメール、電話番号、性別)

SSN、Eメール、電話はそれぞれ、一個人を一意に識別するのに十分である、つまりこれらはPII(Personally Identifiable Information=個人特定可能情報)であると想定しましょう。問題は、さまざまなソースがさまざまな識別子を使用していること、そして個々のレコードに情報が欠落している可能性があることです。後になってある顧客の欠落していたPIIが別のデータソースに現れることもあります。目標は、顧客に関する何らかのPIIを使用して、あらゆるデータソース内で顧客のすべての情報(属性)を検索し、SSN、電子メール、電話、名前、年齢、性別、住所といった属性を備えた統合されたレコードを構築することです。

グラフデータベースは、複数のソース間をつないで単一のレコードを作成するために設計されています。今回の例では、TigerGraphは、SSN、Eメール、電話などのさまざまなPII頂点につながった、顧客一人ひとりの頂点を作成します。次に、同じSSN、Eメール、電話を持つ複数の顧客エンティティまたは頂点が、年齢や住所といったフィールドまたは属性の異なる値の調整に適用されるビジネスルールに基づいてマージされます。

TigerGraphは、住所またはその他のルールの最終更新日を使用して、顧客の頂点U1の統合レコードの住所を入力し、既知の住所のリストを、EUの一般データ保護規則やGDPRなどの規制コンプライアンスや、企業情報ガバナンスのためのソース情報とともに管理できます。

グラフ分析による推薦関係の確立