[メタデータ]EDW2018に参加してきた

4/22-27(27日のポストカンファレンスは欠席)で、USのサンディエゴで開催された、EnterpriseDataWorldに参加した。GWの連休と併せると、2週間、JOBを空けることになるが、4月から始まったJOBも最初から考慮していただき、参加することができた。
Dataversity社のカンファレンスとしては、2013.8にNOSQLがサンノゼで開催されたの時に参加しているがそれ以来の国際会議となる。
さらにEDWへの前回参加が2010.3のサンフランシスコ依頼だから8年振りとなろうか。随分とさぼったものだ。実業が忙しくてまとまった時間が取れないということもあるから、ビジネス的には良かったのかもしれないなどと勝手に自分に言い聞かせている。参加者は、1,000名弱と前回の700名より多くなっている。
DAMA-internationalは30周年とのことである。私も、20年以上のお付き合いになろうか。
 内容は時代とともに、変化してきているが、メタデータ管理、データモデリング、データガバナンスが主軸であることには変わりない。今年のテーマは、「データドリブンビジネスのための変革がここから始まる」。データドリブンでのシステム開発(日本流にいうとDOAといことになるが)に代わって、昨今では、データ主導経営が日本でも叫ばれているが、データ主導するためには、どう変わっていけばよいのかがテーマということだろうか。
 データ管理からデータ統制へ、ビジネス視点から経営層を説得しながら、ドメイン内外とのコミュニケーションが重要となる。テクニカル的なところは、標準化を進めて、データが収集できれば、AIに取って変わられるところであるためだ。学習を可能とするためにもメタデータの整備は欠かせない。そのために、メタデータ品質を高めようという話題も出てくる。
 メタデータは、ビジネス用語のシソーラス作りから始め、テクニカル用語(IT視点)への変遷までを管理する。ビジネス用語で、データの発生からのライフサイクルとデータオーナーと関係する部門を含む、データの変遷(リネージ)を管理することに焦点を当てる。
 データモデルについては、NOSQLが日常的に使用されるようになってきているため、そのためのモデリング手法やモデリングツールなども普及期に入っているようだ。スキーマ定義は、RDBDDLに相当するものとしては、JSONでのスキーマを定義するものが主流で、従来からのモデリングツールでも対応している。
データガバナンスについては、テクニカル的なものだけでは、不足でコミュニケーションやチェンジマネジメントなどがより必要となってきている。
ディープラーニング関係のセッション枠もいくつかあった。また、オントロジーについては、何年も前から話題となっているが、FIBO(Financial Industry Business Ontology)という団体があり、業界標準を作っており、その団体向けのセッション枠ができていたことから、本格普及期に入っているということだろうか。
BIツールで、ビジュアル化してデータを見せることが多くなっているが、逆に凝り過ぎてそれが何を表しているのかが、分からないといったことも起きており、そのために、「データインタプリタ」という役割も出てきている。
スマートデータマネジメントのためには、論理データレイクでの統制が必要という話もある。

AIを進めるための源泉となるものは、いかに質の高いデータを多く収集できるかであり、そのためにもデータ統制の組織や仕組みが背後を支えていく必要がある。
今までは、データ主導の矛先がシステム開発だったのが、ビジネス、経営に向かっているということだ。そのためのメタデータ管理、データモデリングもビジネスサイドと対話しながら進めるための技術、スキルが求められていると感じつつ、帰国の途に着いた。

PS.主だったセッションで、イラストレーター(?)が、講演を聞きながらライブで1枚の模造紙に、イラストとして要点を整理していくということが行われたが、これがなかなか評判が良かった。専門の訓練を受けているであろうが、若く、専門知識もさほどないと思われる講演内容をきれいにまとめていく技は、素晴らしかった。

今回、日本からの参加者は、10名であったが、夕食を食べに行ったりで情報交換することができた。それぞれ参加目的は違うが、(メタ)データ管理に興味を持つ人が増えてきているようだ。