テラデータユニバース東京2014参加メモ

2014年3月20日 於.シェラトン都ホテル東京

テラデータユニバース2014に参加してきた。
テラデータとは古くから関わっているが、残念ながら実務では携わったことが無い。日本に上陸したての頃に、神保町で住商エレだったと思うが、説明を聞きにいった覚えがある、未だDB2が出始めの頃だったと思う。
今では、DWHの代表的なDBMSアプライアンス)の一つとなっている。数年前にビッグデータ対応のAster(アスター)をラインアップに加えている。
元々NCR傘下だったこともあって、小売での販売・マーケティング領域が多い。特にウォールマートでの事例は有名だ。
肌寒い風雨にも関わらず、基調講演、午後からのブレイクアウトセッションとも盛況であった。

以下、参加したセッションについて所感を述べる。

●全体セッション 楽天.ビヘイビアインサイトストラテジー室.室長 北川氏
購買を体験してもらうことを広める。
顧客が買い始める理由を知ることが必要で、演者自身は、USにいて日本にいる母に贈り物をするために楽天を使ったのがきっかけだったという。演者は、データサイエンティストであるが、数値データからの解析結果に加え、顧客の心理を探ることが必要。

●全体セッション テラデータCTO Stephen Biobest氏

・BIからコンシューマインテリジェンスへ。
 顧客との間に双方向の組織的なエンゲージメントを確立する。
・オープンデータ革命。
 オープンデータで、年間3兆ドルとの価値が創出されるとのマッキンゼーによる試算も出ている。気候、土壌データなどを活用しオープンデータで農業保険を開発などの事例を紹介。オープンソースでのリーナスの法則(Given enough eyeballs, all bugs are shallow、多くの開発・テスターがいれば全てのバグは明らかになる)を引用し、オープンデータの可能性を言及された。

●全体セッション EIM Enterprise Information Management
RBCファイナンシャルグループ Dr.Mohammand Rifale氏
1995年からの現在までのEIMの歴史の振りかえり。ASTERを利用したビッグデータ分析。20年間で、クエリーは500%に増えているが、TCOは9%をほぼ維持していることは、経営への説得材料となる。

●全体セッション オバマ陣営でどうデータ分析・活用したか
データサイエンティスト、シカゴ大 Rayid Ghani氏 
大統領選でオバマ陣営でのデータ分析を担当した。
データソースを分析し、目標を達成するために、チャネルで結びつける。
データ分析結果をもとにいかに行動するかが重要、即ち、有権者を獲得することが目標であり、そのためにオバマ氏に投票してくれる層を見つけ出し、アクションを取ることであった。
データでの限界を知ることも必要。

●「ビッグデータが分析の質を変える」千趣会 西口氏
千趣会は、約20年近く前からのテラデータユーザである。
テラ、MapReduce、Asterを組み合わせて活用している事例。
Webログやテキストデータなどの多構造化データをAsterで分析。
(※一般的に非構造化データと呼んでいるのをテラデータでは、多構造化データと呼んでいるようだ。他にSQL-MapreduceやPIなどテラデータ固有の用語が出てきて、少し戸惑うところがある。)
nPATH関数(シーケンシャルな物事の順序や経路を分析する)を利用してパス分析を行った。
Web履歴を使って、カタログページ入口から注文に至るまでのパターン、また初めての注文者は、どのようなページアクセスを経てたどり着いたかなど。
SQL-MapReduceによりSQLからMapReduce関数を呼び出すことが可能。(SQL-MapReduceは、Webアクセスログ、テキストデータ、マシンセンサーログデータといった多構造化データを分析する際に、高頻度で利用されるMapReduce処理を関数として事前にパッケージ化し、分析ユーザーがSQLの関数として呼び出せる機能。)
Teradata2700にリプレースして、5時間かかっていたSQLが7分になったという。
データマイニングするために特異値のクレンジングが必要。
リアルタイムパーソナライズの必要性。
分析者としての以下の心得を持つことが大切。
・データサイエンティストではなくデータベースマーケッター視点を持つ。
・データ分析できないことは何か(限界)を知る。
・自らの感性を研ぎ澄ますこと。

●「楽天における利用事例」楽天.熊倉氏
楽天スーパーDB(会員、購買、行動情報からなるDWH)の担当。
インフラ改訂で、POCの結果、性能面からテラデータのアプライアンスを選択。

●「小売業におけるオムニチャネルの全体像」テラデータ.Michael Day氏
USでのmacys、Nordstromの事例。

●「CRM、MCIFの戦略的活用」 りそな銀行.亀岡、渡邉氏
CRMとMCIFで2元管理していた顧客データをテラデータを使って1つに統合した事例。OLAPシステムとしてのMCIFには元々テラデータを使っていたが、勘定系PC、コールセンタ、自動機、テレバン、ATM、営業店PC等のシステムから顧客情報250万TPSが入ってくるCRMは、トランザクション処理用のRDBMSで構築していた。今回の統合で、このOLTPのCRMをテラデータで統合した。開発時にはSQLの性能問題で苦労したが、チューニングにより解決した。PI(PrimaryIndex)の設定が鍵とか。
テラデータをOLTPに適用した希有な事例。

●「パネルディスカッション」 モデレータ アクセンチュア.工藤氏
・データサイエンス、分析プロジェクトを始めるきっかけという経営層にいかに納得してもらい、予算化していくかという課題。
これには、POCや経営への見せ方の工夫が挙げられた。
・データ分析により得したこと、ビジネス改善の具体例というテーマでは、予測が可能になったことが多く上げられた。
・既存データと多構造化データをどのように扱うかというテクノロジーの問題。テラデータでは、テラデータとAsterの組み合わせで解決しようとしている。
・分析組織の役割とビジネス部門との連携という組織論。

●全体所感
Asterというテラデータの非構造化データについてのソリューションを知ることができた。
データ分析結果を得ただけではだめで、その結果を経験則や感を働かせてどう評価するか、そして次のアクションに結びつけ、バリューを得ることが必要とどの分析者も訴えられていた。
千趣会の西口氏の、データ分析結果をどう評価するかには、感性が必要との言葉も納得できた。

その他、ランチセッションをはじめ、多くのBIベンダーが出展されていた。


以上