2010-04-26から1日間の記事一覧
大量データを処理するのに、RDBMSを直接アクセスするよりも一旦テキストファイルの落して、Map処理で抽出・分解、Reduce処理で集約・計算を行う。分解した単位で独立した計算機でおこなうため、処理データ量が増えた場合にはマシンを追加して並列処理が可能…
大量データを処理するのに、RDBMSを直接アクセスするよりも一旦テキストファイルの落して、Map処理で抽出・分解、Reduce処理で集約・計算を行う。分解した単位で独立した計算機でおこなうため、処理データ量が増えた場合にはマシンを追加して並列処理が可能…