Created
January 26, 2015 05:45
-
-
Save AKB428/9c8c43aa53aba3074c17 to your computer and use it in GitHub Desktop.
1320 A, [NTTデータだからこそできるHadoop徹底活用のための取り組み]
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
13:22 | |
[NTTデータだからこそできるHadoop徹底活用のための取り組み] | |
エンタープライズからのニーズに対してHadoopだけではできないことをNTTDの工夫でやる | |
Hadoop2ではNameNode HAがネイティブで実装された | |
Gangliaによるクラスタ状態の可視化 | |
NTTD=システムインテグレーター | |
いかに既存システムに対してHadoopシステムをリリースし運用するのか | |
マスターサーバー | |
Hive/メタデータPostgre -> HA Pacemaker | |
構成管理 puppet/ANSIBLE | |
監視 Ganglia(大量のサーバーを監視する仕組み) /Graphite(ぐらはいと) | |
運用管理 Hinemos ひねもすのマスコット「もにた」 | |
[適用例 Twitter提供サービス] | |
システム的にはデータの取りこぼしはないようにしている | |
タイムアウト調整用バッファ | |
ストリームのとりこぼし対策にクフ風 | |
[複数処理のまとめこみ] | |
似たような検索リクエストはまとめてジョブ(M/R)を動かす | |
[ツール開発でギャップを埋める] | |
Hadoop-PostgreSQLコネクタ | |
SqoopをPostgre用に最適化 | |
NTTDはPostgreはかなり使っている・ | |
Haoop->Import Postgre | |
Hadoop <-Export Postgre | |
トランザクション制御の実現 | |
-処理中断時に余分なデータが残らないように制御 | |
pg_bulkload:高速データロードユーティリティ | |
PostgreSQLコネクタ開発での成果物 | |
---------- | |
[OfflineImageViewer] | |
HDFSのメタデータを人間が読める形式に変更 | |
HTraceの開発 | |
分散システムのためのトレーシングライブラリ | |
[リファレンスガイドでギャップを埋める] | |
Hadoop1->Hadoop2への以降の補助 | |
チュートリアルの拡充に注力 | |
Hadoopソリューションリファレンスの作成 | |
Hadoop MapReduceアプリケーション設計実装ガイドライン | |
MapReduce アプリケーション開発テンプレート集 ー> 全部埋めると設計書になる | |
NTTD累計1万台のHadoopサーバーを構築運用して得られた知見を元に提供するサービス | |
---- | |
[これからのNTTDのとりくみ] | |
Storm Spark + YARNを使い倒しユーザーに提供する | |
HDFSの暗号化に評価・検証する | |
認証、認可、など安全な環境でHaoopが動かせるようにする | |
長く安定して使いたいというEOSの要求と | |
新しい機能を使いたいという要求 | |
2つの要求をくんで実現していく | |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment