embulkが動作しているEC2やローカルのマシンからRedshiftにロードする。
https://github.com/embulk/embulk-output-jdbc/tree/master/embulk-output-redshift でのソースコードを確認する限り、
embulkが動作しているEC2やローカルのマシンからRedshiftにロードする。
https://github.com/embulk/embulk-output-jdbc/tree/master/embulk-output-redshift でのソースコードを確認する限り、
http://www.daviddlewis.com/resources/testcollections/reuters21578/ | |
816 README.txt | |
39 all-exchanges-strings.lc.txt | |
56 all-orgs-strings.lc.txt | |
267 all-people-strings.lc.txt | |
175 all-places-strings.lc.txt | |
135 all-topics-strings.lc.txt | |
1203 cat-descriptions_120396.txt | |
5199 feldman-cia-worldfactbook-data.txt |
- Riak(OSS版)に含まれている
- Riak1.1以降から正式サポート
overviewが表示される。問題があると、大きな赤字で×が表示され、どのノードがどういう状態で問題があるのかが表示される。
クラスタ内のノードごとの情報が表示される。 メモリやディスクの使用量だけでなく、それぞれのノードをドリルダウンで詳細情報を見ていくことも出来る。
glog 0.3.2 -> 0.3.3 | |
==================== | |
- Add --disable-rtti option for configure. | |
実行時型情報を消すことでバイナリサイズ小さくなったり、パフォーマンスが上がる?環境もあるらしい。 | |
- Visual Studio build and test fix. | |
Windows用。関係ない | |
- QNX build fix (thanks vanuan). |
jubatus管理ツール群役割(現状) | |
=============================== | |
定義 | |
----------- | |
- task | |
NAMEによって区別される機械学習タスク | |
- node |
Jubatusのログ出力仕様 | |
glogについては | |
https://gist.github.com/3930022 | |
1. 出力形式 | |
以下の2つが選べること | |
- stderr | |
(LogToStderr) |
user 長野久義 is similar to : 長野久義 糸井嘉男 ミレッジ | |
user 大島洋平 is similar to : 大島洋平 本多雄一 石川雄洋 | |
user 鳥谷敬 is similar to : 鳥谷敬 サブロー 糸井嘉男 | |
user 坂本勇人 is similar to : 坂本勇人 角中勝也 稲葉篤紀 | |
user 中田翔 is similar to : 中田翔 井口資仁 新井貴浩 | |
user 李大浩 is similar to : 李大浩 中村紀洋 ミレッジ | |
user 陽岱鋼 is similar to : 陽岱鋼 秋山翔吾 枡田慎太郎 | |
user 糸井嘉男 is similar to : 糸井嘉男 長野久義 栗山巧 | |
user 聖澤諒 is similar to : 聖澤諒 明石健志 ヘルマン | |
user 田中浩康 is similar to : 田中浩康 栗山巧 梵英心 |
1. 利用するライブラリ | |
http://code.google.com/p/google-glog/ | |
google-glog を利用する。 | |
2. ログレベル | |
Jubatusは通常モードとデバッグモードのログレベルが存在する。 | |
通常モードでのJubatusで利用するログレベルは、以下の三種類とする。 |
【Jubatus ZKとの接続でSESSION_EXPIREDしたときどうするか問題】 | |
- ZKを利用しているOSSの実装 | |
- EXPIREしたらexit(自殺)する | |
- EXPIREしてもZKと繋がるまで再接続し続ける | |
- 無限ループ・回数制限を設ける | |
- 接続が切れている間は、ZK関連のサービスを提供できない(キャッシュ保持してるかもしれない。もしくは、キャッシュはクリアする実装) | |
- Jubatusにおける選択肢 | |
- EXPIREしたらプロセスを終了する | |
- EXPIREしてもZKへ接続リトライする(リトライし続ける、回数制限等つけてリトライする) |