2013年6月アーカイブ

ほぼ一年ぶりの更新になってしまいました。もう少し更新しないとですね。

さて、先日からCassandraSummit2013及びHBaseConに参加するためにサンフランシスコに来ています。
アメリカのイベントは活気があっていいですね。取り急ぎの初日の速報としてCassandraSummit2013の報告をしたいと思います。内容に関しては自分の英語にそれなりに難有りと思っていますので、認識違いがあると思います。ですので、後日公開されるビデオなどを参考にしてください。ビデオが公開されたら改めて確認して詳細を書きたいと思います。なお今年は2日間5トラック参加登録数1200人以上と有料カンファレンスにもかかわらず去年の800名を大幅に超え巨大なカンファレンスになっていました。全体的なトラックもビジネス寄りのものが増え参加者も年齢層が高めになった印象です。来年はどうなることやら。

  • 基調講演

  • CEOは今年は案内に徹していて余りぶっ放さなかったなという印象 CTOの基調講演は1.2の新機能と7月に出る予定の2.0の新機能のお話。 基本的にはすでに表沙汰になっている機能ばかりなので驚きは余りありませんでした。 TwitterにそのままメモしていたJonathanが語った内容に関しては以下の通り。

    各nosqlのパフォーマンス比較:HBaseやRedisなどとのパフォーマンス比較。
    CQL3の解説: Account Authorization:今までも簡易的には存在していましたが、アカウント認証がCreate User文で出来るようになりました。
    Native drivers : CQL3用のNativeDriverが続々作成されています。
    Cassandraのメモリの使い方:JVMヒープ以外のメモリにbloomfilterを展開してメモリの効率的に使用しています。
    Compaction throttling:Compaction時のIOの使用方法を調整して効率的な。
    Dse3:
    Casの話:Paxosプロトコルが実装されました。CQL3上でWhere句にif文を追加することにより条件分岐でUPDateが可能になりました。
    Triggerの話:

  • What were they thinking?

  • アクセンチュアの話 EnterpriseITを使うのかCassandraを使うのか?

    得ることを判断としますか?
    失うことを判断としますか?

    Cassandraを使うのはいつ?
    今でしょ?

    のお話。

    最初何が言いたいか解らずなんでこのセッションがここにあるのかなと思っていましたが 要約すると上記のとおりでした。内容に関しては近いうちに公開されるビデオを参照してみてください。 これはこれで面白いですよ。

  • Big Architectures for Big Data

  • DaaS(Data as a Service)のお話 SimpleReachのデータプラットフォームの設計方法、 ITアーキテクチャの概要など。 Cassandraのスキーマ設計が聞けるのかなと思っていたらちょっと違いました。 去年のDisneyもそうだったのですがやっぱりMongoと併用させてますよね。

  • Ground Traffic Control - Logistics with Cassandra

  • 壮絶に期待していたいのですが、前の自分の参加したセッションが押してしまい 5分遅れで行った処、15分しかプレゼンをしてくれなかったので10分程度しか聞けませんでした。 内容もCassandraの特徴とAWSの特徴を話していただけの印象が。 こちらはビデオ公開がされたら改めて内容を確認したいですね。

  • Real-time Analytics using Cassandra, Spark and Shark

  • CassandraでAnalyticsを行うためのプラットフォームの解説。 HiveQL互換の記述方法でCassandra上でアグリゲーションを行うのに有効ですとのこと。 SparkがMRフレームワークでSharkがその上で動くHive互換フレームワーク。 特徴としては中間ファイルをマテリアルビューとしてメモリ上に保持しているので バク速ですよとの事。ClouderaのImparaをどう考えるかがこのツールの肝のような気がしています。

  • Suicide Risk Prediction Using Social Media and Cassandra

  • 題名が題名だったので方法論などに期待していたのですがシステムアーキテクチャのお話でした。 これはこれで非常に重要なんですけどね。 一番大事な所はブラックボックスの中でゴニョゴニョと。そこが聞きたいのに。

  • Hardware Agnostic: Cassandra on Raspberry Pi

  • 今回もっともGeekよりの内容。結構動かすまでに苦労しますねという印象。 64ノードクラスターで$2,000とか32ノード作ったとか楽しいですね。 OracleJDKとOpenJDKでかなりの差がでたとのこと。 こういう話は楽しくてイイですね。 思わず日経さんからでたRaspberry Pi付きムックをそのまま注文してしまいました。再現実験は後日。

  • When Bad Things Happen to Good Data: A Deep Dive Into How Cassandra Resolves Inconsistent Data

  • リペアのお話。どのようにデータを復帰させているかや、ノード障害時のデータ整合性の担保の仕方を内部アーキテクチャを詳細に説明しながら解説してくれました。内部アーキテクチャに関して自分の勘違いしていた部分もあったりしたのでこのセッションはビデオが出次第改めて確認したいと思います。

取り急ぎの初日のレポートは以上になります。二日目もすぐに上げたいと思いますが明日帰国なので飛行機上でかけたらと思いますので今暫くお待ちください。

尚、次回のCassandra勉強会にてCassandra Summit 2013の報告会を行いたいと思いますのでもし良かったらご参加ください。申込は以下となります。

第26回Cassandra勉強会

参加お待ちしています。

ウェブページ