Spark ストリーミング + Kafka 統合ガイド

Apache Kafkaは publish-subscribe メッセージングを分散、パーティション、リプリケートコミットログとして再熟考したものです。Sparkを使って統合を始める前にKafka ドキュメント を十分に読んでください。

Kafkaプロジェクトはバージョン0.8と0.10の間で新しいコンシューマ apiを導入しました。そのため、二つの異なる対応するSparkストリーミングパッケージが利用可能です。ブローカーおよび望む機能のために正しいパッケージを選択してください; 0.8の統合は0.9および0.10以降のブローカーと互換性がありますが、0.10統合は以前のブローカーとの互換性が無いことに注意してください。

spark-streaming-kafka-0-8spark-streaming-kafka-0-10
ブローカーのバージョン 0.8.2.1 以上 0.10.0 以上
Api の安定性 安定 実験的
言語のサポート Scala, Java, Python Scala, Java
レシーバーのDStream Yes いいえ
直接DStream Yes Yes
SSL / TLS サポート いいえ Yes
オフセットのコミットApi いいえ Yes
動的なトピックの購読 いいえ Yes
TOP
inserted by FC2 system