Overview
This documentation is for an unreleased version of Apache Flink. We recommend you use the latest stable version.

Python API #

PyFlink

PyFlinkは、Apache Flink用のPython APIで、リアルタイムデータ処理パイプライン、大規模な探索的データ分析、機械学習(ML)パイプライン、ETLプロセスなどのスケーラブルなバッチとストリーミングワークロードを構築できます。 PythonやPandasのようなライブラリにすでに成れている場合は、PyFlinkを使うとFlinkエコシステムの全機能を簡単に活用できます。必要な抽象化のレベルに応じて、PyFlinkで使える2つの異なるAPIがあります。

  • PyFlink Table APIにより、SQLを使ったりPythonで表形式データを操作するのと同じ方法で、強力なリレーショナルクエリを作成できます。
  • 同時に、PyFlink DataStream APIによりFlinkのコア構成要素、statetimeを下位レベルで制御でき、より複雑なストリーム処理のユースケースを構築します。

PyFlinkを試してみる #

Flink を使って遊んでみたい場合は、次のチュートリアルのいずれかを試してください:

その他の例については、 PyFlink Examples を参照することもできます

PyFlinkを探索する #

リファレンスドキュメントには全ての詳細が記載されています。いくつかの出発点:

PyFlinkのヘルプを受ける #

行き詰った場合は、コミュニティサポートリソースをチェックしてください。特に、Apache Flink のユーザメーリングリストは、あらゆる Apache プロジェクトの中で最も活発なプロジェクトの1つとして常にランク付けされており、すばやく助けを受けるのに最適な方法です。

inserted by FC2 system