This documentation is for an unreleased version of Apache Flink. We recommend you use the latest stable version.
Overview
Python API #
PyFlinkは、Apache Flink用のPython APIで、リアルタイムデータ処理パイプライン、大規模な探索的データ分析、機械学習(ML)パイプライン、ETLプロセスなどのスケーラブルなバッチとストリーミングワークロードを構築できます。 PythonやPandasのようなライブラリにすでに成れている場合は、PyFlinkを使うとFlinkエコシステムの全機能を簡単に活用できます。必要な抽象化のレベルに応じて、PyFlinkで使える2つの異なるAPIがあります。
- PyFlink Table APIにより、SQLを使ったりPythonで表形式データを操作するのと同じ方法で、強力なリレーショナルクエリを作成できます。
- 同時に、PyFlink DataStream APIによりFlinkのコア構成要素、state、timeを下位レベルで制御でき、より複雑なストリーム処理のユースケースを構築します。
PyFlinkを試してみる #
Flink を使って遊んでみたい場合は、次のチュートリアルのいずれかを試してください:
その他の例については、 PyFlink Examples を参照することもできます
PyFlinkを探索する #
リファレンスドキュメントには全ての詳細が記載されています。いくつかの出発点:
PyFlinkのヘルプを受ける #
行き詰った場合は、コミュニティサポートリソースをチェックしてください。特に、Apache Flink のユーザメーリングリストは、あらゆる Apache プロジェクトの中で最も活発なプロジェクトの1つとして常にランク付けされており、すばやく助けを受けるのに最適な方法です。