This documentation is for an unreleased version of Apache Flink. We recommend you use the latest stable version.
Data Types
データの型 #
このページでは、PyFlink Table APIでサポートされるデータ型を説明します。
データ型 #
data typeはtableエコシステム内の値の論理型を表します。これはPythonのユーザ定義関数の入力および/または出力型を宣言するために使えます。Python Table APIのユーザは、Python Table APIの中や、ユーザ定義関数を定義する時に、pyflink.table.types.DataType
のインスタンスを操作できます。
DataType
インスタンスは、論理型を宣言します。これは送信または保存のための具体的な物理表現を意味しません。全ての事前定義されたデータ型はpyflink.table.types
で利用可能で、pyflink.table.types.DataTypes
で定義されたユーティリティメソッドを使ってインスタンス化できます。
全ての事前定義されたデータ型のリストは、以下にあります。
データ型とPythonの型のマッピング #
データ型は、Pythonユーザ定義関数の入力および/または出力型を宣言するために使えます。入力はデータ型に対応するPythonオブジェクトに変換され、ユーザ定義関数の結果の型も定義されたデータ型に一致する必要があります。
ベクトル化されたPython UDFの場合、入力型と出力型はpandas.Series
です。pandas.Series
の要素の型は、指定されたデータ型に対応します。
データ型 | Pythonの型 | Pandasの型 |
---|---|---|
BOOLEAN |
bool |
numpy.bool_ |
TINYINT |
int |
numpy.int8 |
SMALLINT |
int |
numpy.int16 |
INT |
int |
numpy.int32 |
BIGINT |
int |
numpy.int64 |
FLOAT |
float |
numpy.float32 |
DOUBLE |
float |
numpy.float64 |
VARCHAR |
str |
str |
VARBINARY |
bytes |
bytes |
DECIMAL |
decimal.Decimal |
decimal.Decimal |
DATE |
datetime.date |
datetime.date |
TIME |
datetime.time |
datetime.time |
TimestampType |
datetime.datetime |
datetime.datetime |
LocalZonedTimestampType |
datetime.datetime |
datetime.datetime |
INTERVAL YEAR TO MONTH |
int |
Not Supported Yet |
INTERVAL DAY TO SECOND |
datetime.timedelta |
Not Supported Yet |
ARRAY |
list |
numpy.ndarray |
MULTISET |
list |
Not Supported Yet |
MAP |
dict |
Not Supported Yet |
ROW |
Row |
dict |