概要
Apache Flink Runnerは、Apache Flinkを使用してBeamパイプラインを実行するために使用できます。実行には、クラスタ実行モード(例:Yarn/Kubernetes/Mesos)またはパイプラインのテストに役立つローカル埋め込み実行モードを選択できます。
Flink RunnerとFlinkは大規模な連続ジョブに適しており、以下を提供します。
- バッチ処理とデータストリーミングプログラムの両方をサポートするストリーミングファーストのランタイム
- 非常に高いスループットと低いイベントレイテンシを同時にサポートするランタイム
- *exactly-once*処理保証による耐障害性
- ストリーミングプログラムにおける自然なバックプレッシャー
- インメモリとアウトオブコアのデータ処理アルゴリズム間の効率的かつ堅牢な切り替えのためのカスタムメモリ管理
- YARNおよびApache Hadoopエコシステムの他のコンポーネントとの統合
Apache Flink Runnerの使用
Flink Runnerには2つの種類があることを理解することが重要です。
- Java(および他のJVMベースの言語)のみをサポートする元の*クラシックRunner*
- Java/Python/Goをサポートする新しい*ポータブルRunner*
なぜ2つのRunnerがあるのか疑問に思うかもしれません。
BeamとそのRunnerは、もともとJVMベースの言語(例:Java/Scala/Kotlin)のみをサポートしていました。PythonとGo SDKは後で追加されました。他の言語で記述されたパイプラインの実行をサポートするために、Runnerのアーキテクチャを大幅に変更する必要がありました。
アプリケーションでJavaのみを使用する場合は、現在、クラシックRunnerを使用する必要があります。最終的には、ポータブルRunnerは、Java、Python、Go、および将来のより多くの言語を実行するための汎用フレームワークが含まれているため、クラシックRunnerに取って代わるでしょう。
FlinkでBeamを使用してPythonパイプラインを実行する場合は、ポータブルRunnerを使用する必要があります。ポータビリティの詳細については、ポータビリティのページをご覧ください。
したがって、このガイドは、Flink Runnerのクラシック機能とポータブル機能を説明するために、部分的に分割されています。さらに、Pythonはランナーのライフサイクル全体を処理するための便利なラッパーを提供するため、ポータビリティコンポーネントを自動的に管理するか(推奨)、手動で管理するかに応じてさらに分割されます。以下のスイッチャーを使用して、Runnerに適切なモードを選択してください。
- クラシック (Java)
- ポータブル (Python)
- ポータブル (Java/Python/Go)
前提条件とセットアップ
Flink Runnerでローカル実行モードを使用する場合、クラスタセットアップを完了する必要はありません。Beamパイプラインを実行するだけです。RunnerをFlinkRunner
PortableRunner
に設定してください。
クラスタ上で実行するためにFlink Runnerを使用するには、Flinkのセットアップクイックスタートに従ってFlinkクラスタをセットアップする必要があります。
依存関係
pom.xml
またはbuild.gradle
でFlink Runnerへの依存関係を指定する必要があります。以下の互換性テーブルからBeamバージョンとアーティファクトIDを使用してください。例えば
実行環境にDockerがインストールされている必要があります。埋め込みflinkクラスタを実行するか、Python < 3.6 用のFlinkランナーを使用するには、実行環境でjavaも利用可能にする必要があります。
実行環境にDockerがインストールされている必要があります。
Flinkクラスタ上でのBeamパイプラインの実行
Flinkクラスタ上でパイプラインを実行するには、いわゆるfat jarにプログラムとすべての依存関係をパッケージ化する必要があります。これを行う方法はビルドシステムによって異なりますが、Beamクイックスタートに従う場合は、実行する必要があるコマンドは次のとおりです。
このコマンドの出力JARは、`target`フォルダにあります。
BeamクイックスタートMavenプロジェクトは、Maven Shadeプラグインを使用してfat jarを作成するように設定されており、 `-Pflink-runner`引数はFlink Runnerへの依存関係が含まれていることを確認します。
パイプラインを実行するための最も簡単なオプションは、Flinkの一部である `flink`コマンドを使用することです。
$ bin/flink run -c org.apache.beam.examples.WordCount /path/to/your.jar –runner=FlinkRunner –other-parameters
代わりに、Mavenのexecコマンドを使用することもできます。たとえば、WordCountの例を実行するには、
ローカルマシンでFlink `JobManager`が実行されている場合は、 `flinkMaster`に `localhost:8081`を指定できます。そうでない場合、ジョブのために埋め込みFlinkクラスタが起動されます。
Flinkでパイプラインを実行するには、ランナーを `FlinkRunner`に、 `flink_master`をFlinkクラスタのマスターURLに設定します。さらに、オプションで `environment_type`を `LOOPBACK`に設定します。たとえば、ローカルflinkクラスタを起動した後、次を実行できます。
埋め込みFlinkクラスタで実行するには、単に `flink_master`オプションを省略すると、埋め込みFlinkクラスタが自動的に起動およびシャットダウンされます。
古いバージョンのPythonでは、オプションの `flink_version`オプションも必要になる場合があります。
Beam 2.18.0以降、事前に構築されたFlink Job Service DockerイメージはDocker Hubで入手できます:Flink 1.16。 Flink 1.17。 Flink 1.18。
埋め込みFlinkクラスタでパイプラインを実行するには
(1)JobServiceエンドポイントを起動します: `docker run --net=host apache/beam_flink1.10_job_server:latest`
JobServiceは、Beamパイプラインを送信する中央インスタンスです。 JobServiceは、パイプラインのFlinkジョブを作成し、ジョブを実行します。
(2) `PortableRunner`、 `job_endpoint`を `localhost:8099`(これはJobServiceのデフォルトアドレスです)に設定して、上記のエンドポイントにPythonパイプラインを送信します。オプションで `environment_type`を `LOOPBACK`に設定します。例えば
別のFlinkクラスタで実行するには
(1)Restインターフェースを公開するFlinkクラスタを起動します(デフォルトでは `localhost:8081`)。
(2)Flink Restエンドポイントを使用してJobServiceを起動します: `docker run --net=host apache/beam_flink1.10_job_server:latest --flink-master=localhost:8081`。
(3)上記のようにパイプラインを送信します。
`environment_type = LOOPBACK`はローカルテストのみを目的としており、リモートクラスタでは機能しないことに注意してください。詳細はこちらをご覧ください。
追加情報と注意事項
ジョブの監視
Flink JobManagerダッシュボードまたはそのRestインターフェースを使用して、実行中のFlinkジョブを監視できます。デフォルトでは、これはJobManagerノードのポート `8081`で利用可能です。ローカルマシンにFlinkがインストールされている場合は、 `http:// localhost:8081`になります。注: `[local]`モードを使用すると、ダッシュボードを利用できない埋め込みFlinkクラスタが起動されます。
ストリーミング実行
パイプラインで非有界データソースまたはシンクを使用する場合、Flink Runnerは自動的にストリーミングモードに切り替えます。 `--streaming`フラグを使用して、ストリーミングモードを強制できます。
注:Runnerは、非有界ソースが使用されていて、チェックポイントが無効になっている場合、警告メッセージを出力します。 `PubSubIO`などの多くのソースは、 `FlinkRunner`でチェックポイントが有効になっている場合にのみ実行できる、チェックポイントが確認されることに依存しています。チェックポイントを有効にするには、`checkpointingInterval``checkpointing_interval`をミリ秒単位の目的のチェックポイント間隔に設定してください。
Flink Runnerのパイプラインオプション
Flink Runnerでパイプラインを実行する場合、これらのパイプラインオプションを設定できます。
Flink固有のパイプラインオプションの次のリストは、FlinkPipelineOptionsリファレンスクラスから自動的に生成されます。
allowNonRestoredState | セーブポイントにパイプラインに含まれなくなったオペレーターの状態が含まれている場合に、復元されていない状態を許可するかどうかを示すフラグ。 | デフォルト: `false` |
attachedMode | パイプラインをアタッチモードまたはデタッチモードのどちらで送信するかを指定します。 | デフォルト: `true` |
autoBalanceWriteFilesShardingEnabled | WriteFiles変換の自動バランスシャーディングを有効にするかどうかを示すフラグ。これは、パイプラインが多数のイベントをファイル(通常はN個のシャードに分割)に書き込む必要があるストリーミングユースケースで役立つ場合があります。Flinkのデフォルトの動作では、一部のワーカーが他のワーカーよりも多くのシャードを処理することになります。これにより、ワーカーの処理バックログとメモリ使用量のバランスが崩れます。この機能を有効にすると、シャードが使用可能なワーカー間で均等に分散され、スループットとメモリ使用量の安定性が向上します。 | デフォルト: `false` |
自動ウォーターマーク間隔 | 自動ウォーターマーク放出の間隔(ミリ秒)。 | |
チェックポイントタイムアウト(ミリ秒) | チェックポイントが破棄されるまでの最大時間(ミリ秒)。 | デフォルト: -1 |
チェックポイント間隔 | 実行中のパイプラインのチェックポイントをトリガーする間隔(ミリ秒)。デフォルト:チェックポイントなし。 | デフォルト: -1 |
チェックポイントモード | 整合性保証を定義するチェックポイントモード。 | デフォルト: EXACTLY_ONCE |
メトリクスの無効化 | Flink RunnerでBeamメトリクスを無効にする | デフォルト: `false` |
安定した入力ドレインの有効化 | RequiresStableInput演算子を含むFlinkパイプラインのドレイン操作を許可します。ドレイン時に、DoFn演算子に処理関連の障害が発生した場合、RequiresStableInputコントラクトに違反する可能性があることに注意してください。 | デフォルト: `false` |
バッチ実行モード | バッチパイプラインのデータ交換のためのFlinkモード。{@link org.apache.flink.api.common.ExecutionMode}を参照してください。パイプラインがブロックされる場合は、BATCH_FORCEDに設定してください。https://issues.apache.org/jira/browse/FLINK-10672 を参照してください。 | デフォルト: PIPELINED |
実行再試行遅延 | 実行間の遅延をミリ秒単位で設定します。値が{@code -1}の場合、デフォルト値が使用されます。 | デフォルト: -1 |
外部チェックポイントの有効化 | 外部チェックポイントを有効または無効にします。CheckpointingIntervalと連携して動作します。 | デフォルト: `false` |
チェックポイントエラー時の失敗 | チェックポイント手順でエラーが発生した場合のタスクの予期される動作を設定します。これがtrueに設定されている場合、タスクはチェックポイントエラーで失敗します。これがfalseに設定されている場合、タスクはチェックポイントを拒否して実行を続行します。 | デフォルト: `true` |
高速コピー | 演算子間の不要なディープコピーを削除します。https://issues.apache.org/jira/browse/BEAM-11146 を参照してください。 | デフォルト: `false` |
ファイル入力分割最大サイズ(MB) | ファイルシステムからデータを読み取るときの入力分割の最大サイズを設定します。0は最大サイズがないことを意味します。 | デフォルト: 0 |
チェックポイント前のバンドル完了 | 設定されている場合、現在のバンドルを終了し、演算子の状態をチェックポイントする前にすべての出力をフラッシュします。デフォルトでは、すぐにチェックポイントを開始し、残りのバンドル出力をチェックポイントの一部としてバッファリングします。この設定は、チェックポイントのアライメントに影響を与える可能性があります。 | デフォルト: `false` |
Flink設定ディレクトリ | Flink YAML設定ファイルを含むディレクトリ。これらのプロパティは、Flinkに送信されるすべてのジョブに設定され、FLINK_CONF_DIRの設定よりも優先されます。 | |
Flinkマスター | パイプラインを実行する必要があるFlinkマスターのアドレス。"host:port"の形式、または特別な値[local]、[collection]、[auto]のいずれかです。 | デフォルト: [auto] |
強制非アライメントチェックポイントの有効化 | 非アライメントチェックポイントを強制し、特に反復ジョブで許可します。 | デフォルト: `false` |
ジョブチェック間隔(秒) | デタッチモードでwaitUntilFinishメソッドのジョブチェック間隔を秒単位で設定します。デフォルトは5秒です。 | デフォルト: 5 |
レイテンシ追跡間隔 | ソースからシンクにレイテンシ追跡マークを送信する間隔(ミリ秒)。間隔値<= 0は機能を無効にします。 | デフォルト: 0 |
最大バンドルサイズ | バンドル内の要素の最大数。デフォルト値は、ストリーミングジョブの場合は1000、バッチの場合は1,000,000です。 | デフォルト: MaxBundleSizeFactory |
最大バンドル時間(ミリ秒) | バンドルを完了するまで待機する最大時間(ミリ秒)。デフォルト値は、ストリーミングの場合は1000、バッチの場合は10,000です。 | デフォルト: MaxBundleTimeFactory |
最大並列度 | 使用するパイプライン全体の最大並列度。最大並列度は、動的スケーリングの上限と、パーティション化された状態に使用されるキーグループの数を指定します。 | デフォルト: -1 |
チェックポイント間の最小一時停止 | 次のチェックポイントがトリガーされるまでの最小一時停止(ミリ秒)。 | デフォルト: -1 |
同時チェックポイント数 | 同時チェックポイントの最大数。デフォルトは1(=同時チェックポイントなし)です。 | デフォルト: 1 |
実行再試行回数 | 失敗したタスクを再実行する回数を設定します。値がゼロの場合、フォールトトレランスが事実上無効になります。値が-1の場合、システムのデフォルト値(構成で定義されているとおり)が使用されます。 | デフォルト: -1 |
オブジェクトの再利用 | オブジェクトの再利用の動作を設定します。 | デフォルト: `false` |
演算子の連結 | 演算子の連結の動作を設定します。 | デフォルト: `true` |
並列度 | 操作をワーカーに分散するときに使用される並列度。並列度が設定されていない場合、構成されたFlinkのデフォルトが使用されます。見つからない場合は1が使用されます。 | デフォルト: -1 |
反復可能なGroupBykey結果 | GBKの結果を反復可能にする必要があるかどうかを示すフラグ。反復可能な結果は、現在ディスクへのスピルをサポートしていないため、単一のキーのすべての値がメモリに収まる必要があることを意味します。 | デフォルト: `false` |
チェックポイント期間の報告 | nullでない場合、指定されたメトリック名前空間で各ParDoステージのチェックポイント期間を報告します。 | |
キャンセル時の外部チェックポイントの保持 | キャンセル時の外部チェックポイントの動作を設定します。 | デフォルト: `false` |
セーブポイントパス | セーブポイントの復元パス。指定されている場合、指定されたパスからストリーミングパイプラインを復元します。 | |
アイドル状態後のソースシャットダウン(ミリ秒) | 構成されたミリ秒の時間アイドル状態であったソースをシャットダウンします。ソースがシャットダウンされると、チェックポイントはできなくなります。すべての入力が処理されると、ソースのシャットダウンは最終的にパイプラインのシャットダウン(= Flinkジョブの終了)につながります。明示的に設定しない限り、チェックポイントが有効になっている場合はLong.MAX_VALUEに、チェックポイントが無効になっている場合は0にデフォルト設定されます。この問題の進捗状況については、https://issues.apache.org/jira/browse/FLINK-2491を参照してください。 | デフォルト: -1 |
状態バックエンド | Beamの状態を格納する状態バックエンド。「rocksdb」または「filesystem」を使用します。 | |
状態バックエンドファクトリ | ストリーミングモードで使用する状態バックエンドファクトリを設定します。デフォルトは、Flinkクラスターのstate.backend設定です。 | |
状態バックエンドストレージパス | 状態バックエンドデータを永続化するための状態バックエンドパス。状態バックエンドを初期化するために使用されます。 | |
非アライメントチェックポイントの有効化 | 設定されている場合、非アライメントチェックポイントは、チェックポイント状態の一部として処理中のデータ(バッファーに格納されているデータ)を含み、チェックポイントバリアがこれらのバッファーを追い越すことができます。したがって、チェックポイントバリアは事実上データストリームに埋め込まれなくなるため、チェックポイント期間は現在のスループットとは無関係になります。 | デフォルト: `false` |
復元されていない状態の許可 | セーブポイントにパイプラインに含まれなくなったオペレーターの状態が含まれている場合に、復元されていない状態を許可するかどうかを示すフラグ。 | デフォルト: `false` |
アタッチモード | パイプラインをアタッチモードまたはデタッチモードのどちらで送信するかを指定します。 | デフォルト: `true` |
自動バランス書き込みファイルシャーディング有効 | WriteFiles変換の自動バランスシャーディングを有効にするかどうかを示すフラグ。これは、パイプラインが多数のイベントをファイル(通常はN個のシャードに分割)に書き込む必要があるストリーミングユースケースで役立つ場合があります。Flinkのデフォルトの動作では、一部のワーカーが他のワーカーよりも多くのシャードを処理することになります。これにより、ワーカーの処理バックログとメモリ使用量のバランスが崩れます。この機能を有効にすると、シャードが使用可能なワーカー間で均等に分散され、スループットとメモリ使用量の安定性が向上します。 | デフォルト: `false` |
自動ウォーターマーク間隔 | 自動ウォーターマーク放出の間隔(ミリ秒)。 | |
チェックポイントタイムアウト(ミリ秒) | チェックポイントが破棄されるまでの最大時間(ミリ秒)。 | デフォルト: -1 |
チェックポイント間隔 | 実行中のパイプラインのチェックポイントをトリガーする間隔(ミリ秒)。デフォルト:チェックポイントなし。 | デフォルト: -1 |
チェックポイントモード | 整合性保証を定義するチェックポイントモード。 | デフォルト: EXACTLY_ONCE |
メトリクスの無効化 | Flink RunnerでBeamメトリクスを無効にする | デフォルト: `false` |
安定した入力ドレインの有効化 | RequiresStableInput演算子を含むFlinkパイプラインのドレイン操作を許可します。ドレイン時に、DoFn演算子に処理関連の障害が発生した場合、RequiresStableInputコントラクトに違反する可能性があることに注意してください。 | デフォルト: `false` |
バッチ実行モード | バッチパイプラインのデータ交換のためのFlinkモード。{@link org.apache.flink.api.common.ExecutionMode}を参照してください。パイプラインがブロックされる場合は、BATCH_FORCEDに設定してください。https://issues.apache.org/jira/browse/FLINK-10672 を参照してください。 | デフォルト: PIPELINED |
実行再試行遅延 | 実行間の遅延をミリ秒単位で設定します。値が{@code -1}の場合、デフォルト値が使用されます。 | デフォルト: -1 |
外部チェックポイント有効 | 外部チェックポイントを有効または無効にします。CheckpointingIntervalと連携して動作します。 | デフォルト: `false` |
チェックポイントエラー時の失敗 | チェックポイント手順でエラーが発生した場合のタスクの予期される動作を設定します。これがtrueに設定されている場合、タスクはチェックポイントエラーで失敗します。これがfalseに設定されている場合、タスクはチェックポイントを拒否して実行を続行します。 | デフォルト: `true` |
高速コピー | 演算子間の不要なディープコピーを削除します。https://issues.apache.org/jira/browse/BEAM-11146 を参照してください。 | デフォルト: `false` |
ファイル入力分割最大サイズMB | ファイルシステムからデータを読み取るときの入力分割の最大サイズを設定します。0は最大サイズがないことを意味します。 | デフォルト: 0 |
チェックポイント前のバンドル完了 | 設定されている場合、現在のバンドルを終了し、演算子の状態をチェックポイントする前にすべての出力をフラッシュします。デフォルトでは、すぐにチェックポイントを開始し、残りのバンドル出力をチェックポイントの一部としてバッファリングします。この設定は、チェックポイントのアライメントに影響を与える可能性があります。 | デフォルト: `false` |
Flink設定ディレクトリ | Flink YAML設定ファイルを含むディレクトリ。これらのプロパティは、Flinkに送信されるすべてのジョブに設定され、FLINK_CONF_DIRの設定よりも優先されます。 | |
Flinkマスター | パイプラインを実行する必要があるFlinkマスターのアドレス。"host:port"の形式、または特別な値[local]、[collection]、[auto]のいずれかです。 | デフォルト: [auto] |
強制非アライメントチェックポイント有効 | 非アライメントチェックポイントを強制し、特に反復ジョブで許可します。 | デフォルト: `false` |
ジョブチェック間隔(秒) | デタッチモードでwaitUntilFinishメソッドのジョブチェック間隔を秒単位で設定します。デフォルトは5秒です。 | デフォルト: 5 |
レイテンシ追跡間隔 | ソースからシンクにレイテンシ追跡マークを送信する間隔(ミリ秒)。間隔値<= 0は機能を無効にします。 | デフォルト: 0 |
最大バンドルサイズ | バンドル内の要素の最大数。デフォルト値は、ストリーミングジョブの場合は1000、バッチの場合は1,000,000です。 | デフォルト: MaxBundleSizeFactory |
最大バンドル時間(ミリ秒) | バンドルを完了するまで待機する最大時間(ミリ秒)。デフォルト値は、ストリーミングの場合は1000、バッチの場合は10,000です。 | デフォルト: MaxBundleTimeFactory |
最大並列度 | 使用するパイプライン全体の最大並列度。最大並列度は、動的スケーリングの上限と、パーティション化された状態に使用されるキーグループの数を指定します。 | デフォルト: -1 |
チェックポイント間の最小一時停止 | 次のチェックポイントがトリガーされるまでの最小一時停止(ミリ秒)。 | デフォルト: -1 |
同時チェックポイント数 | 同時チェックポイントの最大数。デフォルトは1(=同時チェックポイントなし)です。 | デフォルト: 1 |
実行再試行回数 | 失敗したタスクを再実行する回数を設定します。値がゼロの場合、フォールトトレランスが事実上無効になります。値が-1の場合、システムのデフォルト値(構成で定義されているとおり)が使用されます。 | デフォルト: -1 |
オブジェクト再利用 | オブジェクトの再利用の動作を設定します。 | デフォルト: `false` |
演算子連結 | 演算子の連結の動作を設定します。 | デフォルト: `true` |
並列度 | 操作をワーカーに分散するときに使用される並列度。並列度が設定されていない場合、構成されたFlinkのデフォルトが使用されます。見つからない場合は1が使用されます。 | デフォルト: -1 |
反復可能GroupBykey結果 | GBKの結果を反復可能にする必要があるかどうかを示すフラグ。反復可能な結果は、現在ディスクへのスピルをサポートしていないため、単一のキーのすべての値がメモリに収まる必要があることを意味します。 | デフォルト: `false` |
チェックポイント期間レポート | nullでない場合、指定されたメトリック名前空間で各ParDoステージのチェックポイント期間を報告します。 | |
キャンセル時の外部チェックポイント保持 | キャンセル時の外部チェックポイントの動作を設定します。 | デフォルト: `false` |
セーブポイントパス | セーブポイントの復元パス。指定されている場合、指定されたパスからストリーミングパイプラインを復元します。 | |
アイドル状態後のソースシャットダウン(ミリ秒) | 構成されたミリ秒の時間アイドル状態であったソースをシャットダウンします。ソースがシャットダウンされると、チェックポイントはできなくなります。すべての入力が処理されると、ソースのシャットダウンは最終的にパイプラインのシャットダウン(= Flinkジョブの終了)につながります。明示的に設定しない限り、チェックポイントが有効になっている場合はLong.MAX_VALUEに、チェックポイントが無効になっている場合は0にデフォルト設定されます。この問題の進捗状況については、https://issues.apache.org/jira/browse/FLINK-2491を参照してください。 | デフォルト: -1 |
状態バックエンド | Beamの状態を格納する状態バックエンド。「rocksdb」または「filesystem」を使用します。 | |
状態バックエンドファクトリ | ストリーミングモードで使用する状態バックエンドファクトリを設定します。デフォルトは、Flinkクラスターのstate.backend設定です。 | |
状態バックエンドストレージパス | 状態バックエンドデータを永続化するための状態バックエンドパス。状態バックエンドを初期化するために使用されます。 | |
非アライメントチェックポイント有効 | 設定されている場合、非アライメントチェックポイントは、チェックポイント状態の一部として処理中のデータ(バッファーに格納されているデータ)を含み、チェックポイントバリアがこれらのバッファーを追い越すことができます。したがって、チェックポイントバリアは事実上データストリームに埋め込まれなくなるため、チェックポイント期間は現在のスループットとは無関係になります。 | デフォルト: `false` |
一般的なBeamパイプラインオプションについては、PipelineOptionsリファレンスを参照してください。
Flinkのバージョン互換性
Flinkクラスタのバージョンは、FlinkRunnerで使用されているマイナーバージョンと一致する必要があります。マイナーバージョンは、バージョン文字列の最初の2つの数字です。たとえば、1.18.0
では、マイナーバージョンは1.18
です。
Beamのリリース時点で、Apache Flinkの最新バージョンを追跡するようにしています。Flinkバージョンは、Flinkコミュニティでサポートされている限り、Beamでサポートされています。Flinkコミュニティは、最新の2つのマイナーバージョンをサポートしています。 Flinkバージョンのサポートが終了すると、Beamからも非推奨になり、削除される場合があります。Beamと互換性のあるFlinkのバージョンを確認するには、以下の表を参照してください。
Flinkバージョン | アーティファクトID | サポートされているBeamバージョン |
---|---|---|
1.19.x | beam-runners-flink-1.19 | ≥ 2.61.0 |
1.18.x | beam-runners-flink-1.18 | ≥ 2.57.0 |
1.17.x | beam-runners-flink-1.17 | ≥ 2.56.0 |
1.16.x | beam-runners-flink-1.16 | 2.47.0 - 2.60.0 |
1.15.x | beam-runners-flink-1.15 | 2.40.0 - 2.60.0 |
1.14.x | beam-runners-flink-1.14 | 2.38.0 - 2.56.0 |
1.13.x | beam-runners-flink-1.13 | 2.31.0 - 2.55.0 |
1.12.x | beam-runners-flink-1.12 | 2.27.0 - 2.55.0 |
1.11.x | beam-runners-flink-1.11 | 2.25.0 - 2.38.0 |
1.10.x | beam-runners-flink-1.10 | 2.21.0 - 2.30.0 |
1.9.x | beam-runners-flink-1.9 | 2.17.0 - 2.29.0 |
1.8.x | beam-runners-flink-1.8 | 2.13.0 - 2.29.0 |
1.7.x | beam-runners-flink-1.7 | 2.10.0 - 2.20.0 |
1.6.x | beam-runners-flink-1.6 | 2.10.0 - 2.16.0 |
1.5.x | beam-runners-flink_2.11 | 2.6.0 - 2.16.0 |
1.4.x Scala 2.11版 | beam-runners-flink_2.11 | 2.3.0 - 2.5.0 |
1.3.x Scala 2.10版 | beam-runners-flink_2.10 | 2.1.x - 2.2.0 |
1.2.x Scala 2.10版 | beam-runners-flink_2.10 | 2.0.0 |
適切なFlinkバージョンの取得については、Flinkダウンロードページを参照してください。
詳細については、Flinkドキュメントが役立ちます。
Beamの機能
Beam機能マトリクスには、従来のFlink Runnerの機能が記載されています。
ポータブル機能マトリクスには、ポータブルFlink Runnerの機能が記載されています。
最終更新日:2024/10/31
お探しのものはすべて見つかりましたか?
すべて役に立ち、明確でしたか?変更したいことはありますか?お知らせください!