Java 変換カタログの概要

要素単位

変換説明
フィルタ述語が与えられた場合、述語を満たさないすべての要素を除外します。
FlatMapElementsコレクションを返す関数を入力の各要素に適用し、結果のすべての要素を出力します。
キーキーと値のペアのコレクションの各要素からキーを抽出します。
KvSwapキーと値のペアのコレクションの各要素のキーと値を入れ替えます。
MapElements関数を入力の各要素に適用し、結果を出力します。
ParDoユーザー定義の `DoFn` を入力コレクションのすべての要素に適用するための最も一般的なメカニズムです。
Partition何らかの分割関数に基づいて、各入力要素を特定の出力コレクションにルーティングします。
正規表現正規表現に基づいて入力文字列要素をフィルタリングします。一致するグループに基づいて変換することもできます。
ReifyさまざまなBeam値の明示的な形式と暗黙的な形式を変換するための変換。
文字列に変換入力コレクションのすべての要素を文字列に変換します。
キー付き入力コレクションの各要素をキーと値のペアに変換したものを含むコレクションを作成します。キーは、入力要素に関数を適用することによって選択されます。
タイムスタンプ付き出力コレクションの各要素にタイムスタンプを決定する関数を適用し、各入力に関連付けられた暗黙のタイムスタンプを更新します。タイムスタンプは前方調整のみが安全です。
キーと値のペアのコレクションの各要素から値を抽出します。

集計

変換説明
近似分位数近似アルゴリズムを使用して、指定された数の分位数を使用して各集計内のデータ分布を推定します。
近似ユニーク近似アルゴリズムを使用して、各集計内のユニーク要素の数を推定します。
CoGroupByKey`GroupByKey`に似ていますが、各キーに関連付けられた値を指定されたサイズにバッチ処理します。
Combine提供された `CombineFn` に従って要素を結合する変換。
コンテキスト付き結合サイド入力やその他のコンテキストへのアクセスを許可する、Combineの拡張バージョン。
カウント各集計内の要素の数をカウントします。
重複排除入力コレクションから重複しない要素を含むコレクションを作成します。
GroupByKeyキー付き要素のコレクションを取得し、各要素がキーとそのキーに関連付けられたすべての値で構成されるコレクションを作成します。
バッチへのグループ化キーに関連付けられた値を、ある程度のサイズの `Iterable` バッチにバッチ処理します。各バッチには、特定のキーに関連付けられた要素が含まれています。
HllCountHyperLogLog ++アルゴリズムを使用して、個別の要素の数を推定し、再集計可能なスケッチを作成します。
最新暗黙のタイムスタンプに従って、各集計内で最新の要素を選択します。
最大各集計内で最大の要素を出力します。
平均各集計内の平均を計算します。
最小各集計内で最小の要素を出力します。
サンプリング各集計からいくつかの要素をランダムに選択します。
合計各集計内の要素の合計を計算します。
上位各集計内で最大の要素を計算します。

その他

変換説明
作成メモリ内リストからコレクションを作成します。
Flatten複数の入力コレクションが与えられた場合、すべての入力コレクションのすべての要素を含む単一の出力コレクションを作成します。
PAssertローカルまたはランナーを使用してパイプラインをテストする際に使用される `PCollection` の内容をアサートする変換。
ビューコレクションを `ParDo` へのサイド入力として使用できるビューに変換する操作。
ウィンドウ提供された `WindowFn` に従って、コレクションの要素を有限ウィンドウに論理的に分割またはグループ化します。