要素単位
| 変換 | 説明 |
|---|
| フィルタ | 述語が与えられた場合、述語を満たさないすべての要素を除外します。 |
| FlatMapElements | コレクションを返す関数を入力の各要素に適用し、結果のすべての要素を出力します。 |
| キー | キーと値のペアのコレクションの各要素からキーを抽出します。 |
| KvSwap | キーと値のペアのコレクションの各要素のキーと値を入れ替えます。 |
| MapElements | 関数を入力の各要素に適用し、結果を出力します。 |
| ParDo | ユーザー定義の `DoFn` を入力コレクションのすべての要素に適用するための最も一般的なメカニズムです。 |
| Partition | 何らかの分割関数に基づいて、各入力要素を特定の出力コレクションにルーティングします。 |
| 正規表現 | 正規表現に基づいて入力文字列要素をフィルタリングします。一致するグループに基づいて変換することもできます。 |
| Reify | さまざまなBeam値の明示的な形式と暗黙的な形式を変換するための変換。 |
| 文字列に変換 | 入力コレクションのすべての要素を文字列に変換します。 |
| キー付き | 入力コレクションの各要素をキーと値のペアに変換したものを含むコレクションを作成します。キーは、入力要素に関数を適用することによって選択されます。 |
| タイムスタンプ付き | 出力コレクションの各要素にタイムスタンプを決定する関数を適用し、各入力に関連付けられた暗黙のタイムスタンプを更新します。タイムスタンプは前方調整のみが安全です。 |
| 値 | キーと値のペアのコレクションの各要素から値を抽出します。 |
集計
| 変換 | 説明 |
|---|
| 近似分位数 | 近似アルゴリズムを使用して、指定された数の分位数を使用して各集計内のデータ分布を推定します。 |
| 近似ユニーク | 近似アルゴリズムを使用して、各集計内のユニーク要素の数を推定します。 |
| CoGroupByKey | `GroupByKey`に似ていますが、各キーに関連付けられた値を指定されたサイズにバッチ処理します。 |
| Combine | 提供された `CombineFn` に従って要素を結合する変換。 |
| コンテキスト付き結合 | サイド入力やその他のコンテキストへのアクセスを許可する、Combineの拡張バージョン。 |
| カウント | 各集計内の要素の数をカウントします。 |
| 重複排除 | 入力コレクションから重複しない要素を含むコレクションを作成します。 |
| GroupByKey | キー付き要素のコレクションを取得し、各要素がキーとそのキーに関連付けられたすべての値で構成されるコレクションを作成します。 |
| バッチへのグループ化 | キーに関連付けられた値を、ある程度のサイズの `Iterable` バッチにバッチ処理します。各バッチには、特定のキーに関連付けられた要素が含まれています。 |
| HllCount | HyperLogLog ++アルゴリズムを使用して、個別の要素の数を推定し、再集計可能なスケッチを作成します。 |
| 最新 | 暗黙のタイムスタンプに従って、各集計内で最新の要素を選択します。 |
| 最大 | 各集計内で最大の要素を出力します。 |
| 平均 | 各集計内の平均を計算します。 |
| 最小 | 各集計内で最小の要素を出力します。 |
| サンプリング | 各集計からいくつかの要素をランダムに選択します。 |
| 合計 | 各集計内の要素の合計を計算します。 |
| 上位 | 各集計内で最大の要素を計算します。 |
その他
| 変換 | 説明 |
|---|
| 作成 | メモリ内リストからコレクションを作成します。 |
| Flatten | 複数の入力コレクションが与えられた場合、すべての入力コレクションのすべての要素を含む単一の出力コレクションを作成します。 |
| PAssert | ローカルまたはランナーを使用してパイプラインをテストする際に使用される `PCollection` の内容をアサートする変換。 |
| ビュー | コレクションを `ParDo` へのサイド入力として使用できるビューに変換する操作。 |
| ウィンドウ | 提供された `WindowFn` に従って、コレクションの要素を有限ウィンドウに論理的に分割またはグループ化します。 |
最終更新日:2024/10/31
お探しのものはすべて見つかりましたか?
すべて役に立ち、明確でしたか?変更したいことはありますか?お知らせください!