要素ごと
変換 | 説明 |
---|
エンリッチメント | リモートサービスを使用してデータエンリッチメントを実行します。 |
フィルタ | 述語が指定された場合、述語を満たさないすべての要素を除外します。 |
FlatMap | コレクションを返す関数を入力の各要素に適用し、結果のすべての要素を出力します。 |
キー | キーと値のペアのコレクションの各要素からキーを抽出します。 |
KvSwap | キーと値のペアのコレクションの各要素のキーと値を入れ替えます。 |
マップ | 関数を入力の各要素に適用し、結果を出力します。 |
MLTransform | データセットにデータ処理変換を適用します。 |
ParDo | ユーザー定義の `DoFn` を入力コレクションのすべての要素に適用するための最も一般的なメカニズムです。 |
Partition | 何らかの分割関数に基づいて、各入力要素を特定の出力コレクションにルーティングします。 |
正規表現 | 正規表現に基づいて入力文字列要素をフィルタリングします。一致するグループに基づいて変換することもできます。 |
具体化 | さまざまなBeam値の明示的な形式と暗黙的な形式の間で変換するための変換。 |
RunInference | 機械学習(ML)モデルを使用して、ローカルおよびリモート推論を実行します。 |
文字列化 | 入力コレクションのすべての要素を文字列に変換します。 |
タイムスタンプ付き | 出力コレクションの各要素にタイムスタンプを決定する関数を適用し、各入力に関連付けられた暗黙的なタイムスタンプを更新します。タイムスタンプは前方調整のみ安全です。 |
値 | キーと値のペアのコレクションの各要素から値を抽出します。 |
集計
変換 | 説明 |
---|
近似分位数 | 分布が与えられた場合、おおよそのNタイルを見つけます。 |
近似ユニーク数 | pcollectionが与えられた場合、推定ユニーク要素数を返します。 |
要素のバッチ化 | 償却処理のために要素をバッチ化する変換。 |
CoGroupByKey | キー付き要素の複数のコレクションを取得し、各要素がキーと、そのキーに関連付けられたすべての値で構成されるコレクションを生成します。 |
全体結合 | 要素を結合するための変換。 |
キーごとの結合 | 各キーの要素を結合するための変換。 |
値の結合 | キー付き反復可能オブジェクトを結合するための変換。 |
カウント | 各集計内の要素の数をカウントします。 |
重複除去 | 入力コレクションから個別の要素を含むコレクションを生成します。 |
GroupByKey | キー付き要素のコレクションを取得し、各要素がキーと、そのキーに関連付けられたすべての値で構成されるコレクションを生成します。 |
グループ化 | 要素のコレクションを取得し、それらの要素のプロパティによってグループ化されたコレクションを生成します。 GroupByKeyとは異なり、キーは要素自体から動的に作成されます。 |
バッチへのグループ化 | 入力を目的のバッチサイズにバッチ化します。 |
最新 | 最新のタイムスタンプを持つ要素を取得します。 |
最大 | 各集計内で最大値を持つ要素を取得します。 |
平均 | 各集計内の平均値を計算します。 |
最小 | 各集計内で最小値を持つ要素を取得します。 |
サンプリング | 各集計からいくつかの要素をランダムに選択します。 |
合計 | 各集計内のすべての要素を合計します。 |
リスト化 | すべての要素を単一のリストに集約します。 |
上位 | 各集計内で最大の要素を計算します。 |
その他
変換 | 説明 |
---|
作成 | メモリ内リストからコレクションを作成します。 |
Flatten | 複数の入力コレクションが与えられた場合、すべての入力コレクションのすべての要素を含む単一の出力コレクションを生成します。 |
再シャッフル | 入力コレクションが与えられた場合、ワーカー間で要素を再配布します。これは、並列性を調整したり、結合された障害を防ぐのに最も役立ちます。 |
ウィンドウ分割 | 関数に従って、コレクションの要素を論理的に分割またはグループ化して有限ウィンドウにします。 |
最終更新日:2024/10/31
お探しのものはすべて見つかりましたか?
すべて役に立ち、明確でしたか?変更したいことはありますか?お知らせください!