重複排除

入力コレクションの重複しない要素を含むコレクションを生成します。
データセットによっては、各キーの重複しない値を決定することもできるApproximateUnique
を使用して、近似解を計算する方が効率的な場合があります。
例
例1: String
のPCollection
から重複しない要素を検索します。
static final String[] WORDS_ARRAY = new String[]{
"hi", "hi", "sue",
"sue", "bob"
};
static final List<String> WORDS = Arrays.asList(WORDS_ARRAY);
PCollection<String> input =
pipeline.apply(Create.of(WORDS)).withCoder(StringUtf8Coder.of());
PCollection<String> distinctWords = input.apply(Distinct.create());
例2: Integer
のPCollection
から重複しない要素を検索します。
関連する変換
- Countは、各集計内の要素の数をカウントします。
- ApproximateUniqueは、コレクション内の重複しない要素の数を推定します。
最終更新日:2024/10/31
探していたものはすべて見つかりましたか?
すべて有用で明確でしたか?何か変更したい点はありますか?ぜひお知らせください!