Apache Beam 2.36.0

Apache Beamの新しい2.36.0リリースを発表できることを嬉しく思います。このリリースには、改良と新機能の両方が含まれています。このリリースのダウンロードページをご覧ください。

2.36.0での変更の詳細については、詳細なリリースノートをご覧ください。

I/O

  • KafkaIO SDF(Java)でのstopReadTimeのサポート。(BEAM-13171)。

新機能/改良点

  • 💻 ARM64/Mac M1のすぐに使えるサポート。(BEAM-11703)。
  • Python SDKのピクルライブラリとしてcloudpickleのサポートを追加(BEAM-8123)。cloudpickleを使用するには、パイプラインオプションを設定します:–pickle_library=cloudpickle
  • BigQueryへのストリーミング時のトリガー頻度を指定するオプションを追加(Python)(BEAM-12865)。
  • Python Dataflowジョブのジョブ実行間でアップロードされたアーティファクトのキャッシングを有効にするオプションを追加(BEAM-13459)。有効にするには、パイプラインオプションを設定します:–enable_artifact_caching、これは今後のリリースではデフォルトで有効になります。

破壊的変更

  • Java RedisIOでjedisを3.xから4.xに更新しました。RedisIOを使用していてjedisを直接使用している場合は、このページを参照して更新してください。(BEAM-12092)。
  • SDK v2のAWS I/Oの`SqsMessage`のタイムスタンプフィールドのデータ型が`String`から`long`に変更され、すべてのフィールドの可視性が`package private`から`public`に修正されました。BEAM-13638
  • JavaでDoFn、タイマー、onWindowExpirationから出力される要素の出力タイムスタンプを適切にチェックします。BEAM-12931
  • 非タプルキーで使用した場合のDeferredDataFrame.xsのバグを修正しました(BEAM-13421)。
  • Beam Pythonでは、 अब `google-cloud-pubsub>=2.1.0` が必要です。`apache_beam.io.gcp.pubsub` のAPIサーフェスは変更されていませんが、PubSubクライアントを直接使用するコードを更新する必要がある場合があります。

既知の問題

  • 要素のタイムスタンプを出力する際に、allowedSkewを超えるタイムスタンプを出力しようとすると、予期しないjava.lang.ArithmeticExceptionが発生することがあります。これは、allowed DoFN skewをInteger.MAX_VALUEを超える値に設定した場合に発生します。
  • Python SDKでS3オブジェクトのメタデータ取得が壊れています(BEAM-13980
  • このバージョンに影響する未解決の問題の完全なリストについては、こちらをご覧ください。

貢献者一覧

git shortlogによると、以下の人々が2.36.0リリースに貢献しました。すべての貢献者に感謝します!

Ada Wong, Ahmet Altay, Alexander, Alexander Dahl, Alexandr Zhuravlev, Alexey Romanenko, AlikRodriguez, Anand Inguva, Andrew Pilloud, Andy Ye, Arkadiusz Gasiński, Artur Khanin, Arun Pandian, Aydar Farrakhov, Aydar Zainutdinov, AydarZaynutdinov, Benjamin Gonzalez, Brian Hulette, Chamikara Jayalath, Daniel Collins, Daniel Oliveira, Daniel Thevessen, Daniela Martín, David Hinkes, David Huntsperger, Emily Ye, Etienne Chauchot, Evan Galpin, Heejong Lee, Ilya, Ilya Kozyrev, In-Ho Yi, Jack McCluskey, Janek Bevendorff, Jarek Potiuk, Ke Wu, KevinGG, Kyle Hersey, Kyle Weaver, Luís Bianchin, Luke Cwik, Masato Nakamura, Matthias Baetens, Mehdi Drissi, Melissa Pashniak, Michel Davit, Miguel Hernandez, MiguelAnzoWizeline, Milena Bukal, Moritz Mack, Mostafa Aghajani, Nathan J Mehl, Niel Markwick, Ning Kang, Pablo Estrada, Pavel Avilov, Quentin Sommer, Reuben van Ammers, Reuven Lax, Ritesh Ghorse, Robert Bradshaw, Robert Burke, Ryan Thompson, Sam Whittle, Sayat, Sergei Lebedev, Sergey Kalinin, Steve Niemitz, Talat Uyarer, Thiago Nunes, Tianyang Hu, Tim Robertson, Valentyn Tymofieiev, Vitaly Ivanov, Yichi Zhang, Yiru Tang, Yu Feng, Yu ISHIKAWA, Zachary Houfek, blais, daria-malkova, daria.malkova, darshan-sj, dpcollins-google, emily, ewianda, johnjcasey, kileys, lam206, laraschmidt, mosche msbukal@google.com, tvalentyn