ブログ & リリース
2023/05/10
Apache Beam 2.47.0
Beamの新しい2.47.0リリースを発表できることを嬉しく思います。このリリースには、改善と新機能の両方が含まれています。このリリースのダウンロードページをご覧ください。
2.47.0の変更の詳細については、詳細なリリースノートを確認してください。
ハイライト
- Apache BeamにPython 3.11のサポートが追加されました(#23848)。
I/O
- BigQuery Storage Write APIが、クロスランゲージ経由でPython SDKで利用できるようになりました(#21961)。
- Hbase(Java)へのRowMutations(rowkeyで順序付け)の書き込みをサポートするHbaseIOを追加しました(#25830)。
- fileioトランスフォームMatchFiles、MatchAll、ReadMatches(Go)を追加しました(#25779)。
- JmsIOの統合テストを追加し、複数接続の問題を修正しました(Java)(#25887)。
新機能/改善点
- FlinkランナーがFlink 1.16.xをサポートするようになりました(#25046)。
- スキーマ化されたPTransformsを、PCollectionsと同様にBeamデータフレームに直接適用できるようになりました。(複数の操作を行う場合は、過剰な変換を避けるために、`df | (Transform1 | Transform2 | ...)`のように操作を明示的に連結する方が効率的な場合があることに注意してください。)
- Go SDKに、side inputパターンをゆっくりと更新するためのサポートを拡張する新しいトランスフォームperiodic.Impulseとperiodic.Sequenceが追加されました。(#23106)
- Python SDKの依存関係チェーンにあるいくつかのGoogleクライアントライブラリが、利用可能な最新のメジャーバージョンに更新されました。(#24599)
破壊的な変更
- メインセッションのロードに失敗した場合、パイプラインはワーカーの起動時に失敗するようになりました。(#25401)。
- Pythonパイプラインオプションは、単一のダッシュで始まる解析されていないコマンドラインフラグを無視するようになりました。(#25943)。
- SmallestPerKeyコンバイナーは、オプションのパラメーター(`key`や`reverse`など)を指定するために、キーワードのみの引数が必要になりました。(#25888)。
非推奨
- Google Cloud Debuggerサービスの停止に対応して、Cloud Debuggerのサポートとそのパイプラインオプションは非推奨となり、次のBeamバージョンで削除されます。(Java)(#25959)。
バグ修正
- バッチパイプラインのSTORAGE_WRITE_APIモードのBigQueryシンクでは、Beam SDK 2.35.0〜2.46.0(両端を含む)のその他の無関係な一時的なエラーの処理中に、データの一貫性の問題が発生する可能性があります。詳細については、https://github.com/apache/beam/issues/26521を参照してください。
既知の問題
- autoUpdateSchemaを使用したBigQueryIO Storage API書き込みは、Beam SDK 2.45.0〜2.47.0(両端を含む)でデータの破損を引き起こす可能性があります(#26789)。
- 長時間実行されるPythonパイプラインでメモリリークが発生する可能性があります:#28246。
貢献者リスト
git shortlogによると、次の人々が2.47.0リリースに貢献しました。貢献者の皆様に感謝します!
Ahmed Abualsaud
Ahmet Altay
Alexey Romanenko
Amir Fayazi
Amrane Ait Zeouay
Anand Inguva
Andrew Pilloud
Andrey Kot
Bjorn Pedersen
Bruno Volpato
Buqian Zheng
Chamikara Jayalath
ChangyuLi28
Damon
Danny McCormick
Dmitry Repin
George Ma
Jack Dingilian
Jack McCluskey
Jasper Van den Bossche
Jeremy Edwards
Jiangjie (Becket) Qin
Johanna Öjeling
Juta Staes
Kenneth Knowles
Kyle Weaver
Mattie Fu
Moritz Mack
Nick Li
Oleh Borysevych
Pablo Estrada
Rebecca Szper
Reuven Lax
Reza Rokni
Ritesh Ghorse
Robert Bradshaw
Robert Burke
Saadat Su
Saifuddin53
Sam Rohde
Shubham Krishna
Svetak Sundhar
Theodore Ni
Thomas Gaddy
Timur Sultanov
Udi Meiri
Valentyn Tymofieiev
Xinyu Liu
Yanan Hao
Yi Hu
Yuvi Panda
andres-vv
bochap
dannikay
darshan-sj
dependabot[bot]
harrisonlimh
hnnsgstfssn
jrmccluskey
liferoad
tvalentyn
xianhualiu
zhangskz