Apache Beam 2.6.0

Beamの新しい2.6.0リリースを発表できることを嬉しく思います。このリリースには、SQLと移植性の新機能など、複数の修正と新機能が含まれています。

また、リリースの自動化と継続的インテグレーションの修正にかなりの時間を費やしました。詳細については、リリースノートをご覧ください。

新機能 / 改善点

gRPC/Protobufのシェーディング

  • gRPC/protobufは、現在、ほとんどのApache Beam Javaモジュールでシェーディングされています。APIサーフェスでgRPC/protobufを公開する少数のモジュールは、依然として直接依存関係を維持しています。

Beam SQL

  • EXISTSおよびLIKE演算子のサポートが追加されました。
  • SUM()集計を実装しました。
  • CASE式の問題を修正しました。
  • 日付比較のサポートを追加しました。
  • LIMITに非有界データのサポートを追加しました。

移植性

  • タイマーとユーザー状態をサポートするための共有ライブラリが、ランナー統合に利用できるようになりました。
  • 移植性とコンテナ化されたSDKハーネスを使用して単一のマシンで動作するUniversal Local Runnerを追加しました。
  • Flink Runnerは、Job APIを使用したジョブを受け入れるようになりました。

IO

  • 有界SplittableDoFn(SDF)のサポートがすべてのランナーで利用できるようになりました(SDFは新しいI/OコネクタAPIです)。
  • HBaseIOは、有界SDFをサポートする最初のI/Oです(readAllを使用)。

SDK

  • Python AvroIOのパフォーマンスが向上しました。
  • Python AvroIOには、apache/avroの代わりにfastavroを使用するuse_fastavroオプションがあり、3〜6倍の高速化を実現します!

その他

  • さまざまな依存関係バージョンを更新しました。
  • 安定性、パフォーマンス、およびドキュメントの改善。

貢献者一覧

git shortlogによると、以下の39人が2.6.0リリースに貢献しました。すべての貢献者に感謝します!

Ahmet Altay、Alan Myrvold、Alexey Romanenko、Andrew Pilloud、Ankur Goenka、Boyuan Zhang、Charles Chen、cclauss、Daniel Oliveira、Elliott Brossard、Eric Beach、Etienne Chauchot、Eugene Kirpichov、Henning Rohde、Ismaël Mejía、Kai Jiang、Kasia、Kenneth Knowles、Luis Osa、Lukasz Cwik、Maria Garcia Herrero、Mark Liu、Matthias Feys、Pablo Estrada、Rafael Fernandez、Reuven Lax、Robert Bradshaw、Robert Burke、Robin Qiu、Ryan Williams、Scott Wegner、Rui Weng、Sergei Lebedev、Sindy Li、Thomas Weise、Udi Meiri、Valentyn Tymofieiev、XuMingmin、およびYifan Zou。