学習リソース

学習リソースへようこそ。このページには、Apache Beamを使い始めるのに役立つリソースのコレクションが含まれています。初めての方は、ガイド付きツアーとしてご利用いただけます。そうでない場合は、関心のあるセクションに直接ジャンプできます。

ここに掲載してほしい追加資料がある場合は、user@beam.apache.orgまでお知らせください。

はじめに

クイックスタート

基本の学習

基礎

共通パターン

記事

データ分析

データ移行

機械学習

高度な概念

動画

コース

書籍

Apache Beamを使用したビッグデータパイプラインの構築

Apache Beamを使用したビッグデータパイプラインの構築 JanLukavský著、Packt。(2022年1月)。主題の確かな理解を深めるための徐々に構築された例を含む、Apache Beamモデルの一般的な説明。最初の部分では、本書ではJava SDK、次にSQL DSLと移植性レイヤーを使用して概念を説明し、Python SDKに焦点を当てています。本書の最後の部分は、Splittable DoFnを使用したIOコネクタや、一般的なランナーがパイプラインを実行する方法の説明など、より高度なトピックに特化しています。

ストリーミングシステム:大規模データ処理の定義、場所、タイミング、方法

ストリーミングシステム:大規模データ処理のWhat、Where、When、そしてHow Tyler Akidau、Slava Chernyak、Reuven Lax著。(2018年8月)。Tyler Akidauの人気ブログ記事「Streaming 101」と「Streaming 102」を拡張した本書は、リアルタイムデータストリームの処理について、入門レベルから深い理解へと導きます。

資格

Apache Beam Quest入門

Apache Beam入門 このクエストには、Apache Beamパイプラインの作成とテスト方法を学ぶための4つのラボが含まれています。3つのラボはJavaを使用し、1つはPythonを使用します。各ラボの完了には約1.5時間かかります。クエストを完了すると、Beamの専門知識を示すために使用できるバッジが付与されます。

インタラクティブラボ

Java

Python

Beam Katas

Beam Katasは、Apache Beamの概念とプログラミングモデルを実際に学ぶのに役立つ、インタラクティブなBeamコーディング演習(コードカタ)です。JetBrains Educational Productsに基づいて構築されたBeam Katasの目的は、学習者が徐々に複雑になる演習を解くことにより、Apache BeamとそのSDKについて理解するための、一連の体系的な実践学習体験を提供することです。Beam Katasは、JavaとPythonの両方のSDKで利用できます。

Java

Python

コード例

Dataflowクックブック

クックブックには、Java、Python、Scala(Scio経由)の例が含まれており、すぐに起動できる自己完結型のBeamパイプラインを提供します。

Java

Python

Beam Playground

APIリファレンス

フィードバックと提案

私たちはフィードバックと提案を歓迎します。お問い合わせページで、コミュニティに連絡するためのさまざまな方法を見つけることができます。

バグレポートがある場合、または新機能を提案したい場合は、新しい issue を提出することでお知らせください。

貢献する方法

私たちはすべての人からの貢献を歓迎します!貢献方法の詳細については、貢献ガイドをご覧ください。