Beam SDK for Python の依存関係

このページでは、Apache Beam Python SDK の依存関係について説明します。

パイプラインに追加の依存関係が必要な場合は、Python パイプラインの依存関係の管理を参照してください。

Apache Beam Python SDK の依存関係は、Beam リポジトリの setup.py ファイルで定義されています。それらを表示するには、次の手順を実行します。

  1. setup.py を開きます。

    https://github.com/apache/beam/blob/release-<VERSION_NUMBER>/sdks/python/setup.py
    

    <VERSION_NUMBER> を SDK の major.minor.patch バージョンに置き換えます。たとえば、https://github.com/apache/beam/blob/release-2.60.0/sdks/python/setup.py は、2.60.0 リリースの依存関係を提供します。

  2. REQUIRED_PACKAGES の下にあるコア依存関係リストを確認します。

    注: gcpdataframe など、追加機能が必要な場合は、extras_require のリストで追加の依存関係を確認してください。

次の手順を使用して、コマンドラインから依存関係リストを取得することもできます。

  1. サポートされている Python バージョンを使用して、ローカルマシンにクリーンな仮想環境を作成します。

    $ python3 -m venv env && source ./env/bin/activate && pip install --upgrade pip setuptools wheel
    
  2. Beam Python SDK をインストールします。.

  3. 依存関係のリストを取得します。

    $ pip install pipdeptree && pipdeptree -p apache-beam
    

docker をインストールしている場合は、Beam Python SDK コンテナイメージにプリインストールされている依存関係を、イメージからコンテナを作成することで調べることができます。例:docker run --rm -it --entrypoint=/bin/sh apache/beam_python3.10_sdk:2.55.0 -c "pip list"

Beam コンテナにインストールされている依存関係のリストは、対応する Beam リリースブランチと Python マイナーバージョンの Beam リポジトリbase_image_requirements.txt ファイルにもあります。