Beam SDK for Python の依存関係
このページでは、Apache Beam Python SDK の依存関係について説明します。
パイプラインに追加の依存関係が必要な場合は、Python パイプラインの依存関係の管理を参照してください。
Apache Beam Python SDK の依存関係は、Beam リポジトリの setup.py
ファイルで定義されています。それらを表示するには、次の手順を実行します。
setup.py
を開きます。https://github.com/apache/beam/blob/release-<VERSION_NUMBER>/sdks/python/setup.py
<VERSION_NUMBER>
を SDK の major.minor.patch バージョンに置き換えます。たとえば、https://github.com/apache/beam/blob/release-2.60.0/sdks/python/setup.py は、2.60.0 リリースの依存関係を提供します。REQUIRED_PACKAGES
の下にあるコア依存関係リストを確認します。注:
gcp
やdataframe
など、追加機能が必要な場合は、extras_require
のリストで追加の依存関係を確認してください。
次の手順を使用して、コマンドラインから依存関係リストを取得することもできます。
サポートされている Python バージョンを使用して、ローカルマシンにクリーンな仮想環境を作成します。
$ python3 -m venv env && source ./env/bin/activate && pip install --upgrade pip setuptools wheel
依存関係のリストを取得します。
$ pip install pipdeptree && pipdeptree -p apache-beam
docker
をインストールしている場合は、Beam Python SDK コンテナイメージにプリインストールされている依存関係を、イメージからコンテナを作成することで調べることができます。例:docker run --rm -it --entrypoint=/bin/sh apache/beam_python3.10_sdk:2.55.0 -c "pip list"
。
Beam コンテナにインストールされている依存関係のリストは、対応する Beam リリースブランチと Python マイナーバージョンの Beam リポジトリの base_image_requirements.txt
ファイルにもあります。