Beam SDK for Python の依存関係
このページでは、Apache Beam Python SDK の依存関係について説明します。
パイプラインに追加の依存関係が必要な場合は、Python パイプラインの依存関係の管理を参照してください。
Apache Beam Python SDK の依存関係は、Beam リポジトリの setup.py ファイルで定義されています。それらを表示するには、次の手順を実行します。
setup.pyを開きます。https://github.com/apache/beam/blob/release-<VERSION_NUMBER>/sdks/python/setup.py<VERSION_NUMBER>を SDK の major.minor.patch バージョンに置き換えます。たとえば、https://github.com/apache/beam/blob/release-2.60.0/sdks/python/setup.py は、2.60.0 リリースの依存関係を提供します。REQUIRED_PACKAGESの下にあるコア依存関係リストを確認します。注:
gcpやdataframeなど、追加機能が必要な場合は、extras_requireのリストで追加の依存関係を確認してください。
次の手順を使用して、コマンドラインから依存関係リストを取得することもできます。
サポートされている Python バージョンを使用して、ローカルマシンにクリーンな仮想環境を作成します。
$ python3 -m venv env && source ./env/bin/activate && pip install --upgrade pip setuptools wheel依存関係のリストを取得します。
$ pip install pipdeptree && pipdeptree -p apache-beam
docker をインストールしている場合は、Beam Python SDK コンテナイメージにプリインストールされている依存関係を、イメージからコンテナを作成することで調べることができます。例:docker run --rm -it --entrypoint=/bin/sh apache/beam_python3.10_sdk:2.55.0 -c "pip list"。
Beam コンテナにインストールされている依存関係のリストは、対応する Beam リリースブランチと Python マイナーバージョンの Beam リポジトリの base_image_requirements.txt ファイルにもあります。

