導入事例

Apache Beamは、今日の主要なプロジェクト、業界固有のユースケース、およびスタートアップを数多く支えています。

リアルタイムストリーム処理の革新:LinkedInでの1日あたり4兆件のイベント処理

Apache Beamは、LinkedInのストリーミングインフラストラクチャのバックボーンとして機能し、3,000以上のパイプラインを通じて1日あたり4兆件という驚異的なイベントをほぼリアルタイムで処理し、世界中の9億5000万人以上のメンバーからなるLinkedInの巨大なネットワークに対してパーソナライズされたエクスペリエンスを提供しています。Apache Beamの採用により、ユースケースに応じて2倍のコスト最適化、虐待のラベリングにかかる時間を数日から数分に短縮、ログインしたスクレイピングプロフィールの検出率が6%以上向上するなど、目覚ましい改善がもたらされました。

Bingfeng Xia
LinkedInのエンジニアリングマネージャー
Xinyu Liu
LinkedInのシニアスタッフエンジニア
詳細を見る 導入事例へ

OCTO Technologyの顧客向けの高性能かつ効率的なトランザクションデータ処理

Apache Beamを使用することで、OCTOはフランス最大の食料品小売業者の1つにおけるトランザクションデータ用のストリーミング処理への移行を加速しました。Apache Beamの強力な変換機能と堅牢なストリーミング機能を活用することで、インフラコストを5分の1に削減し、パフォーマンスを4倍に向上させました。ストリーミングApache Beamパイプラインは現在、毎日1億行以上を処理し、数百ギガバイトのトランザクションデータを1テラバイト以上の外部状態と合わせて3時間以内に集約します。これは、Apache Beamの制御された集約がなければ実現できなかったタスクです。

OCTO Technologyのデータエンジニアリングチーム
大規模小売顧客プロジェクト
詳細を見る 導入事例へ

HSBCでのApache Beamによる高性能な定量的リスク分析

HSBCはApache Beamを単なるデータ処理フレームワーク以上のものであると考えています。これは、HSBCのXVAパイプラインの100倍のスケーリングと2倍の高速化、市場投入までの時間を24倍に短縮し、モンテカルロシミュレーションを使用した将来シナリオのモデリングのためのデータ配布を簡素化し、予測と意思決定のための定量的リスク分析を強化する計算プラットフォームおよびリスクエンジンでもあります。

Chup Cheng
HSBCのXVAおよびCCRキャピタルアナリティクスのVP
Andrzej Golonka
HSBCのリードアシスタントバイスプレジデント
詳細を見る 導入事例へ

効率的なストリーミング分析:Project ShieldでWebをより安全な場所に

Project Shieldは、言論の自由を保護するという使命を持って、150か国以上の3,000以上の脆弱な組織のWebサイトをDDoS攻撃から防御しています。Apache Beamストリーミングパイプラインは、毎日約3 TBのログデータを1秒あたり10,000を超えるクエリで処理します。パイプラインは、リアルタイムのユーザー向け分析、調整されたトラフィックレート制限、および防御推奨事項を生成します。Apache Beamは、約2倍の効率向上で、重要なメトリクスの大規模配信を可能にしました。このデータは、ジャーナリストや真実を語る人々の声を封じるための武器としてのDDoS攻撃を排除するというProject Shieldの目標をサポートしました。最終的に、Project Shieldの目標は、Webをより安全な場所にする事です。

Marc Howard
Project Shieldの創設エンジニア
Chad Hansen
Project Shieldの創設エンジニア
詳細を見る 導入事例へ

Booking.comでのBeamによる大量広告入札

Apache Beamは、Booking.comのグローバルな広告入札およびパフォーマンスインフラストラクチャを強化し、2PB以上の分析データとテラバイトのトランザクションデータをスキャンする複数のデータシステムにわたるワークフローに対して、毎月100万件以上のクエリをサポートしています。Apache Beamは、処理を36倍高速化し、市場投入までの時間を最大4倍短縮しました。

Booking.comのPPCチーム
マーケティングテクノロジー部門
詳細を見る 導入事例へ

Apache Beamによるセルフサービス機械学習ワークフローとMLOpsのスケーリング

Apache Beamは、スケーラビリティと効率性に関するCredit KarmaのデータおよびMLプラットフォームを将来にわたって保証し、統合されたパイプラインでMLOpsを可能にし、1日あたり5〜10 TBを1秒あたり5Kイベントで処理し、20K以上のML機能を管理しています。

Avneesh Pratap
Credit KarmaのシニアデータエンジニアII
Raj Katakam
Credit KarmaのシニアMLエンジニアII
詳細を見る 導入事例へ

IntuitでのストリーミングとリアルタイムMLの強化

Apache Beamのランナー非依存性により、新しいランタイムが開発されるにつれて柔軟性が向上し、ストリーム処理プラットフォームが将来にわたって保証されると感じています。Apache Beamは、Intuitでのストリーム処理の民主化と、多くのバッチジョブのストリーミングアプリケーションへの移行を可能にしました。

Nick Hwang
Intuitのストリーム処理プラットフォームのエンジニアリングマネージャー
詳細を見る 導入事例へ

LyftでのBeamによるリアルタイムML

Lyftのマーケットプレイスチームは、現実世界のダイナミクスにすばやく対応することでビジネス効率を向上させることを目指しています。Apache Beamを使用することで、リアルタイムの機能でモデルの精度を向上させるための堅牢でスケーラブルなMLインフラストラクチャを持つという目標を達成できました。これらのリアルタイム機能は、予測、プライムタイム、ディスパッチなどの重要な機能をサポートしています。

Ravi Kiran Magham
Lyftのソフトウェアエンジニア
詳細を見る 導入事例へ

Palo Alto Networks向けの規模に応じたリアルタイムイベントストリーム処理

Palo Alto Networksは、業界の中でも高い水準で、1日に数千億件のセキュリティイベントをリアルタイムで処理するグローバルなサイバーセキュリティリーダーです。Apache Beamは、この規模をサポートするための高性能で信頼性が高く、回復力のあるデータ処理フレームワークを提供します。Apache Beamにより、Palo Alto Networksは最終的に高性能と低遅延を実現し、処理コストを60%削減しました。

Talat Uyarer
シニアプリンシパルソフトウェアエンジニア
詳細を見る 導入事例へ

Apache Hopを使用したApache Beamパイプラインの視覚的な設計とオーケストレーション

Apache Hopは、視覚的なパイプラインライフサイクル管理によってApache Beamを拡張するオープンソースのデータオーケストレーションおよびエンジニアリングプラットフォームです。Neo4jのチーフソリューションアーキテクトであり、Apache Hopの共同創設者であるMatt Castersは、Apache BeamをHopの原動力と考えています。

Matt Casters
Neo4jのチーフソリューションアーキテクト、Apache Hop共同創設者
詳細を見る 導入事例へ

検索エンジンのワークロードのスケーラビリティとコスト最適化

オンプレミスインフラストラクチャをスケーリングしたチェコの検索エンジンの経験を詳しく見て、バイトベースのデータシャッフリングの利点と、Apache Beamの移植性と抽象化が最大の価値をもたらすユースケースについて学びましょう。

Marek Simunek
seznam.czのシニアソフトウェアエンジニア
詳細を見る 導入事例へ

楽しく利益を上げるための4つのApacheテクノロジーの組み合わせ

スイス最大のオンラインマーケットプレイスであるRicardoは、Apache Beamを使用してプラットフォームデータをストリーム処理し、データインテリジェンスチームがスケーラブルなデータ統合、分析、およびスマートサービスを提供できるようにしています。

Tobias Kaymak
Ricardoのシニアデータエンジニア
詳細を見る 導入事例へ

他にも以下のような企業で使用されています

Mozillaは、非営利のFirefoxブラウザーです。このユースケースは、あるシステムから別のシステムにデータを安全に移動することから生じる複雑さ、ある変換から別の変換に渡されるデータのモデリング、エラー処理、システムのテスト、およびFirefoxクライアントからテレメトリデータを取り込むためのオープンソースのコードベースで、異なるソースおよび宛先システムに対してパイプラインを構成可能にするためのコードの編成に焦点を当てています。
Spotifyで開発され、Python向けApache Beamの上に構築されたKlioは、研究者やエンジニアがオーディオやその他のメディアファイルを大規模に簡単かつスマートに処理するためのデータパイプラインを構築できるようにするオープンソースフレームワークです。
Kioは、Java SDKのfluent-like APIを実装するためのApache BeamのKotlin拡張機能のセットです。
GraalSystemsは、Beam、Spark、Tensorflow、Samza、その他多くのデータ処理ソリューションをサポートするクラウドネイティブデータプラットフォームです。アーキテクチャの中核には、Apache Pulsarクラスターから1日あたり20億件以上のイベントをルーティングするためにBeamを使用する分散処理および分析モジュールのセットがあります。クライアント向けには、本番プラットフォームで1日に2,000件以上のBeamジョブを非常に大規模に実行しています。
Oriel Research Therapeutics(ORT)は、最先端の人工知能技術と次世代シーケンス(NGS)を利用して、複数の病状の早期検出サービスを提供する、ボストン地域の大手企業です。ORTは、100万件を超えるゲノミクスおよび臨床情報のサンプルを処理するために、Apache Beamパイプラインを利用しています。処理されたデータは、白血病、敗血症、その他の病状の検出においてORTによって使用されます。
eBayは、オンラインWebサイトを通じて企業間および消費者間の販売を提供するアメリカの電子商取引会社です。彼らは、Apache Beamを使用して機能パイプラインを構築し、オンラインとオフラインでの機能の抽出と選択を統合し、モデルトレーニング、評価、およびサービス提供のためのE2Eイテレーションを高速化し、異なるタイプ(ストリーミング、ランタイム、バッチ)の機能をサポートしています。eBayは、Kafka、Hadoop、Flink、AirflowなどをeBayに統合するための基盤として、ストリーミング機能SDKにApache Beamを活用しています。
GOGA Data Analysis and Consultingは、地理空間データと地図データの分析を専門とする日本を拠点とする会社です。分析目的でのスムーズなデータ変換プロセスにApache BeamとCloud Dataflowを使用しています。このユースケースは、提供された場所に基づいて各データのAPI呼び出しを処理および要求することで、複数の抽出、ジオコーディング、および挿入プロセスを処理することに焦点を当てています。

Akvelonは、スタートアップ、中小企業、そしてFortune 500企業がクラウド、データ、AI/MLの可能性を最大限に引き出し、戦略的優位性を強化するのを支援するソフトウェアエンジニアリング企業です。Akvelonチームは、Apache Beamを多様なデータ処理エコシステムと統合する深い専門知識を持ち、熱心なApache Beamコミュニティの貢献者でもあります。