導入事例
Apache Beamは、今日の主要なプロジェクト、業界固有のユースケース、およびスタートアップを数多く支えています。

リアルタイムストリーム処理の革新:LinkedInでの1日あたり4兆件のイベント処理
Apache Beamは、LinkedInのストリーミングインフラストラクチャのバックボーンとして機能し、3,000以上のパイプラインを通じて1日あたり4兆件という驚異的なイベントをほぼリアルタイムで処理し、世界中の9億5000万人以上のメンバーからなるLinkedInの巨大なネットワークに対してパーソナライズされたエクスペリエンスを提供しています。Apache Beamの採用により、ユースケースに応じて2倍のコスト最適化、虐待のラベリングにかかる時間を数日から数分に短縮、ログインしたスクレイピングプロフィールの検出率が6%以上向上するなど、目覚ましい改善がもたらされました。

OCTO Technologyの顧客向けの高性能かつ効率的なトランザクションデータ処理
Apache Beamを使用することで、OCTOはフランス最大の食料品小売業者の1つにおけるトランザクションデータ用のストリーミング処理への移行を加速しました。Apache Beamの強力な変換機能と堅牢なストリーミング機能を活用することで、インフラコストを5分の1に削減し、パフォーマンスを4倍に向上させました。ストリーミングApache Beamパイプラインは現在、毎日1億行以上を処理し、数百ギガバイトのトランザクションデータを1テラバイト以上の外部状態と合わせて3時間以内に集約します。これは、Apache Beamの制御された集約がなければ実現できなかったタスクです。

HSBCでのApache Beamによる高性能な定量的リスク分析
HSBCはApache Beamを単なるデータ処理フレームワーク以上のものであると考えています。これは、HSBCのXVAパイプラインの100倍のスケーリングと2倍の高速化、市場投入までの時間を24倍に短縮し、モンテカルロシミュレーションを使用した将来シナリオのモデリングのためのデータ配布を簡素化し、予測と意思決定のための定量的リスク分析を強化する計算プラットフォームおよびリスクエンジンでもあります。

効率的なストリーミング分析:Project ShieldでWebをより安全な場所に
Project Shieldは、言論の自由を保護するという使命を持って、150か国以上の3,000以上の脆弱な組織のWebサイトをDDoS攻撃から防御しています。Apache Beamストリーミングパイプラインは、毎日約3 TBのログデータを1秒あたり10,000を超えるクエリで処理します。パイプラインは、リアルタイムのユーザー向け分析、調整されたトラフィックレート制限、および防御推奨事項を生成します。Apache Beamは、約2倍の効率向上で、重要なメトリクスの大規模配信を可能にしました。このデータは、ジャーナリストや真実を語る人々の声を封じるための武器としてのDDoS攻撃を排除するというProject Shieldの目標をサポートしました。最終的に、Project Shieldの目標は、Webをより安全な場所にする事です。

Booking.comでのBeamによる大量広告入札
Apache Beamは、Booking.comのグローバルな広告入札およびパフォーマンスインフラストラクチャを強化し、2PB以上の分析データとテラバイトのトランザクションデータをスキャンする複数のデータシステムにわたるワークフローに対して、毎月100万件以上のクエリをサポートしています。Apache Beamは、処理を36倍高速化し、市場投入までの時間を最大4倍短縮しました。

Apache Beamによるセルフサービス機械学習ワークフローとMLOpsのスケーリング
Apache Beamは、スケーラビリティと効率性に関するCredit KarmaのデータおよびMLプラットフォームを将来にわたって保証し、統合されたパイプラインでMLOpsを可能にし、1日あたり5〜10 TBを1秒あたり5Kイベントで処理し、20K以上のML機能を管理しています。

IntuitでのストリーミングとリアルタイムMLの強化
Apache Beamのランナー非依存性により、新しいランタイムが開発されるにつれて柔軟性が向上し、ストリーム処理プラットフォームが将来にわたって保証されると感じています。Apache Beamは、Intuitでのストリーム処理の民主化と、多くのバッチジョブのストリーミングアプリケーションへの移行を可能にしました。

LyftでのBeamによるリアルタイムML
Lyftのマーケットプレイスチームは、現実世界のダイナミクスにすばやく対応することでビジネス効率を向上させることを目指しています。Apache Beamを使用することで、リアルタイムの機能でモデルの精度を向上させるための堅牢でスケーラブルなMLインフラストラクチャを持つという目標を達成できました。これらのリアルタイム機能は、予測、プライムタイム、ディスパッチなどの重要な機能をサポートしています。

Palo Alto Networks向けの規模に応じたリアルタイムイベントストリーム処理
Palo Alto Networksは、業界の中でも高い水準で、1日に数千億件のセキュリティイベントをリアルタイムで処理するグローバルなサイバーセキュリティリーダーです。Apache Beamは、この規模をサポートするための高性能で信頼性が高く、回復力のあるデータ処理フレームワークを提供します。Apache Beamにより、Palo Alto Networksは最終的に高性能と低遅延を実現し、処理コストを60%削減しました。

Apache Hopを使用したApache Beamパイプラインの視覚的な設計とオーケストレーション
Apache Hopは、視覚的なパイプラインライフサイクル管理によってApache Beamを拡張するオープンソースのデータオーケストレーションおよびエンジニアリングプラットフォームです。Neo4jのチーフソリューションアーキテクトであり、Apache Hopの共同創設者であるMatt Castersは、Apache BeamをHopの原動力と考えています。

検索エンジンのワークロードのスケーラビリティとコスト最適化
オンプレミスインフラストラクチャをスケーリングしたチェコの検索エンジンの経験を詳しく見て、バイトベースのデータシャッフリングの利点と、Apache Beamの移植性と抽象化が最大の価値をもたらすユースケースについて学びましょう。

楽しく利益を上げるための4つのApacheテクノロジーの組み合わせ
スイス最大のオンラインマーケットプレイスであるRicardoは、Apache Beamを使用してプラットフォームデータをストリーム処理し、データインテリジェンスチームがスケーラブルなデータ統合、分析、およびスマートサービスを提供できるようにしています。
他にも以下のような企業で使用されています


















































































Akvelonは、スタートアップ、中小企業、そしてFortune 500企業がクラウド、データ、AI/MLの可能性を最大限に引き出し、戦略的優位性を強化するのを支援するソフトウェアエンジニアリング企業です。Akvelonチームは、Apache Beamを多様なデータ処理エコシステムと統合する深い専門知識を持ち、熱心なApache Beamコミュニティの貢献者でもあります。

