Uber 大規模運行 Apache Pinot實踐

Pinot 是一個實時分佈式的 OLAP 數據存儲和分析系統。使用它實現低延遲可伸縮的實時分析。Pinot 從脫機數據源（包括 Hadoop 和各類文件）和在線數據源（如 Kafka）中獲取數據進行分析。Pinot 被設計成可進行水平擴展。Pinot 特別適合這樣的數據分析場景：查詢具有大量維度和指標的時間序列數據、分析模型固定、數據只追加以及低延遲，以及分析結果可查詢。本文介紹了 Pinot 在Uber 的應用情況。

引言

Uber 有一個複雜的“市場”，由乘客、司機、食客、餐廳等組成。在全球範圍內運營該市場需要實時的情報和決策。例如，識別延遲的 Uber Eats 訂單或放棄的購物車有助於我們的社區運營團隊採取糾正措施。對於日常運營、事件分類和財務情報來說，擁有一個包含不同事件的實時儀表板是至關重要的，這些事件包括消費者需求、司機可用性或城市中發生的行程等等。

在過去的幾年裏，我們已經建立了一個自主服務平臺來支持這樣的用例，以及 Uber 不同部門的許多其他用例。該平臺的核心構件是 Apache Pinot，這是一個分佈式的在線分析處理（OnLine Analytical Processing，OLAP）系統，該系統用於對 TB 級數據執行低延遲的分析查詢。在本文中，我們介紹了這一平臺的細節，以及它如何融入 Uber 的生態系統。我們重點介紹了 Pinot 在 Uber 內部的演變，以及我們如何從少數用例擴展到多集羣，全主動部署，爲數百個用例提供支持，以毫秒級的延遲查詢 TB 級規模的數據。

原文鏈接:【https://www.infoq.cn/article/TicyyU15FpIVdtC2EQRD】。未經作者許可，禁止轉載。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Uber 大規模運行 Apache Pinot實踐

引言

公司新來一個幹練小夥，把 MyBatis 替換成 MyBatis-Plus，上線後哭暈在廁所。。。

5款開源、美觀、強大的WPF UI組件庫

Testin雲測上線華爲Pura 70系列真機測試服務！

10分鐘本地運行llama3及初體驗

golang 表格

手寫協議報文 c語言手法

甲骨文(Oracle)宣佈將以74億美元收購Sun公司

Uber如何處理和使用乘客數據改善App的體驗？

Uber如何爲近實時特性構建可伸縮流管道？

Uber探索利用圖學習模型解決欺詐檢測問題

揭祕 Uber API 網關的架構

Uber大型實時數據智能平臺建設

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結