原创 eBay是如何進行大數據集元數據發現的

很多大數據系統每天都會收集數PB的數據。這類系統通常主要用於查詢給定時間範圍內的原始數據記錄,並使用了多個數據過濾器。但是,要發現或識別存在於這些大型數據集中的唯一屬性可能很困難。 在大型數據集上執行運行時聚合(例如應用程序在特定時間範圍內