Original URL: https://aws.amazon.com/cn/blogs/startups/how-komodo-health-enables-self-serve-analytics-with-eks-emr/
Komodo Health公司客座文章作者:Jigar Bhalodia,數據基礎設施工程師;Hanyu Cui,數據基礎設施高級軟件工程師;Stephen Goeppele-Parrish,雲基礎設施工程師;Chris Han,高級工程經理。
我們還要特別感謝爲本文審覈以及平臺開發做出貢獻的工程師們:Scott Edenbaum、Jean Barmash、Andrea Ortuno以及Tomo Ishihara。
在Komodo Health公司,我們的使命一直在迅速演進,努力基於健康數據打造軟件與數據產品、進而減輕全球疾病負擔。我們的Healthcare MapTM記錄超過3.2億美國人(已進行數據脫敏)在整個醫療系統中的經歷。我們還不斷增加數據來源與臨牀絕對值,以確保我們的數據始終保持及時性、完整性與關聯性。
過去幾年當中,我們公司迎來了100%的同比增長(過去18個月中,我們工程技術團隊中的工程師與數據科學家也由35位增加至90多位)。雖然這樣的增長勢頭令人興奮,但同時也帶來一系列規模擴展挑戰。其中最大的挑戰之一,就是如何在內部運行Spark以進行即席分析與批量ETL作業。
原文鏈接:【https://www.infoq.cn/article/GCAtvkygY3vFPYpLJY0T】。未經作者許可,禁止轉載。