Uber：模型性能调优

原創

Uber Engineering

2021-08-25 08:38

{"type":"doc","content":[{"type":"heading","attrs":{"align":null,"level":1},"content":[{"type":"text","text":"前言"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Uber 使用机器学习模型来支持关键的业务决策。一种机器学习模型要经过多次实验迭代才能进入生产阶段。在实验阶段，数据科学家或机器学习工程师将探索添加特性、调优参数以及运行离线分析或回溯测试。在保证生产中高模型质量的同时，我们通过强化平台来减少这一阶段的人力和时间。"}]},{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"超参数优化"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"image","attrs":{"src":"https:\/\/static001.geekbang.org\/wechat\/images\/5f\/5f56ae2b7e38a1c88dacd4556df60526.jpeg","alt":null,"title":null,"style":null,"href":null,"fromPaste":false,"pastePass":false}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":"center","origin":null},"content":[{"type":"text","text":"图 1：基于 TURBO 的超参数优化"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"由于维数灾难，在大型超参数搜索空间中的搜索成本很高，即使对于能够平衡探索与利用并通过后验结合信念更新的贝叶斯优化技术也是如此。超参数的重要性和选择对于帮助降低搜索空间的复杂性具有重要意义，因为超参数对模型性能有很大的影响。结果表明，对于像 XGBoost 这样的基于树的模型来说，最大树深、最大树数、学习率和最小子重等的调整通常会会产生更好的性能。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"这样做的目的是主动显示已知类别问题的适当参数，从整体上节省时间。除了优化二值分类问题的 AUC或回归分析问题的均方误差（MSE）之外，我们还公开了额外的目标函数，以便数据科学家和机器学习工程师可以为他们的问题选择合适的优化目标。为避免过拟合，我们在优化函数中引入一个惩罚项，来捕捉训练和测试性能之间的差异。要加速对超大数据集的超参数搜索，如果我们在新的试验中没有发现明显的改进，则允许超参数优化研究提前停止。"}]},{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"学习曲线与提前停止"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"在训练期间，通过绘制模型或估计器对评估数据集进行多次迭代，学习曲线通常被用来评估和诊断机器学习模型。它分析了模型从额外的迭代训练中获得的增量性能收益，并就偏差 - 方差权衡问题提供了深入的见解。从图 2 中可以看到，对增量学习过程的知识使用户能够对模型的拟合作出明智的判断，并在每一次实验的基础上急切地应用提前停止。超参数优化设置中，在一个实验中存在多个同时进行的实验，提前停止也可以跨实验联合应用。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"image","attrs":{"src":"https:\/\/static001.geekbang.org\/wechat\/images\/9a\/9a27f14e26eafb64951dfb5dd6480825.jpeg","alt":null,"title":null,"style":null,"href":null,"fromPaste":false,"pastePass":false}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":"center","origin":null},"content":[{"type":"text","text":"图 2：使用提前停止节省可能的计算时间"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"根据每次实验结果，利用学习曲线可以估算出数百个相互作用达到稳定状态前的收敛性，在一般的超参数优化设置中，经过大量实验，每个实验的效率增益与实验的数量成比例。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"image","attrs":{"src":"https:\/\/static001.geekbang.org\/wechat\/images\/b1\/b1b0f03dcc4d55b1be37cb8e8c7f1d12.jpeg","alt":null,"title":null,"style":null,"href":null,"fromPaste":false,"pastePass":false}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"图 3：属于同一超参数优化工作的所有试验的学习曲线。红色边界框突出显示曲线，根据早期表现与其他正在进行的试验相比，这些曲线不太可能成为最佳候选者"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"尽管我们可以将提前停止应用於单个实验，以修剪多余的迭代（如图 3 所示），但是通常可以通过在所有同时进行的实验中共享信息来获得额外的空间。在一个实验的所有实验中联合使用学习曲线信息，可以让我们估算该实验将优于其他实验的概率。诸如 ASHA（"},{"type":"text","marks":[{"type":"strong"}],"text":"A"},{"type":"text","text":"synchronous "},{"type":"text","marks":[{"type":"strong"}],"text":"S"},{"type":"text","text":"uccessive "},{"type":"text","marks":[{"type":"strong"}],"text":"H"},{"type":"text","text":"alving "},{"type":"text","marks":[{"type":"strong"}],"text":"A"},{"type":"text","text":"lgorithm，异步连续减半算法）等技术，利用由分布式实验执行的中央调度器促进的顺序贝叶斯优化，可以联合优化整个研究，使整个超参数调整过程更加迅速。在接下来的博文中，我们将详细介绍我们的自动超参数优化服务架构，以及在生产中采用黑盒优化服务的结果。"}]},{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"特征变换"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Uber 的机器学习模型利用了丰富的地理空间特征，通常需要用特征工程来提取有意义的信号。一种方法是将经度和纬度离散化，但是这会产生非常高的基数（cardinality）特征。将经度和纬度变换为不同的嵌入空间，然后从嵌入空间中提取出地理空间信号。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"基于树的模型执行分段线性函数近似（piecewise linear functional approximation），这种方法无法很好地捕捉复杂的非线性交互作用。在基于树的模型训练过程中，我们没有使用内核技巧，而是自动加入顶级复合特征，重要性低的复合特征将被删除。"}]},{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"额外策略"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Uber 的业务数据有很强的时间因素。行程信息被摄入并按照日期字符串划分到数据湖中。多数 Uber 的机器学习模型都是在日期范围内训练的。举例来说，使用更广泛的日期范围使模型能够以周或月为周期来捕捉。增加数据的日期范围是提高模型准确性的常见方法，这也是一个关键的最佳实践。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"然而，我们也看到一些情况，日期范围的增加会导致模型的准确性降低。出现这种情况的原因之一是，更大的范围会放大异常值的影响。在这种情况下，我们检查数据并在 DSL 中进行补偿。另外一种可能是由于预测的行为会随着时间而改变。因此，对训练数据进行时间加权衰减可以起到一定的作用。通过使用 XGBoost 列加权特性和 DSL 转换来完成此任务。"}]},{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"支持最佳实践的工具"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"应用模型调优的最佳实践需要进行大量的工作和跟踪。我们称这一过程为“金矿开采”。金矿开采始于克隆客户的 Michelangelo 项目。这样可以避免在客户的生产环境中运行实验性训练作业。每个实验性运行都涉及许多容易出错的步骤，包括："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"bulletedlist","content":[{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"仔细设置（例如，延长日期范围意味着改变训练 \/ 测试拆分，如果它是基于日期的）。"}]}]},{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"应用相关的启发式方法（例如，设置超参数搜索范围）"}]}]},{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"更新计算资源（例如，分区模型需要更多的工作器或并行性，以避免更高的延迟）"}]}]},{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"记录实验结果并确定当前的最佳模型"}]}]}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"我们已经将上述步骤、模型探索和模型分析自动化为一个工具，以加快金矿开采的过程。"}]},{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"总结"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"创建和维护高性能的模型是一个迭代的过程。Michelangelo 提供了大量的功能目录，如超参数优化、提前停止、特征变换等，可在模型开发和调优阶段使用。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Michelangelo 还提供了执行全面重新调优的工具，包括模型架构搜索、确定特征协同和冗余性等。最终的结果是，我们已经能够为 Uber 部署的机器学习模型提供一个迭代调整和一次性全面调优的框架。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"作者介绍："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Joseph Wang，Uber 机器学习平台团队软件工程师。负责特征存储、实时模型预测服务、模型质量平台和模型性能。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Michael Mui，Uber 机器学习平台团队高级软件工程师。负责分布式训练基础设施、超参数优化、模型表示和评估。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Viman Deb，Uber 机器学习平台团队高级软件工程师。负责黑盒优化服务、Uber 定制贝叶斯优化算法以及 Michelangelo 的超参数优化工作流。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Anne Holler，Uber 机器学习平台团队机器学习框架 TLM 前雇员。负责机器学习模型的标识和管理，以及训练和离线服务可靠性、可伸缩性和调优。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"原文链接："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"link","attrs":{"href":"https:\/\/eng.uber.com\/tuning-model-performance\/","title":"","type":null},"content":[{"type":"text","text":"https:\/\/eng.uber.com\/tuning-model-performance\/"}]}]}]}

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

为程序员和新手准备的 8 大 Python 工具

Python 是一種開源編程語言，用於 Web 編程、數據科學、人工智能和許多科學應用。學習 Python 使程序員能夠專注於解決問題，而不是專注於語法，其豐富的庫賦予它完成偉大任務所需的力量。 1) IDLE 安裝 Python 時

2024-05-14 01:06:43

探索未知：风靡硅谷开发者的 Unstructured Data Meetup 即将登陆中国l

“最硅谷”的 Unstructured Data Meetup 即將來襲！衆所周知，AI 三要素包括：算力、算法和數據。數據的價值愈發凸顯，而其中非結構化數據更是備受關注。IDC 預測，到 2025 年，全球數據總量中將有超過 80% 的

2024-05-13 21:25:35

什么？ 20分钟，构建你自己的LLaMA3应用程序！ | 京东云技术团队

4月19日，Meta發佈了最新的大語言模型LLaMA3，具體包括一個 8B 模型和一個 70 B 模型，上下文長度支持8K，被譽爲史上最強開源大語言模型，開源社區的“重磅炸彈”，效果直指GTP4。在諸多評測任務上，LLaMA3都有非常炸裂

2024-05-13 23:59:31

内嵌专业接口的RISC-V架构MCU，谁家有？

前一陣，蘋果推出了M1處理器，相比關注具體指標，業內其實更關心M1推出後會引領產業往哪個方向發展，不少人的結論是RISC-V會成爲未來芯片發展的熱點，因爲RISC-V有很多巧妙的方法可以提高性能。計算機界泰斗David Patterso

2024-05-13 23:26:39

挑战活动|打造监控“0”盲点,百万奖金等你拿

“監控覆蓋全了麼？” “處置及時麼？” “信創對象都監控了麼？” 據統計，在2023年以上3問是運維工程師被主管領導問的最多的問題。系統是否好用、告警是否過多、使用是否便捷，這都可以忍，但監控盲點

2024-05-13 22:34:47

免费报名|Zabbix受邀出席上海开源技术沙龙，探讨开源软件赋能新质生产力

大家好！5月25日我們將舉辦今年第三期上海開源技術沙龍活動。本次的主題是——開源軟件賦能新質生產力。在上海開源信息技術協會 (SHOpen) 的指導下，隨着活動的持續開展，上海開源技術沙龍獲得了越來越多開發者的關注與

2024-05-13 22:34:43

【深圳招聘】Taro 团队招前端开发工程师！

Taro 團隊再再再招人啦！我們正在尋找多位有經驗的「前端開發工程師」加入我們的團隊。如果您具備以下技能和經驗，我們期待您的加入：工作職責參與 Taro 框架開發，同時在跨端和全棧等技術方向攻克難題；參與跨團隊合作，完成整體項目規

2024-05-13 21:53:04

Linux 服务器配置-安装portainer-ce社区版

操作系統Debian12 1. portainer 簡介 Portainer 是一個開源的輕量級容器管理工具，主要用於 Docker 和 Swarm 環境的可視化管理和操作。通過 Portainer，用戶可以通過簡潔易用的 Web UI

2024-05-13 13:22:00

Linux 异宠动物园，平面设计篇，Linux 平台常见的开源平面设计软件

Linux 異寵動物園，平面設計篇，分佈介紹視頻，講解了 Linux 平臺常見的開源平面設計軟件。如 Inkscape，Gimp，Krita，Scribus，並介紹了平面設計行業早期的歷史和 Aldus 公司的歷史。視頻請見： https

2024-05-13 12:11:29

从 Oracle 到 TiDB，国有大行打造本地生活 APP 新体验

導讀本文介紹了某國有大行推出的本地生活服務類 APP 在數字時代的創新應用實踐。該 APP 利用金融科技和互聯網平臺模式，打造“金融+非金融”的線上生態服務平臺，滿足了用戶多樣化的生活需求。爲應對用戶增長和數據量增加帶來的挑戰，該 APP

2024-05-13 11:16:38

PingCAP 戴涛：构建面向未来的金融核心系统

作者：戴濤導讀近日，平凱星辰解決方案技術部總經理戴濤在 2024 數據技術嘉年華活動中，做了主題爲“構建面向未來的金融核心系統”的分享，本文爲戴濤演講實錄的全文。文章分析了中國金融行業的發展趨勢，並且基於這些趨勢對數據庫選擇從架構、運

2024-05-13 11:16:37

TiDB + ES：转转业财系统亿级数据存储优化实践

以下文章來源於轉轉技術，作者戴美琪導讀本文詳細介紹了轉轉業財系統億級數據存儲優化的實踐。面對系統數據量大、慢查詢多等挑戰，轉轉業財採取了 TiDB 方案優化數據量問題，同時引入 Elasticsearch（ES）解決慢查詢難題。實踐表

2024-05-13 11:16:34

我宣布，这是我找到的史上AI最全论文体系！

在碎片化閱讀充斥眼球的時代，越來越少的人會去關注每篇論文背後的探索和思考。搞AI，不少人都進入一個誤區，那就是隻鑽研自己的代碼是否精進，而沒有注意提升自己的閱讀能力。實際上，一個專業的學術研究員或者AI研究員可能需要花費幾百個小

2024-05-13 21:33:50

GPU 硬件指标说明

流處理器：也叫渲染管、着色器。畫面都是由一個又一個像素點組成的，而流處理器就負責這些像素點的渲染工作； RT核心：光追核心，用作於光線追蹤效果； CUDA 核心和Tensor 核心：CUDA Core和Tensor Core，爲G

2024-05-13 22:35:43

舌尖上的AI：人工智能技术正在被“端上”餐桌

來源 | 人民數字FINTECH 責編 | 晉兆雨頭圖 | CSDN 下載自視覺中國 #人工智能技術正在被“端上”餐桌四方食事，不過一碗人間煙火。人工智能作爲一門新的技術科學，正在被人間煙火氣“端”上餐桌。人工智能“洗手”

2024-05-13 21:17:25

24小時熱門文章

最新文章

最新評論文章