原创 MaxCompute Mars 完全指南

Mars 簡介 Mars 能利用並行和分佈式技術,加速 Python 數據科學棧,包括 numpy、pandas 和 scikit-learn。同時,也能輕鬆與 TensorFlow、PyTorch 和 XGBoost 集成。 Mars t

原创 PyODPS DataFrame 處理笛卡爾積的幾種方式

PyODPS 提供了 DataFrame API 來用類似 pandas 的接口進行大規模數據分析以及預處理,本文主要介紹如何使用 PyODPS 執行笛卡爾積的操作。 笛卡爾積最常出現的場景是兩兩之間需要比較或者運算。以計算

原创 如何製作可以在 MaxCompute 上使用的 crcmod

之前我們介紹過在 PyODPS DataFrame 中使用三方包。對於二進制包而言,MaxCompute 要求使用包名包含 cp27-cp27m 的 Wheel 包。但對於部分長時間未更新的包,例如 oss2 依賴的 crcmod,PyPI