Spark優化
函數傳遞
- 在
spark
中,很多操作都需要依賴用戶傳遞的函數,在我們傳遞函數的時候,如果函數中包含其他對象的飲用,Spark也會把其他對象傳遞。(尤其是在python
中)
- 解決方法:
將函數中的必要字段轉換成局部變量,然後進行傳遞。
引用
- 《Spark快速大數據分析》
spark
中,很多操作都需要依賴用戶傳遞的函數,在我們傳遞函數的時候,如果函數中包含其他對象的飲用,Spark也會把其他對象傳遞。(尤其是在python
中)將函數中的必要字段轉換成局部變量,然後進行傳遞。
shell腳本獲取腳本所在目錄 執行腳本的父目錄不一定是當前的工作目錄。 url=$(dirname $(readlink -f $0))