大數據開發注意事項
今天開始記錄一下大數據之路的坑:
- 所有的地址,不管本地還是遠程的的,全部寫192.xxx.xxx.xxx,不許寫localhost
- 所有的字符串切割操作,全部分開進行切割,不許一行代碼寫多個字符串的操作
- 在map函數中的操作,能直接利用索引在數組中取到,就不要自己額外的定義一行變量,容易出錯
- 自己定義變量的時候,一定要注意val和var的使用(絕大多數在map函數中自定義的變量要用var)
package org.mymahout.recommendation.hadoop; import java.io.File; import ja