原创 RDD編程

1.RDD基礎:  Spark中RDD是不可變的分佈式對象集合。每個RDD被分爲多個分區,這些分區運行在集羣中的不同節點上。RDD可以包含任意類型的對象(甚至可以是自定義的)。 前面講到,Spark包含轉化操作和行動操作。Spark只會惰性