sample(withReplacement, fraction, seed) 案例
- 作用:以指定的随机种子随机抽样出数量为fraction的数据,withReplacement表示是抽出的数据是否放回,true为有放回的抽样,false为无放回的抽样,seed用于指定随机数生成器种子。
- 需求:创建一个RDD(1-10),从中选择放回和不放回抽样
package com.dark.spark.SparkStudent.Spark_RDD
import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}
object Spark29 extends App {
val config: SparkConf = new SparkConf().setMaster("local[*]").setAppName("WordCount")
val sc = new SparkContext(config)
private val listRDD: RDD[Int] = sc.makeRDD(1 to 10)
private val sampleRDD: RDD[Int] = listRDD.sample(false, 0.4,1)
sampleRDD.collect().foreach(println)
}
2
3
5
6
8