写在前面: 我是
「nicedays」
,一枚喜爱做特效,听音乐,分享技术的大数据开发猿
。这名字是来自world order乐队的一首HAVE A NICE DAY
。如今,走到现在很多坎坷和不顺,如今终于明白nice day是需要自己赋予的。
白驹过隙,时光荏苒,珍惜当下~~
写博客一方面是对自己学习的一点点总结及记录
,另一方面则是希望能够帮助更多对大数据感兴趣的朋友。如果你也对大数据与机器学习
感兴趣,可以关注我的动态https://blog.csdn.net/qq_35050438
,让我们一起挖掘数据与人工智能的价值~
Scala函数之数组:
Array方法:
++
- 合并数组
var c = Array(1,2,3)
var b = Array(4,5,6)
b++c
++:
- 合并数组 并将右边的类型作为最终结果返回
val a = List(1,2)
val b = scala.collection.mutable.LinkedList(3,4)
val c = a ++: b
// 最后c为LinkList类型
+:与:+
- 在数组前添加一个元素
val k = 0
val a = List(1,2)
val c = k +: a // c中的内容是 (0,1,2)
val d = a :+ k // d中的内容是 (1,2,0)
数组在哪冒号在哪
/:与:\
–foldleft的简写
- 对数组中所有的元素进行相同的操作
val a = List(1,2,3,4)
val c = (10 /: a)(_+_) // 1+2+3+4+10
val d = (10 /: a)(_*_) // 1*2*3*4*10
println("c:"+c) // c:20
println("d:"+d) // d:240
冒号在哪边,集合就在哪边
addString()
val a = List(1,2,3,4)
val b = new StringBuilder("678")
val c = a.addString(b) // c中的内容是 1234
val d = a.addString(b,",") // 连接字符串时每个元素按分隔符隔开
val e = a.addString(b,"shou",",","wei") // 在首尾各加一个字符串,并指定sep分隔符
aggregate()
- 聚合计算,aggregate是柯里化方法,参数是两个方法
apply()
- 去出指定索引处得元素
arr.apply(index)
canEqual()
- 判断两个对象是否可以进行比较
arr.canEqual()
charAt()
–字符数组才有
val chars = Array('a','b','c')
c.cahrAt()
clone()
- 创建一个副本,不是引用,是深拷贝
val chars = Array('a','b','c')
val newchars = chars.clone()
collect()
- 执行一个并行计算,得到一个新的数组对象
val chars = Array('a','b','c')
val newchars = chars.collect(fun)
println("newchars:"+newchars.mkString(","))
//我们通过下面的偏函数,把chars数组的小写a转换为大写的A
val fun:PartialFunction[Char,Char] = {
case 'a' => 'A'
case x => x
}
/**输出结果是 newchars:A,b,c */
val newchars = Array(22,442,653,3467)
val fun:PartialFunction[Char,Char] = {
case y if % 2 == 0 => y + 5
}
combinations()
- 拿到数组对应长度得所有排列组合
val arr = Array("a","b","c")
val newarr = arr.combinations(2)// 返回了一个迭代器,长度为2得排列组合
newarr.foreach((item) => println(item.mkString(",")))
/**
a,b
a,c
b,c
*/
contains()
- 序列中是否包含指定对象
arr.contains(2)
containSlice()
- 判断当前序列中是否包含另一个序列
val a = List(1,2,3,4)
val b = List(2,3)
println(a.containsSlice(b)) //true
copyToArray()
- 数组中的内容拷贝到另外一个数组
// 将a得数组拷贝给b,得从索引2开始拷
a.copyToArray(b,2)
copyToBuffer()
val a:ArrayBuffer[Char] = ArrayBuffer()
b.copyToBuffer(a)
println(a.mkString(","))
corresponds()
- 判断两个序列长度以及对应位置元素是否符合某个条件。如果两个序列具有相同的元素数量并且对应位置得条件都成立,返回结果为true
val a = Array(1, 2, 3)
val b = Array(4, 5,6)
println(a.corresponds(b)(_<_)) //true
count()
- 统计符合条件的元素个数,x>2 大于2才做统计
- 下面统计大于 2 的元素个数
val a = Array(1, 2, 3)
println(a.count({x:Int => x > 2})) // count = 1
diff()
- 返回当前数组与另一个数组比较后独一无二得元素
val a = Array(1, 2, 3,4)
val b = Array(4, 5,6,7)
val c = a.diff(b)
println(c.mkString) //1,2,3
distinct()
- 去除当前集合得重复元素
val a = Array(1, 2, 3,4,4,5,6,6)
val c = a.distinct
println(c.mkString(",")) // 1,2,3,4,5,6
drop()
- 当前序列中前 n 个元素去除
val a = Array(1, 2, 3,4)
val c = a.drop(2)
// 3,4
dropRight()
- 当前序列中尾部n 个元素去除
dropWhile()
- 去除符合条件得元素
- 但是有一个条件:从当前数组的第一个元素起,就要满足条件,直到碰到第一个不满足条件的元素结束(即使后面还有符合条件的元素)
//下面去除大于2的,第一个元素 3 满足,它后面的元素 2 不满足,所以返回 2,3,4
val a = Array(3, 2, 3,4)
val c = a.dropWhile( {x:Int => x > 2} )
println(c.mkString(","))
//如果数组 a 是下面这样,第一个元素就不满足,所以返回整个数组 1, 2, 3,4
val a = Array(1, 2, 3,4)
endsWith()
- 判断是否以某个序列结尾
val a = Array(3, 2, 3,4)
val b = Array(3,4)
println(a.endsWith(b)) //true
exists()
- 判断当前数组是否包含符合条件的元素
val a = Array(3, 2, 3,4)
println(a.exists( {x:Int => x==3} )) //true
println(a.exists( {x:Int => x==30} )) //false
filter()
- 取得当前数组中符合条件的元素,组成新的数组返回
val a = Array(3, 2, 3, 4)
val b = a.filter( {x:Int => x > 2} )
println(b.mkString(",")) //3,3,4
find()
- 查找第一个符合条件得某个东西
val a = Array(1, 2, 3,4)
val b = a.find( {x:Int => x>2} )
// val b = a.find( x => x > 2 )
println(b) // Some(3)
val b = a.find( {x:Int => x>2} ).get // 拿值
flatMap()
- flat和map,先map后flatten、
- map一般都会形成嵌套集合,需要flat扁平化
val a = Array(1, 2, 3,4)
val b = a.flatMap(x=>1 to x)
println(b.mkString(","))
/**
1,1,2,1,2,3,1,2,3,4
从1开始,分别于集合a的每个元素生成一个递增序列,过程如下
1
1,2
1,2,3
1,2,3,4
*/
fold
- 对序列中的每个元素进行二元运算
def seqno(m:Int,n:Int): Int ={
val s = "seq_exp=%d+%d"
println(s.format(m,n))
return m+n
}
def combine(m:Int,n:Int): Int ={
val s = "com_exp=%d+%d"
println(s.format(m,n))
return m+n
}
val a = Array(1, 2, 3,4)
val b = a.fold(5)(seqno)
/** 运算过程
seq_exp=5+1
seq_exp=6+2
seq_exp=8+3
seq_exp=11+4
*/
val c = a.par.aggregate(5)(seqno,combine)
/** 运算过程
seq_exp=5+1
seq_exp=5+4
seq_exp=5+3
com_exp=8+9
seq_exp=5+2
com_exp=6+7
com_exp=13+17
*/
foldRight()
def seqno(m:Int,n:Int): Int ={
val s = "seq_exp=%d+%d"
println(s.format(m,n))
return m+n
}
val a = Array(1, 2, 3,4)
val b = a.foldRight(5)(seqno)
/** 运算过程
seq_exp=4+5
seq_exp=3+9
seq_exp=2+12
seq_exp=1+14
*/
/**
简写 (a :\ 5)(_+_)
*/
foreach()
- 遍历序列中的元素,进行 f 操作,类似迭代器,只能执行一次
val a = Array(1, 2, 3,4)
a.foreach(x => println(x*10))
/**
10
20
30
40
*/
group by
- 按条件分组,条件由 f 匹配,返回值是Map类型,每个key对应一个序列,下面代码实现的是,把小于3的数字放到一组,大于3的放到一组,返回Map[String,Array[Int]]
val a = Array(1, 2, 3,4)
val b = a.groupBy( x => x match {
case x if (x < 3) => "small"
case _ => "big"
})
grouped()
- 按指定数量分组,每组有 size 数量个元素,返回一个集合迭代器
val a = Array(1, 2, 3,4,5)
val b = a.grouped(3).toList
b.foreach((x) => println("第"+(b.indexOf(x)+1)+"组:"+x.mkString(",")))
/**
第1组:1,2,3
第2组:4,5
*/
hasDefiniteSize()
- 检测序列是否存在有限的长度,对应Stream这样的流数据,返回false
val a = Array(1, 2, 3,4,5)
println(a.hasDefiniteSize) //true
head()
- 拿头元素
arr.head
last()
- 拿尾元素
arr.last
indexOf()
- elem在序列中的索引,找到第一个就返回
val a = Array(1, 3, 2, 3, 4)
println(a.indexOf(3)) // return 1
// 返回elem在序列中的索引,可以指定从某个索引处(from)开始查找,找到第一个就返回
val a = Array(1, 3, 2, 3, 4)
println(a.indexOf(3,2)) // return 3
indexOfSlice()
- 检测当前序列中是否包含另一个序列(that),并返回第一个匹配出现的元素的索引
val a = Array(1, 3, 2, 3, 4)
val b = Array(2,3)
println(a.indexOfSlice(b)) // return 2
indexWhere()
- 返回当前序列中第一个满足 p 条件的元素的索引,可以指定从 from 索引处开始
val a = Array(1, 2, 3, 4, 5, 6)
println(a.indexWhere( {x:Int => x>3},4)) // return 4
indices()
val a = Array(10, 2, 3, 40, 5)
val b = a.indices
println(b.mkString(",")) // 0,1,2,3,4
init()
- 返回当前序列中不包含最后一个元素的序列
val a = Array(10, 2, 3, 40, 5)
val b = a.init
println(b.mkString(",")) // 10, 2, 3, 40
tail()
- 去头元素
val a = Array(10, 2, 3, 40, 5)
val b = a.tail
println(b.mkString(",")) // 2, 3, 40,5
intersect()
- 取两个集合的交集
val a = Array(1, 2, 3, 4, 5)
val b = Array(3, 4, 6)
val c = a.intersect(b)
println(c.mkString(",")) //return 3,4
isDefinedAt()
- 判断序列中是否存在指定索引
val a = Array(1, 2, 3, 4, 5)
println(a.isDefinedAt(1)) // true
println(a.isDefinedAt(10)) // false
isEmpty()
- 判断当前序列是否为空