原创 Hadoop權威指南 ---下載氣象數據並自動解壓整合
https://blog.csdn.net/leibniz_zhang/article/details/80590117 https://blog.csdn.net/weixin_40645816/article/details/82
原创 shell - 字符串切分成數組
shell字符串切分 #!/bin/bash str="hello,world"; //與/之間與分割的字符 ,另外/後有一個空格不可省略 str=${str//,/ }; arr=($str); #遍歷數組 for element
原创 大數據環境搭建
大數據環境搭建配置SSH權限問題 配置SSH 1、修改主機名(所有主機) # hostnamectl set-hostname xxx /etc/hosts 172.16.2.106 slave106 172.16.2.107 ma
原创 java - jvm
JVM SUN官方站點介紹JVM Options http://www.oracle.com/technetwork/java/javase/tech/vmoptions-jsp-140102.html#G1Options 可以用下面
原创 spark — 集羣errors
hadoop errorsnamenode一直處於安全模式 namenode一直處於安全模式 查看日誌發現: Resources are low on NN. Please add or free up more resources
原创 spark sql — 集羣環境errors
errorsspark.sql.warehouse.dir spark.sql.warehouse.dir // 默認值:System.getProperty("user.dir")/spark-warehouse // 默認找的是u
原创 spark sql — Partition Discovery
Partition Discoveryparaquet數據源自動分區推斷 paraquet數據源自動分區推斷 For example, when path/to/table/gender=male is the path of the
原创 spark sql 功能代碼1 — 查找匹配特定字符串的所有行
匹配特定字符串所有行版本1 版本1 要點:因爲每一行tab鍵分割後,數組大小固定,過濾掉垃圾數據 package sql; import java.util.ArrayList; import java.util.List; im
原创 spark - 簡記
map階段寫內存 - 歸併排序 SortShufleWriter.write sorter.writePartitionedFile(blockId, tmp) collection.destructiveSortedWritab
原创 Java 代碼品讀1 —— Integer.highesOneBit(i)
Integer.highesOneBit原碼, 反碼, 補碼基本概念原碼, 反碼, 補碼錶示方法總結 1、閱讀代碼時候,偶爾看到 Integer.highestOneBit(i) 這個函數調用。使用的第一感覺就是這個函數是
原创 Shell腳本1 —— 統計文件行數
統計文件行數方法1方法2方法3方法6方法方法 方法1 獲取單個文件行數 awk ‘{print NR}’ file|tail -1 方法2 獲取單個文件行數 awk ‘END{print NR}’ file 方法3 獲取單個文件行數
原创 errors
RDMA errors error1 crail pom.xml中依賴的disni版本與/soft/disni版本不一致 error2
原创 crail創建文件
創建文件 step1 step2
原创 RDMA-error1-ibv_devces
errors https://incubator-crail.readthedocs.io/en/latest/source.html
原创 spark streaming + kafka
學習筆記 https://github.com/apache/spark/blob/v2.1.0/examples/src/main/scala/org/apache/spark/examples/streaming/KafkaWor