台部落haixwang

2020-06-16 02:44:19

文章目錄一、Hadoop3部分變化1-1、擦除編碼1-2、Hadoop 3 端口號的改變1-3、支持2個以上的NameNode1-4、內部數據節點平衡器二、IDEA遠程訪問控制集羣2-1 創建Maven項目，添加hadoop-cl

2020-06-16 02:44:19

文章目錄組機緣由：深度學習需要什麼樣的GPU？NVIDIA 部分GPU的技術參數：如何選擇：最終決定的配置：裝機裝機後的感想CUDA10還是CUDA9，Python3.6還是3.7？最終的深度學習環境TensorRT 5推理加速引

2020-06-16 02:44:19

目標在Tekton Pipeline中，使用python基本環境容器（下稱A）運行python項目（下稱B），B讀取集羣NFS共享數據（下稱C），處理數據後寫入C。（B的項目文件需要上傳到Git，A中任務依賴Git中該資源）

2020-06-16 02:44:19

文章目錄一、HBase部分1-1、hbase.regionserver.handler.count1-2、壓縮1-3、分裂1-4、hbase.regionserver.optionallogflushinterval1-5、hba

2020-06-16 02:44:19

文章目錄一、最終流程二、使用Put寫入三、批量寫入，BulkLoad四、Java BulkLoad 多列KeyValue（未成功-not Cell）五、Scala BulkLoad 多列KeyValue（未成功-相同RowKey）

2020-06-16 02:44:19

https://github.com/tektoncd/pipeline/blob/master/docs/tutorial.md 安裝Tekton CLI（與Tekton交互的CLI） curl -LO https://gi

2020-02-20 17:32:38

kubectl apply --filename https://storage.googleapis.com/tekton-releases/pipeline/previous/v0.9.2/release.yaml

2020-02-20 17:32:38

一、定義PipelineResource apiVersion: tekton.dev/v1alpha1 kind: PipelineResource metadata: name: resource-git-for-mave

2020-02-20 17:32:37

一、優化前： shuffle寫的比例爲輸入數據的1.5倍：二、優化後：三、RDD壓縮 spark.shuffle.compress 序列化後，shuffle write仍然較大，考慮壓縮 sparkConf.set("sp

2019-06-10 14:29:56

文章目錄一、遞歸遍歷HDFS並篩選文件1-1、對於本地文件系統1-2、對於HDFS文件系統二、Spark集羣模式記錄自己的調試日誌2-1、Spark默認log4j配置2-2、Yarn運行時，使用自定義配置文件的幾種方式2-3、自定

2019-05-21 14:04:22

一、需求語音增強遷移訓練時，希望在CNN後面接2層LSTM 但是後面幾層CNN（VGG16）的feature map尺寸太小，怕LSTM學不到東西恢復前7層CNN的權重，然後第7層的輸出reshape之後作爲LSTM的輸入恢復

2019-04-08 14:00:51

組機緣由：最近兩次實習的工作內容，都與大數據關聯不大，所積累的一些本就學得不深的知識便忘得不少。深度學習和大數據都很感興趣，考慮到畢設是深度學習項目，故準備過幾天投一些大數據的實習崗。利用週末的時間，搗鼓畢設。這樣一來，做大數據，

2019-02-14 16:06:27

2019-01-06 16:47:31

自定義DataGenerator 生成器，結合for循環以及yield來產生數據 import numpy as np class DataGenerator(object): def __init__(self, b

2018-12-23 17:16:31