台部落张小凡vip

一般我們在運行spark任務時，需要查看他的運行情況。比較常用的方式就是在spark的UI界面上查看。一般的spark 因爲driver所在的node是固定的，ip也就是固定的，所以能夠通過ip或者域名映射後即可很方便的進行訪

2020-02-25 23:23:16

ingress中traefik的使用方式如下: apiVersion: extensions/v1beta1 kind: Ingress metadata: name: spark-client-test namespac

2020-02-25 23:23:16

我們在上篇文章已經學習使用spark on k8s的client mode 運行了spark shell 和提交jar包運行任務。 hadoop組件—spark實戰----spark on k8s模式k8s原生方式安裝spark2

2020-02-23 17:26:25

我們在上篇文章中已經成功運行使用spark-submit提交了python程序運行spark。 hadoop組件—spark實戰----spark on k8s模式k8s原生方式安裝spark2.4.4 client mode提交

2020-02-23 17:26:25

conda簡介 Conda 是一個開源的軟件包管理系統和環境管理系統，用於安裝多個版本的軟件包及其依賴關係，並在它們之間輕鬆切換。 Conda 是爲 Python 程序創建的，適用於 Linux，OS X 和Windows，也可以

2020-02-23 17:26:25

我們在之前的文章中已經嘗試安裝了hail和簡單的使用數據挖掘(五) -----基於Spark的可伸縮基因數據分析平臺開源存儲運算架構hail全面瞭解和安裝但是我們發現這種hail的運行方式是需要進入到conda的hail

2020-02-23 17:26:25

我們在上篇文章中已經學習了如果使用phoenix的shell命令行工具進行增刪改查，同時明確了 phoenix要查詢hbase原生建立的表需要創建映射表或者映射視圖。 hadoop組件—面向列的開源數據庫(七)–phoen

2020-02-23 17:26:25

目前最新穩定版本2.4.4的官方安裝文檔環境準備 1、使用spark2.3以上的spark版本 2、已經在運行的k8s集羣版本需要大於1.6 使用命令查詢 kubectl version 輸出爲: zhangxiaofans-

2020-02-23 17:26:25

情況執行一個長連接訪問的方法，執行到一半後沒有日誌輸出了。初步判斷爲pod已經被重啓了。原因使用命令排查如下: [zzq@localhost zzq]$ kubectl get pods |grep report-api

2020-02-23 17:26:25

Python使用thrift操作HBase thrift支持多種語言進行連接使用，但是沒找到linux中的cli操作命令行的形式。所以如果服務器有python環境的話，可以使用python進行連接，快速測試。確認hbase和th

2020-02-23 17:26:25

我們在之前的文章中已經瞭解了 spark支持的模式，其中一種就是使用k8s進行管理。 hadoop組件—spark----全面瞭解spark以及與hadoop的區別是時候考慮讓你的 Spark 跑在K8s 上了 spark

2020-02-23 17:26:25

情況使用httpClient 4.5.3版本的默認重試策略DefaultHttpRequestRetryHandler. httpclient默認會有三次重試，但是生產環境運行時發現超時報錯並沒有進行重試。報錯信息如下

2020-02-23 17:26:25

phoenix簡介我們在之前得文章中已經學習了thrift 以及使用 thrift 對hbase進行訪問。 hadoop組件—面向列的開源數據庫(三)—hbase的接口thrift簡介和安裝 hadoop組件—面向列的開源數據庫

2020-02-23 17:26:25

遇到問題----executor無法刪除一直重啓序號自增如下: [zzq@localhost spark-2.4.4-bin-hadoop2.7]$ kubectl get pods |grep spark spark-1529

2020-02-23 17:26:25

使用boto3根據路徑設置生命週期–過期刪除 import boto3 import time s3 = boto3.resource('s3', region_name='cn-xxxxxx-1') def set_lif

2020-02-23 17:26:25