原创 python異常處理
異常處理要仔細,防治取不到值 zm_score = result["zm_score"] if 'zm_score' in result else None 這句話可以改成zm_score = result.get("zm_
原创 mysql編碼問題
mysql服務器出現編碼問題,使用set names utf8;語句解決
原创 sqoop併發度如果太小會怎麼樣
問題:sqoop 導入數據報內存溢出 解決:-m 100改成1024 思考:之前一直以爲sqoop -m參數設置的太小隻會影響運行時間。 結果昨天-m 100的時候一直崩,mentor設置成1024就解決了。
原创 flume配置
agent1.sources = source1 agent1.sinks = sink1 agent1.channels = channel1 source: agent1.sources.source1.channels = ch
原创 數據倉庫的Schema
公司etl的小姐姐表示 schema,類似於傳統的database的概念,只不過在數倉的概念下是個分層的概念,比如,dw1層是原始數據,經過處理形成dw2層,按照數據處理流程分成多層,也就是分成了多個schema。 但是和網上的一些說法出
原创 ubuntu使用記錄
調出terminal(shell終端):alt鍵+f2鍵調出運行程序對話框;輸入gnome-terminal回車調出終端窗口; 查看ubuntu32位還是64位:打開終端,輸入sudo uname --m ,按下enter 移動文件或者文
原创 Dubbo簡介
Dubbo:https://github.com/apache/incubator-dubbo http://dubbo.apache.org/en-us/ 分佈式服務治理框架,soa基礎框架 解決多項目間服務的互相調用 或者說是一個微服
原创 真融寶公司與大數據風控部門介紹
公司業務: 1理財:真融寶 2借貸:普惠 普惠業務: 1國內 1卡分期
原创 ssh登陸,報錯
服務器需要用ssh登陸,一開始碰到一個問題: 是因爲config文件有問題 漏了一個字母第一行前邊加個S,就解決了。
原创 Java與python的面向對象對比
Java Python public class Employee { public static int empCount = 0; String name; int salary;
原创 python dict 字典
字典是通過hash表的原理實現的,每個元素都是一個鍵值對,通過元素的鍵計算出一個唯一的哈希值,這個hash值決定了元素的地址,因此爲了保證元素地址不一樣,必須保證每個元素的鍵和對應的hash值是完全不同的,並且鍵的類型必須是不可修改的,所
原创 開發優化
如果一個結果集包含三個結果子集,用到三分源數據,但是結果子集1只用到源數據1,結果子集2只用到源數據1和源數據2,結果子集3只用到源數據1和源數據3,那麼應當拆分成三個程序,產生三個結果集。 程序讀取數據到內存,如果一天的數據集過大,應當
原创 設置idea本地測試spark的log日誌量
需求: 運行時log打印太多,以至於找不到有用信息,需要減少log量 解決: import org.apache.log4j._ object SparkStatFormatJob { Logger.getLogger("org")
原创 回溯和例行腳本分析
上一篇寫到回溯和例行的工作,這一片來分析回溯和例行的shell腳本 回溯: 啓動命令:nohup sh bin/回溯.sh >log.回溯 & 回溯.sh step=0 for((i=0;i<=400;i+=1)) do let
原创 sql 聚合函數有哪些
聚合函數是對一組值執行計算並返回單一的值的函數,它經常與SELECT語句的GROUP BY子句一同使用,SQL SERVER 中具體有哪些聚合函數呢?我們來一一看一下: 1. AVG 返回指定組中的平均值,空值被忽略。 例:s