原创 Shell腳本中替換字符串等操作
一、判斷讀取字符串值 表達式 含義 ${var} 變量var的值, 與$var相同 ${var-DEFAULT} 如果var沒有被聲明, 那麼就以$DEFAULT作爲其值 * ${var:-DEFAULT} 如果var沒有被聲明
原创 Apache Ambari 源碼編譯安裝
1、執行以下操作,本文選擇的Ambari是2.7.0版本; wget http://www.apache.org/dist/ambari/ambari-2.7.0/apache-ambari-2.7.0-src.tar.gz (use
原创 Atlas導入Hive元數據
1、設置hive-site.xml ; <property> <name>hive.exec.post.hooks</name> <value>org.apache.atlas.hive.hook.HiveH
原创 Apache Atlas 安裝
1、從官網下載源碼http://atlas.apache.org/Downloads.html ,本項目選擇source 0.8.2; 2、下載好包後,上傳到服務器中某個機器上;解壓包; tar -zxvf apach
原创 rm 刪除文件後磁盤依然佔用
lsof命令用於查看你進程開打的文件,打開文件的進程,進程打開的端口(TCP、UDP)。找回/恢復刪除的文件。是十分方便的系統監視工具,因爲lsof命令需要訪問核心內存和各種文件,所以需要root用戶執行。 在linux環境下,任何事物都
原创 Jar包在Eclipse中 中文亂碼
(1)檢查自己項目設置的編碼 (2)檢查導入的jar源代碼設置的編碼 (3)檢查Eclipse中文本文件設置的編碼 (4)檢查java源文件設置的編碼 (5)以上全部設置完之後,maven update項目 (6)
原创 mybatis:元素內容必須由格式正確的字符數據或標記組成
1、利用mybatis寫Dao層 @Select("<script> select count(*) from p_comment where 1=1 " +"<if test='csid != null'> and csid =
原创 協方差、相關係數
機器視覺中,常用到協方差相關的知識,特別是基於統計框架下的機器學習算法,幾乎無處不在的用到它,因此瞭解協方差是再基礎不過的了。這裏推薦一個很不錯的基礎教程:協方差的意義和計算公式均值和方差引入協方差之前,先簡單回顧下概率統計中的兩個重要
原创 特徵選擇和特徵理解
特徵選擇和特徵理解特徵選擇(排序)對於數據科學家、機器學習從業者來說非常重要。好的特徵選擇能夠提升模型的性能,更能幫助我們理解數據的特點、底層結構,這對進一步改善模型、算法都有着重要作用。特徵選擇主要有兩個功能:減少特徵數量、降維,使模型
原创 L1 L2範式
正則化(Regularization)機器學習中幾乎都可以看到損失函數後面會添加一個額外項,常用的額外項一般有兩種,一般英文稱作ℓ1ℓ1-norm和ℓ2ℓ2-norm,中文稱作L1正則化和L2正則化,或者L1範數和L2範數。L1正則化和L
原创 大規模數據處理中拒絕連接錯誤分析處理
1、處理的數據有幾百個G,把數據處理成按照手機號計算1萬多個特徵 ;2、數據處理環境: spark-2.0.2; --executor-memory 40g --total-executor-cores 120 --driv
原创 Mysql 使用關鍵字作爲字段的反例及數據庫命名規範
1、數據庫表的設計 CREATE TABLE `p_article_label` ( `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '編號', `group` int(3) DEFA
原创 LogisticRegression
1. 概述 在scikit-learn中,與邏輯迴歸有關的主要是這3個類。LogisticRegression, LogisticRegressionCV 和logistic_regression_path。其中LogisticRe
原创 ParameterizedType應用,java反射,獲取參數化類型的class實例
ParameterizedType是一個接口,這個類可以用來檢驗泛型是否被參數化比如:class Dao<T>{ public Dao(){ }}上面的這個類,也就是泛型類,當有子類集成它的時候,子類也許會將其參數化,當然也可能不
原创 使用jsoup選擇器來查找元素
一、用途 使用jsoup解析網頁,抓取手機型號和系統信息; 二、獲取方式 例子: /** * 獲取終端製造商鏈接列表 * * @return */ public List<VendorVo> getVendors()