原创 論文中如何實現公式居中並且編號右對齊

確定頁面中心與右側位置 通過頁面佈局查看。 如上圖我們知道【寬度】爲21釐米;【頁邊距】【左】:1.7;【右】1.7; 計算中心(21-1.7-1.7)/2=?;右邊位置(21-1.7-1.7)=?;這裏只是單欄,雙欄需要嘗試一下

原创 Java 讀取 properties 配置文件的幾種方式及注意點

1、引言 java開發中,經常需要讀取配置文件,有時即使我們方法是對的,但是就是讀取不到需要的內容,會報下面的錯: java.io.FileNotFoundException: sr/configure/config.properti

原创 StreamSets 從Mysql到Hbase(帶kerberos認證)的實時數據採集

引言 最近在研究StreamSets,就做了個簡單Demo熟悉它的使用,由於我們的hbase是cdh版的,且帶有kerberos認證,與streamsSet怎麼配帶kerberos認證的Hbase中文資料甚少,所以本人就去官網翻看了一

原创 KafkaOffsetMonitor監控工具的安裝與參數說明(該方法避免了監控頁面內容無法顯示和Java客戶端消費者組無法監控等問題)

概述 一個小應用程序來監視kafka消費者的進度和它們的延遲的隊列。 KafkaOffsetMonitor是用來實時監控Kafka集羣中的consumer以及在隊列中的位置(偏移量)。 你可以查看當前的消費者組,每個topic隊列的所

原创 datax初識(安裝與測試)

1 一些概念 數據集成(data integration):數據集成是把不同來源、格式、特點性質的數據在邏輯上或物理上有機地集中,從而爲企業提供全面的數據共享。 全量與增量:全量,每天定時(避開業務高峯期)或者週期性全量把數據從一個地

原创 kafkas小結

創建話題 生產者寫消息 消費者消費消息 查看話題狀態信息 2爲leader; Isi:處於同步轉態的副本 幹掉一個一個kafka進程(leader所在節點) 代碼 import java.util.P

原创 Storm使用小結

文章目錄引言相關概念storm集羣搭建案例需求說明代碼與實踐提交storm集羣運行打成jar包執行效果 引言 Storm是一個開源的分佈式實時計算系統,可以簡單、可靠的處理大量的數據流。Storm的部署和運維都很便捷,而且更爲重要的是

原创 信用卡欺詐檢測機器學習案例(LR、RF)

import pandas as pd import matplotlib.pyplot as plt import numpy as np %matplotlib inline pandas 一些知識點 frame=pd

原创 梯度與梯度下降法

本文主要使用markdown進行編輯的。 概述 導數 導數與偏導數 導數與方向導數 導數與梯度 梯度下降 Momentum optimization NAG AdaGrad RMSprop Adam 學習速率 代碼示例 參考文獻

原创 利用最小二乘法做線性迴歸

最小二乘法概述 線性迴歸示例 最小二乘法梯度下降 最小二乘法概述 對於一元線性迴歸模型, 假設從總體中獲取了n組觀察值(x1,y1)(x1,y1) ,(x2,y2)(x2,y2) ,… ,(xn,yn)(xn,yn) 。對於平面

原创 關於python正則表達式的一些常見知識點

import re pat="yue" str="http://yum.qiqyue.com" re.search(pat,str) <_sre.SRE_Match object; span=(14, 17), match='yue'>

原创 科比生涯數據集分析與預測

import numpy as np import pandas as pd import matplotlib.pyplot as plt %matplotlib inline from sklearn.ensemble import

原创 Mac系統下anaconda的Python3中的matplotlib的中文顯示問題解決

一、Mac需要先下載simhei.ttf字體並安裝,之後按照下面步驟首先將simhei.ttf拷貝到~python安裝路徑/site-packages/matplotlib/mpl-data/fonts/ttf目錄中;首先我們在pytho

原创 數據預處理(1)——數據清洗

一、介紹    數據清洗主要內容是刪除原始數據集中的無關數據、重複數據,平滑噪聲數據,刷選掉與挖掘主題無關的數據,處理缺失值、異常值等。二、缺失值處理    缺失值處理的方法分爲三類:刪除記錄、數據插補和不處理。常見的數據插補方法如下圖:

原创 ubuntu16安裝tensorflow GPU版出現循環登錄

問題描述 安裝版本:ubuntu 16.04+tensorflow1.5+Cuda9.0+Cudnn v7 其實,我安裝TensorFlow後(安裝過程中也重啓過),還跑了幾個簡單的demo,也關機重啓過幾次都沒有問題。不知怎麼又一次重