原创 PCA解析

1.例子引入   如圖所示,我們要將兩類點(紅點和藍點)分類,希望能先通過降維之後再分類(直接分肯定也能分開)。那麼我們需要將二維的數據(每個點包含橫座標和縱座標,是二維的)降維到一維直線上的點。   我們可以有多種降維的策略,

原创 Python中list(列表)

  Python中常見的序列(Sequence)類型有三種:list,tuple, range。這裏講解list,即列表。list中大多數方法繼承自Sequence中,僅僅少數幾個自己的方法,如sort(),用來排序。 list可

原创 關聯性挖掘--Apriori算法詳解

  首先,要感謝譚武和張朋博同學的PPT,懷念以前一起學習數據挖掘十大算法的時光! 1.關聯挖掘例子 啤酒和尿布的故事:   在一家超市中,人們發現了一個特別有趣的現象:尿布與啤酒這兩種風馬牛不相及的商品居然擺在一起。但這一奇怪

原创 ELMo代碼詳解(一):數據準備

ELMo代碼解讀筆記 1.數據準備   數據準備包括:1.生成word的詞彙表類; 2.生成字符的詞彙表類; 3.以word-ids作爲輸入的訓練batch生成類; 4.以char-ids作爲輸入的訓練batch生成類; 5.生

原创 支持向量機(SVM)推導

1.svm定義   SVM從線性可分情況下的最優分類面發展而來 。最優分類面就是要求分類線不但能將兩類正確分開( 訓練錯誤率爲0),且使分類間隔最大。SVM 考慮尋找一個滿足分類要求的超平面,並且使訓練集中的點距離分類面儘可能的遠

原创 AdaBoost詳解

本博客內容摘自李航老師的《統計學習方法》,加以一些整理。 相關概念   提升(boosting)方法是一種常用的統計學習方法,應用廣泛且有效。在分類問題中,它通過改變訓練樣本的權重,學習多個分類器,並將這些分類器進行線性組合,提高

原创 前向傳播算法和反向傳播算法

  最近在看神經網絡中的前向傳播算法(FP)和反向傳播算法(BP),特地進行總結一下,方便以後理解。 1.基本概念   上圖是一張自己畫的神經網絡的圖。假設每一層都添加了偏度單元(即值爲1的神經元),用來表示閥值(因爲閥值通常是

原创 樸素貝葉斯詳解

  樸素貝葉斯分類是一種十分簡單的分類算法,它的核心思想就是:求解某樣本在此特徵組合情況下屬於各個類別的概率,哪個類別對應的概率最大,就猜測屬於該類別。舉個例子,當你看到今天的溫度,溼度和空氣狀況,判斷今天屬於春天還是冬天;假如你

原创 EM算法

  首先感謝高佩旭同學的PPT,很懷念以前一起學習數據挖掘十大算法的時光。 1.問題引入 一般情況:   假設我們遇到這樣一個問題:我們需要調查我們學校的男生和女生的身高分佈。採取抽樣調查的方法,在校園裏隨便選取100個男生和10

原创 scikit-learn中隨機森林使用詳解

  最近學了一下隨機森林,本來想自己總結一下,但是覺得有一篇已經很好的博客,就給大家分享,我主要講講scikit-learn中如何使用隨機森林算法。   scikit-learn中和隨機森林算法相關的類爲RangeForestCl

原创 mybatis中SqlSession一定要關閉

   今天在使用mybatis查詢數據時,出現了一個很奇怪的問題。同一條sql語句,查詢時快時慢,並且有一定的規律性,大概每10次查詢中有一次會特別特別的慢,快的只需要1ms,慢的要20000ms,sql代碼及快慢時間截圖如下:

原创 tkinter # If this fails your Python may not be configured for Tk解決方法

  今天在Python中畫圖,用的是matplot,結果執行的時候出現這個錯誤。   tkinter其實是Python調用tcl程序的標準Python程序,可以通過這個interface調用tcl的程序,因爲在大多數的unix系統

原创 TensorFlow中Variable()和get_variable()

  tf.Variable()和tf.get_variable()都可以用來創建變量,但是前者會自動保證唯一性,而後者不能保證唯一性。 1 tf.Variable: Variable(initial_value=None, tra

原创 markdown數學公式手冊

  這幾天寫博客,需要寫一些數學公式,在百度上找了半天關於markdown數學公式手冊,都沒有找到,好不容易在google上找到,這裏分享給大家,好用記得點贊哦!!! 手冊鏈接:https://www.zybuluo.com/c

原创 leetcode5:最長迴文子串

  這個題目主要是運用manacher算法,又稱爲馬拉車算法,下面對算法進行介紹。 manacher算法   首先,定義一些變量,假設當前訪問的是第i 個位置:     1.p[i]: 表示以第i 個字符爲中心的最長迴文子串的半