原创 幾種半監督的python實現(標籤傳播、半監督Kmeans、自訓練)

半監督學習:綜合利用有類標的數據和沒有類標的數據,來生成合適的分類函數。它是一類可以自動地利用未標記的數據來提升學習性能的算法。 一、LabelPropagation和LabelSpreading (1)標記傳播算法: 優點:概念

原创 面試準備——機器學習中的優化器算法

一、優化問題 總體來看,機器學習的核心目標是給出一個模型(一般是映射函數),然後定義對這個模型好壞的評價函數(目標函數),求解目標函數的極大值或者極小值,以確定模型的參數,從而得到我們想要的模型。在這三個關鍵步驟中,前兩個是機器學

原创 判別函數之最小均方誤差(LMSE)算法原理及python實現

一、原理 1.1 前言 感知器算法只是當被分模式可用一個特定的判別界面分開時才收斂,在不可分情況下,只要計算程序不終止,它就始終不收斂。 即使在模式可分的情況下,也很難事先算出達到收斂時所需要的迭代次數。這樣,在模式分類過程中,有

原创 jieba關鍵詞提取的源碼解析

一、簡介 1.1 什麼是關鍵詞 關鍵詞是指能反映文本主題或者意思的詞語,如論文中的Keyword字段。 關鍵詞提取是文本挖掘領域一個很重要的部分,通過對文本提取的關鍵詞可以窺探整個文本的主題思想,進一步應用於文本的推薦或文本的搜索

原创 python手動實現MLP神經網絡及反向傳播

一、簡介 使用公共數據集UCI乳房威斯康辛乳腺癌數據,來實現兩層感知器(MLP)算法。 二、實現步驟 數據集分割 首先打亂數據集。將數據集分割爲5個部分來進行交叉摺疊驗證:5個子集中的每一個都被用作測試集和剩餘數據用於訓練。五個子

原创 win10系統解決office16的VBE6EXT.OLB不能被加載的問題

環境: win10 office16 原因: 本人電腦裝上mathtype後某一天突然出現這個問題,打開VB編輯器就內存溢出,不停地彈出提示框,導致無法使用宏。 雖然本人電腦上沒裝WPS,但看網上說很大可能是同時安裝了offi

原创 使用pytorch時遇到的問題彙總

報錯TypeError: unhashable type: 'numpy.ndarray' 原因:在將pytorch的longTensor轉爲numpy,並用於dict的key的時候,會出現這樣的錯誤。其實程序輸出已經是int

原创 梯度消失、梯度爆炸及其表現和解決方法

一、梯度消失 梯度消失出現的原因: 在深層網絡中,如果激活函數的導數小於1,根據鏈式求導法則,靠近輸入層的參數的梯度因爲乘了很多的小於1的數而越來越小,最終就會趨近於0,例如sigmoid函數,其導數f′(x)=f(x)(1−f(

原创 LeetCode總結——從2Sum、3Sum、3Sum Closest、4Sum到kSum

leetcode求和問題描述(K sum problem): 給你一組N個數字(nums), 然後給你一個常數(target) ,我們的目標是在這一堆數裏面找到K個數字,使得這K個數字的和等於target。 注意事項(constr

原创 使用sklearn、matplotlib等庫時遇到的問題彙總

sklearn接口下的xgboost多分類時報錯:label and prediction size not match, hint: use merror or mlogloss for multi-class classi

原创 二分類和多分類的性能評價指標及python計算

一、二分類 real\predict Positive Negative True TP FN False FP TN (注意:True和Negative交叉處應爲FN而非TN,因爲是錯誤地預測爲反例,Fal

原创 把pip源從國外官方更換到國內鏡像

pip國內的一些鏡像 阿里雲 https://mirrors.aliyun.com/pypi/simple/ 中國科技大學 https://pypi.mirrors.ustc.edu.cn/simple/ 豆瓣(douban)

原创 解決類別不平衡問題的方法綜述

一、數據不平衡 1.1 什麼是數據不平衡 在學術研究與教學中,很多算法都有一個基本假設,那就是數據分佈是均勻的。當我們把這些算法直接應用於實際數據時,大多數情況下都無法取得理想的結果。因爲實際數據往往分佈得很不均勻,都會存在“長尾

原创 面試準備——計算機原理基礎常見問題

一、TCP三次握手四次揮手 TCP連接的建立(三次握手) 最開始的時候客戶端和服務器都是處於CLOSED狀態。主動打開連接的爲客戶端,被動打開連接的是服務器。 第一次握手:建立連接時,客戶端發送syn包(syn=x)到服務器,並進

原创 面試準備——概率題/智力題

1. 一根木棒折成三段,能組成三角形的概率 解法1 設長度爲L,第一段長度爲x,第二段長度爲y,第三段長度爲z,則 Ω1={(x,y,z);x,y,z>0,x+y+z=L} \Omega_{1}=\{(x, y, z) ; x,