原创 從文檔相似度計算看LSH(Locality Sensitive Hashing)

經常使用的哈希函數,衝突總是不招人喜歡。LSH卻依賴於衝突,在解決NNS(Nearest neighbor search )時,我們期望: 離得越近的對象,發生衝突的概率越高 離得越遠的對象,發生衝突的概率越低 由於是依靠概率來區分,總會

原创 Windows10系統下,徹底刪除卸載MySQL

由於忘記MySQL root密碼,根據網上的教程操作mysqld --skip-grant-tables 後連接 mysql -uroot -p 又還是告訴我access denied ,我覺得mysql應該是被我玩壞了,又沒空仔細研究了

原创 [機智的機器在學習] 機器學習中的歸一化和正則化問題

今天我們要說的是,在機器學習常用的算法裏面,那些需要歸一化,那些不需要,通過scikit-learn中的預處理的一些方法,實際瞭解如何正則化和歸一化數據。看完本文,應該對於一般的機器學習任務,都可以輕鬆上手操作。 先看一下歸一化是什麼意思

原创 Sklearn-LogisticRegression邏輯迴歸參數詳解

邏輯迴歸: 可以做概率預測,也可用於分類,僅能用於線性問題。通過計算真實值與預測值的概率,然後變換成損失函數,求損失函數最小值來計算模型參數,從而得出模型。   sklearn.linear_model.LogisticRegressio

原创 使用sklearn進行數據預處理之Binarizer,LabelEncoder,LabelBinarizer,OneHotEncoder

前言 數據預處理的過程中經常需要對數據進行數值化等處理,比如將性別男女轉換爲計算機可以理解的1和0,還有將數值化的1,2,3,4,5按照閾值3轉換爲0,0,0,1,1等,下面介紹一下sklearn提供的類。 Binarizer 這個就是根

原创 機器學習之特徵工程之特徵選擇

轉載:https://cloud.tencent.com/developer/article/1055767 一個基本的數據挖掘場景如下: 數據挖掘.jpg 從上面的數據挖掘場景可知,當數據預處理完成後,我們需要選擇有意義的特徵,輸入機

原创 Spring Boot Schedule定時任務要點

 @Scheduled   定時任務可以有很多寫法,我覺得最簡單的就是用註解的方式,如果你的項目用的是spring boot框架,就可以三步完成: 一,添加@EnableScheduling註解到入口類聲明上面 /**  * 啓動  *

原创 nginx代理配置

1. 最簡反向代理配置 在http節點下,使用upstream配置服務地址,使用server的location配置代理映射。 upstream my_server {

原创 【詳解】銀行信用評分卡中的WOE在幹什麼?WOE的意義?爲什麼可以使用WOE值代替原來的特徵值來做LR的訓練輸入數據

其實我是帶着這個問題發現這篇帖子的 爲什麼可以使用WOE值代替原來的特徵值來做LR的訓練輸入數據 以下爲原文 https://zhuanlan.zhihu.com/p/30026040 WOE & IV woe全稱叫Weight of E

原创 iview的Cascader的on-change需要傳入第三或者更多參入如何做?

@on-change="(value,selectedData)=>{setOption(value, selectedData,index)}" 增加Cascader on-change屬性 setOption爲自定義的方法名,inde

原创 linux 上傳文件rz -bye

我們知道用linux命令rz/sz可以通過一些終端軟件如secureCRT等在linux服務器與本地windows之間傳文件。在服務器上rz一下,在本地windows下就跳出一個窗口,選擇文件後就傳到了服務器上;而在服務器上用sz命令sz

原创 windows 10 下pip install 報錯【PermissionError: [WinError 32] 另一個程序正在使用此文件,進程無法訪問。】

1、在windows 10 下使用 pip 3 執行 pip install pathos 報錯 Exception: Traceback (most recent call last):   File "C:\ProgramData\

原创 freemaker.charset與project\file-encoding編碼問題

1、問題背景: 接手新項目,項目框架爲spring-boot+freemaker,Gradle管理 2、部署過程 觀察到application.properties文件中有該設置 spring.freemaker.charset =  G

原创 MARK:簡述多種降維算法

最近看了一些關於降維算法的東西,本文首先給出了七種算法的一個信息表,歸納了關於每個算法可以調節的(超)參數、算法主要目的等等,然後介紹了降維的一些基本概念,包括降維是什麼、爲什麼要降維、降維可以解決維數災難等,然後分析可以從什麼樣的角度來

原创 手動安裝nodejs模塊

簡介 在使用nodejs開發項目的時候,經常性會碰到模塊無法安裝的情況 有時候可能是npm源的問題,有時候可能是被公司牆的問題,這時候就需要手動來安裝nodejs模塊了 斷網的機器,沒法直接 npm install xxx 怎麼辦? 項目