原创 常見的風險欺詐方式(僅供參考,未完待續)

常見的盜卡場景: 網銀交易:點卡交易(虛擬卡類)、通過網購信息等 P2P場景(貸款信息泄露):舉例:早上在A貸款平臺註冊諮詢,下午收到騙子電話冒充是A平臺工作人員,提出各種誘惑貸款人的條件獲取相關重要信息 注意:一些快遞鏈接、紅包鏈接都有

原创 數據挖掘分析相關面試題(親身經歷),持續更新中(最新一次爲20200413)

以下大多數都是博主或者博主同事經歷過的面試題喲~關於工作內容的就不寫啦,一些基礎面試題跟大家分享下 多看看面試題也能夠讓你快速瞭解自己的能力和短缺的地方哦~ 本篇博客會持續更新,也希望大家多多提供一些面試題哦~ 1、基礎面試 (1) 自我

原创 客戶價值分析和精準營銷

整理中... 參考鏈接: (1)https://blog.csdn.net/wanglingli95/article/details/79444432

原创 用戶生命週期如何判斷

整理中.... 參考鏈接: (1)https://blog.csdn.net/k7Jz78GeJJ/article/details/79434904

原创 spark-sql跑數據Failed with exception java.io.IOException:org.apache.parquet.io.ParquetDecodingExceptio

錯誤信息: Failed with exception java.io.IOException:org.apache.parquet.io.ParquetDecodingException: Can not read value at 0

原创 機器學習特徵工程--標準化和歸一化

關於歸一化和標準化 1.標準化使用條件 (1)不需要對特徵進行歸一化:基於樹模型的方法 舉例:  隨機森林/bagging/boosting/xgboost 需要標準化的(基於距離的模型):迴歸分析(邏輯迴歸)/神經網絡 / svm 2.

原创 Mac 解壓rar 文件

Mac 解壓rar 文件 第一種方法: 下載下面鏈接中的軟件,安裝好就可以直接用了。 http://baijiahao.baidu.com/s?id=1604390455412644388&wfr=spider&for=pc 安裝過程中,

原创 MAC版本的UltraEdit破解方法

MAC版本的UltraEdit破解方法: 解壓,然後在命令行裏輸入 printf '\x31\xC0\xFF\xC0\xC3\x90' | dd seek=$((0x777160)) conv=notrunc bs=1 of=/Appli

原创 特徵處理過程 中的 獨熱編碼(onehot)與啞變量及python 代碼實現

爲什麼要用onehot: 二.  爲什麼使用one-hot編碼來處理離散型特徵? 1.使用one-hot編碼,將離散特徵的取值擴展到了歐式空間,離散特徵的某個取值就對應歐式空間的某個點。 2.將離散特徵通過one-hot編碼映射到歐式空間

原创 Kmeans聚類原理及python實現代碼

kmeans 原理: (1)首先,隨機確定k個初始點的質心; (2)然後將數據集中的每一個點分配到一個簇中,即爲每一個點找到距其最近的質心,並將其分配給該質心所對應的簇; (3)對每一個簇,計算簇中所有點的均值並將均值作爲質心(例:在三維

原创 MAC 安裝mysql 連接驅動ODBC時安裝錯誤

應用場景:使用tableau連接時mysql時,提示需要安裝驅動,如下圖然後需要安裝連接驅動,odbc下載地址:https://dev.mysql.com/downloads/connector/odbc/原因:未安裝odbc管理器下載地

原创 Mac Kettle安裝教程

第一步:先安裝jdkhttp://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html下載mac版的,下載

原创 ks(洛倫茲曲線)指標理解

KS(Kolmogorov-Smirnov)值越大,表示模型能夠將正、負客戶區分開的程度越大。KS值的取值範圍是[0,1] 通常來講,KS>0.2即表示模型有較好的預測準確性。ks求解方法:ks需要TPR和FPR兩個值:真正類率(true