原创 常見的風險欺詐方式(僅供參考,未完待續)
常見的盜卡場景: 網銀交易:點卡交易(虛擬卡類)、通過網購信息等 P2P場景(貸款信息泄露):舉例:早上在A貸款平臺註冊諮詢,下午收到騙子電話冒充是A平臺工作人員,提出各種誘惑貸款人的條件獲取相關重要信息 注意:一些快遞鏈接、紅包鏈接都有
原创 數據挖掘分析相關面試題(親身經歷),持續更新中(最新一次爲20200413)
以下大多數都是博主或者博主同事經歷過的面試題喲~關於工作內容的就不寫啦,一些基礎面試題跟大家分享下 多看看面試題也能夠讓你快速瞭解自己的能力和短缺的地方哦~ 本篇博客會持續更新,也希望大家多多提供一些面試題哦~ 1、基礎面試 (1) 自我
原创 客戶價值分析和精準營銷
整理中... 參考鏈接: (1)https://blog.csdn.net/wanglingli95/article/details/79444432
原创 用戶生命週期如何判斷
整理中.... 參考鏈接: (1)https://blog.csdn.net/k7Jz78GeJJ/article/details/79434904
原创 流失用戶分析相關研究專題(包括如何定義和召回)
整理中...
原创 spark-sql跑數據Failed with exception java.io.IOException:org.apache.parquet.io.ParquetDecodingExceptio
錯誤信息: Failed with exception java.io.IOException:org.apache.parquet.io.ParquetDecodingException: Can not read value at 0
原创 機器學習特徵工程--標準化和歸一化
關於歸一化和標準化 1.標準化使用條件 (1)不需要對特徵進行歸一化:基於樹模型的方法 舉例: 隨機森林/bagging/boosting/xgboost 需要標準化的(基於距離的模型):迴歸分析(邏輯迴歸)/神經網絡 / svm 2.
原创 Mac 解壓rar 文件
Mac 解壓rar 文件 第一種方法: 下載下面鏈接中的軟件,安裝好就可以直接用了。 http://baijiahao.baidu.com/s?id=1604390455412644388&wfr=spider&for=pc 安裝過程中,
原创 MAC版本的UltraEdit破解方法
MAC版本的UltraEdit破解方法: 解壓,然後在命令行裏輸入 printf '\x31\xC0\xFF\xC0\xC3\x90' | dd seek=$((0x777160)) conv=notrunc bs=1 of=/Appli
原创 特徵處理過程 中的 獨熱編碼(onehot)與啞變量及python 代碼實現
爲什麼要用onehot: 二. 爲什麼使用one-hot編碼來處理離散型特徵? 1.使用one-hot編碼,將離散特徵的取值擴展到了歐式空間,離散特徵的某個取值就對應歐式空間的某個點。 2.將離散特徵通過one-hot編碼映射到歐式空間
原创 Kmeans聚類原理及python實現代碼
kmeans 原理: (1)首先,隨機確定k個初始點的質心; (2)然後將數據集中的每一個點分配到一個簇中,即爲每一個點找到距其最近的質心,並將其分配給該質心所對應的簇; (3)對每一個簇,計算簇中所有點的均值並將均值作爲質心(例:在三維
原创 MAC 安裝mysql 連接驅動ODBC時安裝錯誤
應用場景:使用tableau連接時mysql時,提示需要安裝驅動,如下圖然後需要安裝連接驅動,odbc下載地址:https://dev.mysql.com/downloads/connector/odbc/原因:未安裝odbc管理器下載地
原创 Mac Kettle安裝教程
第一步:先安裝jdkhttp://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html下載mac版的,下載
原创 ks(洛倫茲曲線)指標理解
KS(Kolmogorov-Smirnov)值越大,表示模型能夠將正、負客戶區分開的程度越大。KS值的取值範圍是[0,1] 通常來講,KS>0.2即表示模型有較好的預測準確性。ks求解方法:ks需要TPR和FPR兩個值:真正類率(true