原创 第六章-酸奶飲料新產品口味測試研究案例

項目背景:在問卷調研的基礎上,分析兩種新口味酸奶飲料口味情況; 分析思路:主要通過均數比較的方式,評價口味的差別,因此使用方差分析; 數據分析: 1.通過:分析--描述--交叉表 查看樣本的分佈情況;總的來看每個城市的樣本量都大於30,符

原创 基於集成算法GBDT和RandomForest的投票組合模型的異常檢測----python數據分析與數據運營

本文基於python數據分析與數據化運營-第六章學習筆記,數據與大部分代碼均來源數據該書; 棘突某企業的訂單數據(含異常訂單),建立分類模型,實現異常訂單檢測 案例數據:13*134190,有異常值和缺失值;字段:order_id,ord

原创 基於SPSS的中國消費者信心指數影響因素分析-----相關性分析

說明:本案例基於spss數據分析與挖掘實戰案例精粹----第10章 案例背景:對受訪者的背景資料對消費者信心指數的影響加以研究,並進一步考察其內部的詳細作用方式; 分析方法:使用方差分析對自變量進行篩選,然後建議多元迴歸方差,進一步考察變

原创 利用SPSS實現邏輯迴歸,樹模型,以及廣義線性模型

本案例是IBM SPSS數據分析與挖掘實戰案例精粹----第九章的學習記錄 案例背景:分析出導致急救後遲發性顱腦損傷的主要影響因素,共有201項案例: 分析思路:先使用logistic迴歸模型進行影響因素篩選,然後利用分類樹探索自變量中是

原创 基於Gradient Booting的自動化超參數優化的銷售預測----python數據分析與數據運營

本文基於python數據分析與數據化運營-第六章學習筆記,數據與大部分代碼均來源數據該書; 案例背景針對某單品的訂單量預測應用 數據介紹:731*10數據,有缺失及異常值,字段包括,是否有限購,促銷活動類型,促銷活動重要性,產品重要性分級

原创 營銷響應預測分析----python數據分析與數據化運營

本文基於python數據分析與數據化運營-第五章學習筆記,數據與大部分代碼均來源數據該書; 案例背景:會員部門在做會員營銷時,希望能通過數據預測在下一次營銷活動時,響應活動會員的具體名單和響應概率,以此制定針對性的營銷策略 案例數據介紹:

原创 spss實戰案例----分析多個變量與因變量之間是否存在關係,方差分析

本案例是IBM SPSS數據分析與挖掘實戰案例精粹----第七章的學習記錄 案例背景或目標:激素水平是否在對照組和實驗組之間存在差異 分析方法:Bootstrap抽樣,秩和檢驗,秩變換方法,cox迴歸 字段包括:性別,年齡,萎縮程度,胃粘

原创 python數據分析與數據運營---第五章RFM實戰案例

5.7案例:基於RFM的精細化用戶管理 案例背景:在用戶2015-2018年訂單數據的基礎上,對用戶進行分羣,總結每個組用戶特徵,以便於精細化運營,制定定製化和差異性的營銷和關懷; 分析思路:基於RFM對用戶進行分羣,將三個維度分別作三個

原创 SPSS實戰案例--第四章

項目目標:在對客戶喜好調研的基礎上,搭建購物網站。 主要調研問題:性別,年齡,教育程度,購買習慣,購買產品傾向,是否有網絡購物經歷,網購月消費金額,支付方式; 多選題的數據轉換:多選題輸入時,一般以二分法進行輸入,可以定義“多重響應集”,

原创 第六章-

項目背景:在問卷調研的基礎上,分析兩種新口味酸奶飲料口味情況; 分析思路:主要通過均數比較的方式,評價口味的差別,因此使用方差分析; 數據分析: 1.通過:分析--描述--交叉表 查看樣本的分佈情況;總的來看每個城市的樣本量都大於30,符

原创 Kaggle房價預測

Kaggle房價預測         從去年9月份自學python以來,中間經理各種迷茫,但是依然堅持下來了。到現在開始要找工作了,在這之前,要花點時間把自己學習的知識複習回顧一遍,也要做一些實戰項目多多練習,以增加熟練度。本項目打算着重

原创 貸款數據探索風險分析(EDA)

項目介紹所謂探索性數據分析(Exploratory Data Analysis,以下簡稱EDA),是指對已有的數據(特別是調查或觀察得來的原始數據)在儘量少的先驗假定下進行探索,通過作圖、製表、方程擬合、計算特徵量等手段探索數據的結構和規

原创 泰坦尼克生存概率預測

(https://github.com/hpchihuo/titanic)項目背景:本項目從數據分析的角度,尋找與生存率項目相關的生存因素,建立邏輯迴歸模型預測tantic人員生存情況。1.提出問題:找出最優模型來預測titanic乘客生

原创 構建信用卡反欺詐預測模型——機器學習

本項目需解決的問題本項目通過利用信用卡的歷史交易數據,進行機器學習,構建信用卡反欺詐預測模型,提前發現客戶信用卡被盜刷的事件。建模思路項目背景數據集包含由歐洲持卡人於2013年9月使用信用卡進行交的數據。此數據集顯示兩天內發生的交易,其中