原创 [DM實戰]航空公司客戶價值分析

1、背景與挖掘目標      信息時代的來臨使得企業營銷焦點從產品中心轉變爲客戶中心,而客戶關係管理的關鍵問題是客戶分類。      面對市場激烈的競爭,通過建立合理的客戶價值評估模型,對客戶進行分羣,分析比較不同客戶羣的客戶價值,並制定

原创 [DM實戰]電力竊漏電用戶自動識別

1、從電力計量自動化系統、營銷系統有選擇性地抽取部分大用戶用電負荷、終端報警及違約竊電出發信息等原始數據。 2、對樣本數據探索分析,剔除不可能存在竊漏電行爲行業的用戶,即白名單用戶,初步審視正常用戶和竊漏電用戶的用電特徵。       數

原创 [tianchi]移動推薦算法大賽[二]

有這麼一句話在業界廣泛流傳:數據和特徵決定了機器學習的上限,而模型和算法只是逼近這個上限而已。那特徵工程到底是什麼呢?顧名思義,其本質是一項工程活動,目的是最大限度地從原始數據中提取特徵以供算法和模型使用。 想了解更多特徵工程的相

原创 [DM實戰]基於水色圖像的水質評價

1、背景與挖掘目標 有經驗的從事漁業生產的從業者可通過觀察水色變化調控水質,以維持養殖體系水體生態系統中浮游植物、微生物類、浮游動物等合理的動態平衡。由於這些多是通過經驗和肉眼觀察進行判斷的,存在主管性引起的觀察性偏倚,使觀察結果的可比性

原创 [tianchi]移動推薦算法大賽[一]

天池大數據競賽-移動推薦算法大賽 本博客實現最簡單的用戶購買行爲預測流程:根據前一天的交互行爲,預測第二天的購買行爲。 1、查看、處理user表格和item表格 import pandas as pd import nump

原创 [DM實戰]家用電器用戶行爲分析與事件識別

1、家用企業若能深入瞭解不同用戶羣的使用習慣,開發新功能,就能開拓新市場。廠商可從熱水器智能操作和節能運行等多方面對產品進行優化。 熱水器廠商根據洗浴事件識別模型,對不同地區的用戶的用水進行識別,根據識別結果比較不同客戶羣客戶羣的客戶使用

原创 [DM實戰]中醫症型關聯規則挖掘

1、發現中醫症狀間的關聯關係和諸多症狀間的規律性,並且依據規則分析病因、預測病情發展以及爲未來臨牀診治提供有效借鑑。 根據數據實現以下目標: 1)藉助三陰乳腺癌患者的病理信息,挖掘患者的症狀與中醫證型之間的關聯關係。 2)對截斷治療提供依

原创 [python]百度貼吧爬蟲

eg. 爬取西安交通大學吧內容,並以['url':page_url,'title':title,'para':reply]形式存儲到MongoDB數據庫。 一、相關信息介紹 爬蟲是一段自動抓取互聯網信息的程序。一般情況下采取人工方式從互聯

原创 python下使用elasticsearch

1、簡介 ElasticSearch(簡稱ES)是一個分佈式、Restful的搜索及分析服務器,設計用於分佈式計算;能夠達到實時搜索,穩定,可靠,快速。和Apache Solr一樣,它也是基於Lucence的索引服務器,而Elasti

原创 C++面試知識點總結

一、多態性有哪些?(靜態和動態,然後分別敘述一下虛函數和函數重載)多態:指相同的對象收到不同的消息或者不同的對象收到相同的消息時產生的不同的實現動作。C++支持兩種多態:編譯時多態(靜態)、運行時多態(動態)編譯時多態:就是在編譯期確定的

原创 TensorFlow入門(1)

import tensorflow as tf hello = tf.constant("hello,tensorflow!") #創建一個常量 sess = tf.Session() #啓動Tensorflow的Session

原创 [DL] 識別圖中模糊的手寫數字

MNIST是一個入門級的計算機視覺數據集。當我們開始學習編程時,第一件事往往是學習打印Hello World。在機器學習入門的領域裏,我們會用MNIST數據集來實驗各種模型。 #自動下載與安裝MNIST數據集 import ten

原创 數據挖掘十大經典算法

數據挖掘基本任務:分類與預測、聚類分析、關聯規則、時序模式、偏差檢測、智能推薦等,幫助企業提取數據中蘊含的商業價值,提高企業的競爭力。 DM過程:        a目標定義(任務理解、指標確定)        b數據採集(建模抽樣、質量把

原创 [DL]單個神經元

一、神經元的擬合原理 一個神經元由以下幾個關鍵知識點組成:激活函數;損失函數;梯度下降。 單個神經元網絡模型: 其計算公式: 模型每次的學習都是爲了調整w和b,從而得到一個合適的值,最終由這個值配合運算公式所形成的邏輯就

原创 [NK]二叉搜索樹的後序遍歷序列

二叉搜索樹的後序遍歷序列 題目描述 輸入一個整數數組,判斷該數組是不是某二叉搜索樹的後序遍歷的結果。如果是則輸出Yes,否則輸出No。假設輸入的數組的任意兩個數字都互不相同。 #include <iostream> #include