目錄
一、背景
面對激烈的市場競爭,各個航空公司都推出了更優惠的營銷方式來吸引更多的客戶,國內某航空公司面臨着客戶流失、競爭力下降和航空資源未充分利用等經營危機。通過建立合理的客戶價值評估模型,對客戶進行分羣,分析比較不同客戶羣的客戶價值,並制定相應的營銷策略,對不同的客戶羣提供個性化的服務是必須和必要的。目前該航空公司已積累了大量的會員檔案信息和其乘坐航班積累,經加工後得到下圖所示的部分數據屬性定義信息。
需要根據這些數據實現以下目標。
- 對客戶進行分類。
- 對不同的客戶類別進行特徵分析,比較不同類別客戶的客戶價值。
二、分析方法與過程
在客戶分類中,RFM模型是一個經典的分類模型,模型利用通用交易環節中最核心的三個維度——最近消費(Recency)、消費頻率(Frequency)、消費金額(Monetary)細分客戶羣體,從而分析不同羣體的客戶價值。在某些商業形態中,客戶與企業產生連接的核心指標會因產品特性而改變。如互聯網產品中,以上三項指標可以相應地變爲下圖中的三項:最近一次登錄、登錄頻率、在線時長。
我們說RFM模型由R(最近消費時間間隔)、F(消費頻次)和M(消費總額)三個指標構成,通過該模型識別出高價值客戶。但該模型並不完全適合所有行業,如航空行業,直接使用M指標並不能反映客戶的真實價值,因爲“長途低等艙”可能沒有“短途高等艙”價值高。考慮到商用航空行業與一般商業形態的不同,決定在RFM模型的基礎上,增加2個指標用於客戶分羣與價值分析,得到航空行業的LRFMC模型:
- L:客戶關係長度。客戶加入會員的日期至觀測窗口結束日期的間隔。(反映可能的活躍時長)
- R:最近一次乘機時間。最近一次乘機日期至觀測窗口結束日期的間隔。(反映當前的活躍狀態)
- F:乘機頻率。客戶在觀測窗口期內乘坐飛機的次數。(反映客戶的忠誠度)
- M:飛行總里程。客戶在觀測窗口期內的飛行總里程。(反映客戶對乘機的依賴性)
- C:平均折扣率。客戶在觀測窗口期內的平均折扣率。(艙位等級對應的折扣係數,側面反映客戶價值高低)
2.1數據抽取
以2014-03-31爲結束時間,選取寬度爲兩年的時間段作爲分析觀測窗口,抽取觀測窗口內所有客戶的詳細數據形成歷史數據。對於後續薪資的客戶詳細信息,以後續薪資數據中最新的時間點作爲結束時間,採用同樣的方法進行抽取,形成增量數據。
根據末次飛行日期(LAST_FLIGHT_DATE),抽取2012-04-01日至2014-03-31期間的所有客戶數據,共有6萬餘條記錄44個屬性。
2.2 數據探索分析
本案例的探索分析是對數據進行缺失值分析與異常值分析。通過觀察數據發現存在票價爲空值,票價最小值爲0、折扣率最小值爲0、總飛行公里數大於0的記錄。票價爲空值的數據可能是客戶不存在乘機記錄造成,其他的數據可能是客戶乘坐0折機票或者積分兌換產生的。
過初步的數據探索,發現數據有幾點特徵:
1、共62988條記錄
2、部分維度存在缺失值,WORK_CITY缺失2269條,SUM_YR_1缺失551條,SUM_YR_2缺失138條
2.3 數據預處理
本案例主要採用數據清洗、屬性規約與數據變換的預處理方法。
2.3.1 數據清洗
通過數據探索分析,發現數據總存在缺失值,票價最小值爲0、折扣率最小值爲0、總飛行公里數大於0的記錄。由於原始數據量大,這類數據佔比較小,因此對其進行丟棄處理。
1、缺失值:票價爲null的數據(注意不是票價爲零)
2、異常值:票價爲0、平均折扣率不爲0、總飛行公里數大於0的數據(折扣不爲0,仍有飛行里程,說明客戶必然是花錢買票飛行的,如果此時票價也爲0,說明是錯誤數據)
共清洗944條異常數據,得到62044條有效記錄。
2.3.2 屬性規約
根據航空公司客戶LRFMC模型,選擇與LRFMC模型指標相關的6個屬性:FFP_DATE、LOAD_TIME、FLIGHT_COUNT、AVG_DISCOUNT、SEG_KM_SUM、LAST_TO_END。
2.3.3 數據變換
本案例中採用的數據變換方式爲屬性構造和數據標準化。
LRFMC模型中五項指標的計算公式:
(1)L = LOAD_TIME – FFP_DATE. (觀測窗口結束日期 – 入會日期)
(2)R = LAST_TO_END. (最後一次乘機時間至觀測窗口結束時長)
(3)F = FLIGHT_COUNT. (觀測窗口內的飛行次數)
(4)M = SEG_KM_SUM. (觀測窗口的總飛行公里數)
(5)C = AVG_DISCOUNT. (平均折扣率)
對每個指標數據的分佈情況進行分析,發現每個指標的數據取值範圍分佈較廣,爲消除數量級數據帶來的影響,還需要將L、R、F、M、C五類數據進行標準化處理。標準化方法有極大極小標準化、標準差標準化等方法,此處採用標準差標準化的方法對數據進行處理。
2.4 聚類分析
根據5個指標的數據對客戶進行聚類分羣,利用K-Means算法對客戶進行聚類分析,聚類結果如下圖所示。
注:a. 由於K-Means聚類是隨機選擇類標號,因此重複實驗結果中類標號可能與此不同;
b. 由於算法精度問題,重複實驗得到的聚類中心也可能略有不同;
c. 需要結合業務理解與分析來確定客戶的類別數量,此次選擇5個類別。
2.5特徵分析
結合業務對每個客戶羣進行特徵分析,分析客戶價值。
1、對細分的客戶羣進行特徵分析:
羣體1的C屬性上最大
羣體2的M、F屬性屬性最大,R屬性最小
羣體3的L、C屬性最小
羣體4的R屬性最大,F、M屬性最小
羣體5的L屬性最大
2、其中每項指標的實際業務意義爲:
L:加入會員的時長。越大代表會員資歷越久
R:最近一次乘機時間。越大代表越久沒乘機
F:乘機次數。越大代表乘機次數越多
M:飛行總里程。越大代表總里程越多
C:平均折扣率。越大代表折扣越弱,0表示0折免費機票,10代表無折機票
3、對應實際業務對聚類結果進行分值離散轉化,對應1-5分,其中屬性值越大,分數越高。
4、結合業務需要,參考RFM模型對客戶類別的分類,定義五個等級的客戶類別。指標大於平均值表示爲↑,小於平均值表示爲↓。
(1)重要保持客戶
- 平均折扣率高(C↑),最近有乘機記錄(R↓),乘機次數高(F↑)或飛行里程高(M↑),入會時間長(L↑)。
- 這類客戶機票票價高,不在意機票折扣,經常乘機,是最理想的高價值客戶,但所佔比例比較小。
- 公司應優先將資源投放到他們身上,維持這類客戶的忠誠度與滿意度,儘可能延長這類客戶的高消費水平。
(2)重要發展客戶
- 平均折扣率高(C↑),最近有乘機記錄(R↓),但乘機次數低(F↓)或飛行里程低(M↓),入會時間短(L↓)。
- 這類客戶機票票價高,不在意機票折扣,最近有乘機記錄,但總里程低,人如何時間短,是潛在價值客戶。雖然當前價值不是很高,但有很大的發展潛力。
- 通過客戶價值的提升,加強這類客戶的滿意度,提高他們轉向競爭對手的轉移成本,使他們逐漸成爲忠誠客戶。
(3)重要挽留客戶
- 平均折扣率高(C↑),最近無乘機記錄(R↑),乘機次數高(F↑)或里程高(M↑),入會時間長(L↑)。
- 這類客戶入會時間長,總里程高,但最近無乘機記錄,可能處於流失狀態。
- 由於這類客戶價值變化的不確定性很高,衰退原因各不相同,所以掌握客戶的最新信息、維持與客戶的互動尤爲重要。航空公司應採取一定的營銷手段防範客戶流失,延長客戶的生命週期。
(4)一般客戶
- 平均折扣率低(C↓),最近無乘機記錄(R↑),乘機次數低(F↓)或飛行里程低(M↓),入會時間短(L↓)。
- 這類客戶機票票價低,經常買折扣機票,飛行頻次低,最近無乘機記錄,可能是趁着折扣而選擇購買。
- 公司需要在資源支持的情況下強化對這類客戶的聯繫,進行一些交叉銷售。
(5)低價值客戶
- 平均折扣率低(C↓),最近無乘機記錄(R↑),乘機次數低(F↓)或飛行里程低(M↓),入會時間短(L↓)。
- 這類客戶入會時間短,屬於新客戶,多選擇折扣票,飛行里程低,最近有乘機記錄,可能是趁着折扣而選擇購買,對品牌無忠誠度。
其中,重要發展客戶、重要保持客戶、重要挽留客戶這三類重要客戶可以分別歸入客戶生命週期管理的發展期、穩定期、衰退期三個階段。
根據每種客戶類型的特徵,對各類客戶羣進行客戶價值排名。針對不同類型的客戶羣提供不同的產品和服務,提升重要發展客戶的價值、穩定和延長重要客戶的高消費水平、防範重要挽留客戶的流失並積極進行關係恢復。
三、分析結果
根據建模結果,發現該公司的五類不同價值的客戶數量分佈如圖所示:
重要保持客戶、重要發展客戶佔比15.3%,不足兩成,整體較少
一般客戶、低價值客戶佔比59.3%,接近六成,整體偏多
重要挽留客戶佔比25.4%,接近四分之一,整體發揮空間大
按照20/80法則:一般而言企業的80%收入由頭部20%的用戶貢獻。從上圖中也能發現:忠誠的重要保留客戶、中發展客戶必然貢獻了企業收入的絕大部分,企業也需要投入資源服務好這部分客戶。
一般而言,數據分析最終的目的是針對分析結果提出並開展一系列的運營/營銷策略,以期幫助企業發展。在本實例中,運營策略有三個方向:
提高活躍度:提高一般客戶、低價值客戶的活躍度。將其轉化爲優質客戶
提高留存率:與重要挽留客戶互動,提高這部分用戶的留存率
提高付費率:維繫重要保持客戶、重要發展客戶的忠誠度,保持企業良好收入
四、模型應用
根據對各個客戶羣進行特徵分析,採取下面的一些營銷手段和策略,爲航空公司的價值客戶羣管理提供參考。
4.1會員的升級與保級
航空公司的會員一般分爲白金卡會員、金卡會員、銀卡會員、普通卡會員,非普通卡會員可以統稱爲精英會員,不同航公司的會員制管理方法大同小異。成爲精英會員一般要求在一定時間內積累一定的飛行里程或航段,達到這種要求後就會在有效期內成爲精英會員,並享受相應的高級版服務。在有效期快結束時,根據相關評價方法確定客戶是否有資格繼續做爲精英會員,然後對該客戶進行相應的升級或降級。
然而,由於許多客戶並沒有意識到或不太瞭解會員升級或保級的時間與要求(相關的文件說明往往復雜且不易理解),經常在評價期過後才發現自己其實只差一點就可以實現升級或保級,錯失了機會而使之前的里程積累白白損失。同時,這種認知可能導致客戶的不滿而放棄在本公司的消費。
因此,航空公司可以在對會員升級或保級進行評價的時間點之前,對那些尚未達到要求的較高消費客戶進行適當提醒或者採取一些促銷活動,刺激他們達到相應標準。這樣既可以獲得收益同事也提高了客戶的滿意度。
4.2首次兌換
客戶可以通過消費積累的里程來兌換免票或免費升艙等,但很多航空公司的里程累積會隨着時間進行一定的削減,例如有的公司會在年末對該年積累的里程進行折半處理。這樣會導致許多不瞭解情況的會員損失自己積累的里程,甚至總是難以實現首次兌換,同樣也會引起客戶的不滿或流失。
因此,航空公司可以對這些接近但尚未達到首次兌換標準的會員進行提醒或促銷,使他們通過消費達到標準。一旦客戶實現了首次兌換,客戶在進行消費兌換就比其他公司進行兌換要容易許多,在一定程度上提高了轉移成本。
4.3交叉銷售
通過發行聯名卡等於非航空類企業合作,使客戶在其他企業的消費過程中獲得公司的積分,增強與公司的聯繫,提高客戶的忠誠度。例如,可以查看重要客戶在非航空類合作伙伴處的消費情況,找出客戶的行爲偏好,對他們進行相應的促銷。
參考資料
1.《Python數據分析與挖掘實戰》第七章及配套數據
2.案例分析:基於RFM的客戶價值分析模型
3.實戰代碼