一、產品背景和分析總結
1. 項目背景
Airbnb是一個空閒房屋短期租賃的雙邊平臺,屋主可以通過平臺發佈閒置短租民宿信息,旅遊者可以在網頁或程序在線預定目的地的民宿。Airbnb不僅改變了旅行者的租住意識,也衝擊着酒店傳統行業。
2. 分析目的:
構建Airbnb的目標用戶羣體畫像
評估Airbnb現有的推廣渠道效果
基於業務分析用戶的轉化情況
3. 分析結構
用戶畫像:用戶基本屬性(性別、年齡、語言),用戶行爲屬性(目的地、設備、瀏覽器)
渠道分析:對不同營銷渠道、營銷方式、廣告內容的註冊用戶量和轉化率進行分析
轉化情況:基於產品業務按照AARRR模型分爲獨立訪客、註冊、預定、支付、復購,分析每個環節的轉化率和流失情況。
4、涉及工具
SQL查找,Python查看數據分佈,POWER BI整理數據、畫圖
5、分析總結
用戶畫像:
- 性別:註冊用戶共計117481人,其中女性用戶比男性用戶多7.3%,但女性用戶和男性的用戶的轉化率非常接近。
- 年齡:用戶年齡覆蓋15-80歲範圍,主要以中青年用戶居多,年齡分佈集中在25-39歲,這區間各年齡段的轉化率都超過55%。在超過50歲的用戶羣體中,用戶數量隨年齡增長逐漸下降,但轉化率卻呈現增長趨勢,65-69歲區間的用戶轉化率高達54%。
- 語言:用戶語言共計23種,英、中、法、西、德語是用戶使用最多的語言,接近98%的用戶使用英語,由此推測用戶主要集中在歐美地區。
- 目的地:全球用戶的旅行目的地和中文用戶高度重疊,主要目的地集中在歐美發達國家,前往美國的用戶佔比超過80%。
- 設備及瀏覽器:用戶使用設備集中在Windows和MAC的臺式機,存在少量移動端用戶。瀏覽器集中在Chrome、Safari和Firefox。(時間範圍爲2010-2014年)
渠道分析:
- 用戶規模從2012年起逐漸擴大,在2013年進入快速增長期。增長趨勢呈現季節性波動,每年6-10月出現增長的小高峯。但用戶轉化率也存在季節性波動,在每年3月附近出現轉化率的小高峯。但轉化率整體呈明顯下降趨勢,由2010年55%以上跌至2014年40%以下。
- direct(直接打開或下載應用)的註冊量最高,超過總註冊量的60%,direct和google兩個渠道超過總註冊用戶的80%。
- 主要渠道的轉化率大多在都30%以上,但gsp、meetup、email-marketing三個渠道的轉化率都低於25%,且註冊用戶都低於500人。
- 大部分方式的轉化率都高於30%,direct、SEM、SEO的轉化率和拉新人數都比較高,這可能和當時用戶設備以PC端爲主相關
- 值得關注Google SEM和SEO的營銷方式,覆蓋Google總註冊用戶數的90%。而Content對所有渠道轉化率都低於20%,特別是google-content的註冊用戶數達到2892,但轉化率只有15.59%。
- 營銷內容受缺失值影響數據追蹤效果較差,linked和omg兩者拉新和轉化效果都比較好,但針對Google和direct這兩種主要渠道,linked和omg的拉新人數和轉化率呈完全相反的趨勢。
轉化漏斗:
- 基於分位數定義15次以上操作的用戶爲活躍用戶,用戶活躍率高達76.7%,有60%的用戶在成功支付後進行了復購。
- 註冊-預定的轉化率只有14%,是整個轉化漏斗中流失率最高的部分。在預定至支付過程中,由13.1%的用戶未能成功支付。
基於數據的建議:
- 基於用戶畫像建議將用戶定位在25-39歲的年齡區間,同時可以考慮定向對高轉化率的60-70歲年齡層用戶定向投放。
- 結合產品與運營,進一步分析用戶轉化率降低的原因,通過用戶畫像分析和用戶生命週期分析來定位註冊用戶在轉化前流失的節點。
- 營銷渠道、方式和廣告內容的缺失值比較多,建議運營人員和相關技術人員考慮埋點的情況,改善當前的數據情況。
- 渠道應重點關注direct、google、craigslist和bing這幾個主要渠道,google-content的轉化率只有15.59%,需要覈算該渠道的ROI和ARPU。
- 營銷渠道中的SEM和SEO,營銷內容中linked和omg的拉新和轉化效果都比較好,可以考慮結合渠道分析更精準地進行相關的資源投入。
- 用戶轉化漏斗中用戶註冊—預定過程流失率過高,需結合往期數據進一步分析流失率的變化情況、結合用戶生命週期和用戶行爲挖掘用戶流失節點,進一步提高轉化率。
- 針對預定-支付過程中13%的流失率,需要排查具體的原因,是否存在產品流程缺陷或支付不滿足用戶需求等,建議進行相關用戶的調研。
- 針對支付成功的用戶進行詳細數據分析,找到一次消費後流失的節點,考慮刺激用戶二次消費或適當召回。針對可能存在一次出遊多次預定的復購用戶,做好目的地的商品關聯。
二、數據清洗:
1. 數據來源
數據來自kaggle中的開源項目:https://www.kaggle.com/c/airbnb-recruiting-new-user-bookings/data
2. 數據認識
本報告主要對包含用戶註冊信息的train_user_2和用戶行爲數據的sessions表進行分析。
id | 用戶ID |
date_account_created | 帳戶創建日期 |
date_first_booking | 首次預訂的日期 |
gender | 性別 |
age | 年齡 |
signup_method | 註冊方式 |
signup_flow | 用戶註冊的頁面 |
language | 語言 |
affiliate_channel | 營銷方式 |
affiliate_provider | 營銷渠道,例如google,craigslist或其他 |
first_affiliate_tracked | 註冊之前,用戶與產品交互的第一個營銷廣告 |
signup_app | 註冊來源 |
first_device_type | 註冊時設備的類型 |
first_browser | 註冊時使用的瀏覽器名稱 |
country_destination | 目的地國家 |
user_id |
與users表中的“id”列連接 |
action |
用戶行爲埋點 |
action_type |
用戶行爲的類型 |
action_detail |
用戶行爲的具體描述 |
device_type |
用戶此次行爲使用的設備 |
3. 數據缺失和分佈
在SQL中查詢發現train_users_2中user_id是唯一標識列,相比SQL一條條語句查詢缺失值情況,用python可以更快速看到數據的缺失情況和分佈情況。
數據缺失:
date_first_booking缺失124543條數據,有可能是由於這些用戶沒有下過訂單。
age缺失87990條,存在極小值1,極大值2014,分析age需要排除異常點。
first_affiliate_tracked(用戶通過哪個營銷廣告進入)缺失6065條數據。
數據分佈:
用戶年齡主要集中在28-43歲,使用英語的用戶佔比96%左右,basic註冊佔總比71.6%,登錄方式中Web登錄高達85%。
4. 數據清洗
清洗age的異常值,將age範圍限定在10-80歲,非缺失值的不符合條件的age一共2828條,將缺失值和不符合條件的age更改爲0。
SELECT COUNT(id) FROM train_users_2
WHERE age > 80 AND age < 10;
SET sql_safe_updates = 0;
UPDATE train_users_2
SET age = 0
WHERE id NOT IN (
SELECT id FROM (SELECT id FROM train_users_2
WHERE age <= 80 AND age >= 10) a);
三、用戶畫像
1 . 用戶基本屬性
1) 用戶性別分佈
註冊用戶中,女性用戶數63041,男性用戶數爲54440,女性用戶比男性用戶多7.32%。
所有註冊用戶中,男性用戶和女性用戶的轉換率相差不大,具有購買行爲的男性用戶比女性高0.17%。
2) 用戶年齡分佈
從條形圖可以看出,用戶年齡呈現正態分佈,主要集中在25-39歲。在30-34歲的用戶數量最多,達到了45383人,轉化率59%也是所有年齡層中最高。25-29歲的用戶數量和轉換率都排名第二。
在35-49歲的區間內,隨着年齡增長轉換率逐漸降低。但在45-69歲年齡區間內,用戶數量逐漸減少,但轉換率卻逐漸增加。65-69歲區間的轉換率達到54.1%,爲所有年齡層中的第三名。
2. 用戶行爲屬性
1) 地區分佈
通過統計註冊用戶使用語言分佈,得到Airbnb的用戶語言共23種,佔比超過1%的語言有:英語、中文、法語、西班牙語、德語、韓語、俄羅斯語和意大利語。從用戶使用語言可以發現Airbnb的用戶覆蓋全球多個地區,產品非常國際化。
將近98%的用戶是英語(en)爲母語的國家,一方面英語本身是多國通用語言所以使用人數較多,另一方面Airbnb創立於美國,擴展初期可能用戶主要集中在歐美地區。
數據集的時間範圍是2010年1月至2014年5月,而Airbnb是在2015年才正式進入中國市場。中文(zh)位列用戶使用語言的第二名,使用中文的用戶可能是國外華裔,也可能是有出國旅遊需求的國人。考慮到中文使用者的用戶比例和中國整體人口基數,這也可能推動了Airbnb公司選擇入華髮展。
2) 目的地分佈
全球用戶和中國用戶的旅行目的地佔比最高的都是美國,主要目的地都集中在發達國家。目的地國家和使用者較多的語言高度重合,這也可能是由於Airbnb初期運營策略集中在歐美國家。
3) 用戶設備
用戶註冊設備共9類,PC設備佔比較高,這可能是由於數據統計截止至14年時,移動互聯網方興未艾,智能手機用戶較少。
在PC類設備中,Mac設備多於Windows設備。在移動設備中,ios系統的iPhone,iPad遠高於Android系統的手機和其他設備。可以考慮向蘋果系用戶進行定向的廣告投放。
4) 瀏覽器
用戶註冊時使用的瀏覽器共計52中,將註冊用戶量前十名展示如下。
從註冊用戶量來看,Chrom、Safari、Firefox、IE四個瀏覽器帶來超過90%的註冊用戶數,其中Chrome的註冊用戶和轉化率都是最高的。
從轉化率來看:Chrome、Safari、Firefox的轉化率都超過40%,轉化情況良好,IE和Mobie Safari的轉化率接近,在37%左右。
從終端分析,PC端的瀏覽器集中在Chrom、Safari、Firefox、IE,而移動電話端Safari在註冊用戶總量和轉化率都明顯高於Chrome。結合用戶設備分析,很大程度上是由於移動端用戶主要使用iPhone和iPad。
5. 程序代碼
SQL語句如下:
#所有註冊用戶:性別、年齡、語言分佈
SELECT COUNT(id) AS man
FROM train_users_2
WHERE gender = 'MALE';
SELECT COUNT(id) AS woman
FROM train_users_2
WHERE gender = 'FEMALE';
SELECT age,COUNT(id)
FROM train_users_2
WHERE age>0
GROUP BY age
SELECT language, COUNT(language) as num
FROM train_users_2
GROUP BY language
ORDER BY num;
#存在訂購行爲的用戶:性別、年齡
SELECT COUNT(id) AS '女性用戶'
FROM train_users_2
WHERE gender = 'FEMALE'
AND date_first_booking<> '0000-00-00 00:00:00';
SELECT COUNT(id) AS '男性用戶'
FROM train_users_2
WHERE gender = 'MALE'
AND date_first_booking<> '0000-00-00 00:00:00';
SELECT ROUND(age), COUNT(id)
FROM train_users_2
WHERE date_first_booking<> '0000-00-00 00:00:00'
GROUP BY age
HAVING age <> 0
ORDER BY age;
#所有用戶的目的地
SELECT country_destination,COUNT(country_destination) AS cd_num
FROM train_users_2
WHERE country_destination NOT IN ('other','NDF')
GROUP BY country_destination
ORDER BY cd_num DESC;
#中國用戶的目的地
SELECT country_destination, COUNT(country_destination) AS num
FROM train_users_2
WHERE country_destination NOT IN ('other','NDF') AND language='zh'
GROUP BY country_destination
ORDER BY num DESC;
四、渠道分析
1. 用戶增長
觀察每月用戶增長曲線可以發現,在2011年前之前,增長曲線比較平穩,此時的用戶轉換率在55%-65%之間。在2012年以後,註冊用戶數在呈指數狀增長,但觀察到轉化率呈現明顯下跌趨勢,在2012年7月以後,轉化率不超過45%,遠遠低於數據初期峯值的65%。這種現象可能有以下幾方面原因:
1、市場上開始出現相似的競品軟件導致轉換率降低,
2、運營和渠道可能拉新到大量不合適的用戶,造成了用戶轉換率不夠高。
3、產品本身沒有做好迅速擴張期的準備,不夠完備的產品無法吸引到用戶。
新用戶的增長存在季節性規律:每年的7月-10月會出現增長的小高峯,由於民宿短租本身是旅遊相關產品,推測這種增長可能是因爲北半球在7-10月晝長夜短、氣溫適宜是旅行旺季。用戶轉化率也存在季節性規律,在每年的3月附近會出現小高峯,考慮到3月附近無假期且氣候不適宜,猜測這可能是由於用戶提前規劃旅行,也可能是由於週期性的運營策略。
2、營銷渠道
1) 註冊用戶數
排除direct(個人理解爲直接打開網頁或應用商店下載)以外,註冊用戶數前十的渠道和對應的轉化率,除content-google以外轉化率都大於30%,整體轉化情況良好。
2) 渠道和營銷方式
篩選出註冊用戶數超過100的營銷渠道和營銷方式,和對應的註冊用戶數與轉換率。可分別以渠道爲主分類分析各渠道轉換情況,以營銷方式爲主分類分析各營銷方式在不同渠道的轉化效果。
以渠道爲主分類進行分析:
● direct和Google兩個渠道超過註冊用戶總數的80%,符合二八定律。
● direct渠道的註冊量佔據絕大部分,推測是通過其他渠道或廣告瞭解信息後直接打開Airbnb。
● 大部分渠道的轉化率都在30%以上,整體表現比較好。
● gsp渠道轉化率低於10%,meetup,facebook-content、google-content、email-marketing的轉化率都低於20%。
以營銷方式爲主分類進行分析:
● 大多數營銷方式的轉化率都高於30%,其中direct、sem-brand、sem-non-brand三種營銷方式的轉化率和拉新人數都比較高。
● content營銷方式在所有渠道的轉換率都低於20%,特別是google-content的註冊用戶數達到2892,但轉化率只有15.59%。
● Google渠道中,sem-brand,sem-non-brand,seo三種營銷方式覆蓋Google類註冊用戶的90%,其中sem-brand佔據約50%,seo則實現了Google渠道最高的轉化率48.13%。
運營建議:
● 可以結合用戶設備,增加對註冊用戶數和轉化率雙高的渠道和營銷方式的投入,比如:google-sem、google-seo。
● 針對轉化率超過40%的渠道和營銷方式,direct、google-seo,google-sem-non-brand、facebook-seo,craigslist 如可以考慮增加產品曝光以獲取更多新用戶。
● 鑑於低轉化率,考慮減少content方式或更換投放內容,考慮取消meetup。
以渠道爲主分類:
渠道 | 營銷方式 | 註冊用戶數 | 轉化率 |
direct | direct | 137426 | 43.10% |
sem-brand | 25069 | 42.70% | |
sem-non-brand | 16947 | 38.45% | |
seo | 5691 | 48.13% | |
content | 2892 | 15.59% | |
remarketing | 1094 | 33.64% | |
other | api | 8167 | 34.10% |
other | other | 3656 | 41.25% |
other | seo | 306 | 50.98% |
other | direct | 301 | 54.49% |
other | sem-non-brand | 103 | 43.69% |
craigslist | other | 3471 | 46.56% |
bing | sem-brand | 950 | 39.47% |
bing | sem-non-brand | 889 | 33.30% |
bing | seo | 489 | 33.13% |
seo | 1677 | 43.17% | |
content | 591 | 11.51% | |
vast | sem-non-brand | 829 | 32.69% |
padmapper | other | 768 | 32.81% |
facebook-open-graph | other | 545 | 25.87% |
yahoo | seo | 496 | 35.08% |
gsp | content | 453 | 8.17% |
meetup | other | 347 | 13.26% |
email-marketing | other | 166 | 22.29% |
以營銷方式爲主分類:
營銷方式 | 渠道 | 註冊用戶數 | 轉化率 |
direct | direct | 137426 | 43.10% |
direct | other | 301 | 54.49% |
sem-brand | bing | 950 | 39.47% |
sem-brand | 25069 | 42.70% | |
sem-non-brand | bing | 889 | 33.30% |
sem-non-brand | 16947 | 38.45% | |
sem-non-brand | other | 103 | 43.69% |
sem-non-brand | vast | 829 | 32.69% |
other | craigslist | 3471 | 46.56% |
other | email-marketing | 166 | 22.29% |
other | facebook-open-graph | 545 | 25.87% |
other | meetup | 347 | 13.26% |
other | other | 3656 | 41.25% |
other | padmapper | 768 | 32.81% |
seo | bing | 489 | 33.13% |
seo | 1677 | 43.17% | |
seo | 5691 | 48.13% | |
seo | other | 306 | 50.98% |
seo | yahoo | 496 | 35.08% |
api | other | 8167 | 34.10% |
content | 591 | 11.51% | |
content | 2892 | 15.59% | |
content | gsp | 453 | 8.17% |
remarketing | 1094 | 33.64% |
3) 營銷內容
排除untracked(未追蹤)外,可以發現linked和omg的註冊用戶量非常接近,linked轉化率爲43%,比omg 37%的轉化率高6%。
儘管marketing的轉化率45%,但覆蓋的註冊用戶遠小於1%。local ops的轉化率和註冊用戶量都非常低。
4) 營銷內容與營銷渠道
交叉分析用戶註冊量最高的兩個渠道direct和Ggoogle中,排除untracked(未追蹤),不同營銷內容的轉化情況。
由可視化結果可知:
● linked和omg是用戶接觸最多的兩個營銷內容,direct的渠道中,linked的用戶數量遠遠高於omg。而在Google渠道中呈現相反的趨勢,omg對應用戶數量遠高於linked,這可能是由於渠道中不同廣告內容的投放量不同。
● 對比Google和direct兩個不同的渠道,linked轉化率在Google中比direct高1%,omg的轉化率在google中比direct低6.6%,marketing對direct的轉化率爲48%遠高於Google的20%。
運營建議:
由於未知不同渠道中廣告投放的曝光時間和曝光次數,所以只能建議關注Google中omg內容的轉化率,結合廣告投放情況對各渠道不同內容的轉化率保持持續關注。
5. 程序代碼
#新增註冊用戶的數量
SELECT date_format(date_account_created, '%Y-%M') AS year_moth, COUNT(id) as '新增用戶'
FROM train_users_2
GROUP BY date_format(date_account_created, '%Y-%M')
ORDER BY date_account_created;
#每個月轉化用戶
SELECT date_format(date_account_created, '%Y-%M') AS year_moth, COUNT(id) as '轉化用戶'
FROM train_users_2
GROUP BY date_format(date_account_created, '%Y-%M')
ORDER BY year_moth;
#不同營銷方式+渠道的拉新和轉化
#其實沒必要創建兩個視圖,可以直接分別提取,然後在表格中合併
CREATE VIEW ac_ap_num AS
SELECT affiliate_channel, affiliate_provider, COUNT(id) AS ac_num
FROM train_users_2
GROUP BY affiliate_channel, affiliate_provider
ORDER BY ac_num;
CREATE VIEW ac_ap_ratio AS
SELECT affiliate_channel, affiliate_provider,
SUM(CASE WHEN date_first_booking <> '0000-00-00 00:00:00' THEN 1 ELSE 0 END) / COUNT(id) AS ac_ratio
FROM train_users_2
GROUP BY affiliate_channel, affiliate_provider
ORDER BY ac_ratio;
SELECT ac_ap_num.affiliate_channel,ac_ap_num.affiliate_provider,ac_num,ac_ratio FROM ac_ap_num,ac_ap_ratio
WHERE ac_ap_num.affiliate_channel=ac_ap_ratio.affiliate_channel
AND ac_ap_num.affiliate_provider=ac_ap_ratio.affiliate_provider
ORDER BY ac_num DESC;
#不同營銷內容的拉新轉化
#不同營銷廣告內容的註冊數量
SELECT a.first_affiliate_tracked,a.fat_num,b.fat_ratio
FROM
(SELECT first_affiliate_tracked, COUNT(id) AS fat_num
FROM train_users_2
GROUP BY first_affiliate_tracked) a
INNER JOIN
(SELECT first_affiliate_tracked,
SUM(CASE WHEN date_first_booking <> '0000-00-00 00:00:00' THEN 1 ELSE 0 END) / COUNT(id) AS fat_ratio
FROM train_users_2
GROUP BY first_affiliate_tracked)b
ON a.first_affiliate_tracked=b.first_affiliate_tracked;
#交叉分析廣告內容和營銷渠道
#AP是direct的廣告內容分析
SELECT first_affiliate_tracked,count(id)AS num1,
SUM(CASE WHEN date_first_booking <> '0000-00-00 00:00:00' THEN 1 ELSE 0 END) AS num2
FROM train_users_2
WHERE affiliate_provider='direct'
AND first_affiliate_tracked IS NOT NULL
GROUP BY first_affiliate_tracked
ORDER BY num1 DESC;
#AP是google的廣告內容分析
SELECT first_affiliate_tracked,count(id)AS num1,
SUM(CASE WHEN date_first_booking <> '0000-00-00 00:00:00' THEN 1 ELSE 0 END) AS num2
FROM train_users_2
WHERE affiliate_provider='google'
GROUP BY first_affiliate_tracked
ORDER BY num1 DESC;
五、轉化漏斗
1. 用戶活躍率
在Python中分析sessions用戶行爲埋點數據,按照用戶分組,查看用戶行爲總數分佈情況。可以得到IQ1=15,IQ3=94,因此將操作數量大於15的用戶定義爲活躍用戶。執行SQL語句可以得到用戶總數135483, 活躍用戶數:103855,活躍率爲76.7%。
這裏得到的活躍率只是粗略估計,如果有需求進行精細化運營可以按時間維度再進行細分計算。
2. 用戶行爲轉換漏斗
將用戶行爲歸納爲:訪問-註冊-預定-支付成功-復購五個步驟。
觀察轉化漏斗可以發現:
用戶註冊到預定是整個轉化漏斗中流失率最高的部分,僅有14%的註冊用戶進行了預定。分析思路可以按照用戶註冊時間或訪問次數將其分爲新、老用戶。對新用戶而言,這可能是缺乏產品核心功能的使用引導、搜索不到合適的房源、拉新到非目標用戶等原因。對老用戶而言,可能是搜索結果不符合期望等原因造成。關注轉換的同時更需要結合用戶行爲進一步分析用戶流失的具體節點。
預定用戶中有13.1%未能成功支付,可能是由於房東未及時回覆、支付過程受阻、不符合用戶的支付習慣等原因。
60%支付成功的用戶都進行了復購,說明Airbnb的產品和服務比較能令用戶滿意。可針對支付成功的用戶進行詳細用戶畫像,分析一次消費後流失的節點,考慮刺激用戶二次消費。針對可能存在一次出遊多次預定的用戶,做好目的地的商品關聯。
3、程序代碼
#用戶總數量:對sessions表中的user_id進行group by,再統計數量,得出sessions表中所有的用戶數量。
SELECT COUNT(DISTINCT user_id)
FROM sessions;
#利用python查看用戶操作的分位數IQR-IQ3爲15-94
#python語句:session.groupby('user_id').action.count().describe()
#查看活躍用戶總數(定義爲操作>=15)
SELECT COUNT(*) AS active_user
FROM (
SELECT user_id
FROM sessions
GROUP BY user_id
HAVING COUNT(user_id) >= 15
) active;
#註冊用戶
SELECT COUNT(*) AS rg_user
FROM (
SELECT user_id
FROM sessions
GROUP BY user_id
) session_user
INNER JOIN train_users_2 ON session_user.user_id = train_users_2.id;
#下單用戶
SELECT COUNT(*) AS booking_user
FROM (
SELECT user_id
FROM sessions
WHERE action_detail = 'reservations'
GROUP BY user_id
) booking;
SELECT COUNT(*) AS pay_user
FROM (
SELECT user_id
FROM sessions
WHERE action_detail = 'payment_instruments'
GROUP BY user_id
) pay;
SELECT COUNT(*) AS rp_user
FROM (
SELECT user_id
FROM sessions
WHERE action_detail = 'reservations'
GROUP BY user_id
HAVING COUNT(user_id) >= 2
) re_purchase;
六、進步和不足
分析框架和思路參考知乎周貳毛,在原作者的基礎上,主要增加了對比率的關注和多因素的交叉分析。如進行用戶畫像中關注男女性別的同時也需要關注不同性別用戶的轉化率,年齡的區間劃分不能只關注用戶數量,也要考慮轉化率背後的原因。新增用戶數量在產品達到一定規模後可能存在某些虛榮指標的成分,同時關注轉化率才能發現問題後面的根源。
但這個報告的不足真的太多了,在自學的路上真的還差太多需要補課的地方,特別是需要重點補課SQL所以暫時擱置了繼續深化,後續分析思路可以集中在光渠道分析或者用戶畫像,我覺得每一個都可以單獨細化寫一篇。遺憾的是用戶行爲中由於不知道具體行爲對應的數據所以也不能再深化。關於建模和數據挖掘:簡單的方向是可以在這個基礎上去做時間序列的預測,預測用戶增長情況。稍微複雜的一點的建模可以考慮做kaggle中預測預定地的分析。
希望我找工作好運啊~