食在廣州 | 爬取分析廣州6萬+餐飲門店數據

繼前兩期分別爬取了海珠某區域和海珠區美食餐廳數據進行分析,應讀者要求,本期更進一步,獲取了全廣州60000+個餐飲門店數據進行分析。不少讀者對全廣州的各種餐廳數據非常感興趣。好了,馬上安排。

錯過前兩期的請查看下面鏈接或者查看美食餐廳類專輯:

技術喫貨用Python爬取廣州海珠區1845箇中式餐廳數據

疫情過後重新開店,如何參考商業數據(數據乾貨)

一、廣州11區餐廳門店數量和人均消費



天河、白雲的人口商業都是全廣州最繁華的,門店數量果然也是遙遙領先,天河作爲商業中心,人均消費也是最高的。但總體來看,人均消費差別不大,價格上都比較適中。

二、不同餐廳門店數量和人均消費

我們選取了其中五個數量最多的分類:中餐廳、外國餐廳、快餐廳、咖啡廳、茶藝館|冷飲店|蛋糕店|甜品店|休閒餐廳。各種餐廳門店數量和人均消費:

注:這裏的快餐廳是指連鎖品牌:如麥當勞肯德基、品牌茶餐廳和連鎖快餐大家樂等,外賣門店並不在此次的統計中,所以可能會有所遺漏

由此可見還是中餐廳是主流。分析餐廳門店很重要的指標是地理位置,所以對比了一下中餐和外國餐廳門店的地理分佈圖,(紅:中餐廳,綠:外國餐廳)。外國餐廳數量較少,但是主要分佈在天河珠江新城CBD和海珠越秀等商業區。

單純以區和餐飲門店類型做維度,很難直觀查看到區和餐廳類型的關係,所以把這兩個維度結合起來,做了一個矩形樹圖,讓我們來看看不同區不同餐廳類型的數量分佈:

矩形樹圖在數據分析中實現層次結構可視化的圖表結構。柱形圖不適合表達過多類目(比如上百)的數據,那應該怎麼辦?矩形樹圖出現了。它直觀地以面積表示數值,以顏色表示類目,初次接觸時都感覺到非常驚豔。Python pyecharts製作比較複雜,需要將數據放在特定格式的json格式,如果使用Tableau等可視化工具則使用拖拽方式即可。

#做一個所有分類的樹形圖
final_list = []
cate_list = data_unique.groupby(by='adname').count()
#第一層
for i in range(len(cate_list)):
    cateName = cate_list.index[i] #區名   
    #第二層
    sub_list = data_unique[data_unique.adname==cateName].groupby(by='newType').count()
    two_list = []
    for j in range(len(sub_list)):
        temp_dict = {'value':sub_list.iloc[j]['name'], 'name':sub_list.index[j]}
        two_list.append(temp_dict)        
    temp_dict = {'value':category_rank.iloc[i]['name'], 'name':category_rank.index[i], 'children':two_list}
    print(temp_dict)
    final_list.append(temp_dict)

天河果然是上班族的天地,快餐廳的門店數量是最多的。

海珠區的美食大排檔是出了名的,所以特色地方風味餐廳數量是最多的,其次是快餐廳和冷飲店,果然是逛街喫飯的好去處。

好了,關於不同類型門店數量的分析就到這裏,想更進一步瞭解,只需要下載html自己查看即可,無需編程開發。

三、細分類型門店數量和人均消費

前面做的餐廳分類是以中西餐大類作爲分析對象,其實很多人關注的是更加細分領域,比如火鍋店、川菜店、日本料理或者韓國料理等等,讓我們來看看什麼樣的餐廳最貴吧:

法國餐廳人均293元一枝獨秀,看來法國菜一頓飯喫3個小時是有原因的。其他類型的都沒有超過人均100元的,其中的燒烤店是應做燒烤店的朋友要求,專門做一次燒烤店的分析,所以選取了店面包含“燒烤”的門店進行統計,數量上僅有839家,肯定有所遺漏,人均消費上,62元表示還能接受。當然也可以做其店面周邊的門店類型數量和人均消費,下一期我們再做其他類型的分析。

如果你想知道其他城市的數據或者其他類型門店的數據,請留言告訴我,下一期說不定就是你想知道的內容。

如果對代碼和矩形樹圖的html文件感興趣,可以在公衆號(迷途小球迷)後臺回覆:餐廳 即可。

數據來源:高德地圖API

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章