使用Python+支持向量機預測廣州車牌拍賣價格

首先附上我收集的2018年以來的廣州車牌拍賣信息

  指標數量 參與人數 第一次報價 第二次報價 上次最低價 上次平均價 上上次最低價 上上次平均價 本次最低價
2020年1月 3634

11917

(數據缺失,取得是歷史平均數)

12181 12591 13800 15461 13200 15917 14800
2019年12月 7693 14725 12495 12861 13200 15917 10000 20306 13800
2019年11月 5701 11051 12500 12764 10000 20306 20200 24164 13200
2019年10月 9068 10356 17365 18134 20200 24164 21800 23779 10000
2019年9月 8165 15925 17891 18895 21800 23779 18800 22047 20200
2019年8月 6366 17220 17204 18056 18800 22047 14100 28966 21800
2019年7月 5422 13142 16082 16581 14100 28966 40000 42846 18800
2019年6月 5457 7932 21129 22641 40000 42846 38600 40395 14100
2019年5月 3618 9782 28637 30736 38600 40395 36000 37953 40000
2019年4月 3622 11794 26753 28709 36000 37953 33000 36240 38600
2019年3月 3635 12278 25493 27287 33000 36240 33900 39196 36000
2019年2月 3662 10935 23552 25352 33900 39196 37000 40985 33000
2019年1月 3657 12604 23772 25296 37000 40985 36800 39585 33900
2018年12月 3641 13169 24141 26066 36800 39585 33100 35434 37000
2018年11月 3632 14877 23546 25165 33100 35434 29700 32205 36800
2018年10月 3630 16330 21612 22974 29700 32205 25500 31654 33100
2018年9月 3695 15124 20202 21516 25500 31654 12100 56152 29700
2018年8月 4541 11522 19450 20181 12100 56152 52000 57283 25500
2018年7月 3600 6408 40251 43583 52000 57283 41300 44225 12100
2018年6月 3554 9275 34894 38147 41300 44225 32100 34455 52000
2018年5月 3538 12576 27014 29117 32100 34455 25300 26939 41300
2018年4月 3549 10708 22339 23941 25300 26939 22800 24560 32100
2018年3月 3547 10210 19367 20489 22800 24560 21000 25213 25300
2018年2月 3541 10102 18089 18934 21000 25213 18000 32312 22800
2018年1月 3687 7966 18405 19126 18000 32312 30700 34046 21000

使用語言: Python,請先pip install好pandas和sklearn。

1、import需要的包

import pandas as pd
from sklearn.svm import SVR
# 導入支持向量機

2、將上文的表格複製到excel裏面,刪除第一行表頭,然後保存成csv,命名爲data.csv保存在程序目錄下。

3、讀取csv並轉爲DataFrame

carPrice = []
with open('data.csv', 'r', encoding='utf-8') as f:
    for line in f.readlines():
        l = line.split(',')
        carPrice.append({
            'zbs': int(l[1]),
            'bms': int(l[2]),
            'fp': int(l[3]),
            'sp': int(l[4]),
            'nlp': int(l[5]),
            'nap': int(l[6]),
            'nnlp': int(l[7]),
            'nnap': int(l[8]),
            'lp': int(l[9])
        })

df = pd.DataFrame(carPrice)
# 將數據轉換成DataFrame,其實我覺得直接用pd.read_csv方法更快,這個程序從整理數據到寫好也就用了幾十分鐘。

 4、進行機器學習,輸出結果,本次將通過2018-2019年的數據,以及公佈的2020年1月車牌拍賣相關數據,預測2020年1月車牌拍賣最低價格。

X_train = df.drop(['lp'], axis=1)[1:]
# 訓練數據集
y_train = df['lp'][1:]
# 訓練結果集
X_test = df.drop(['lp'], axis=1)[:1]
# 測試數據集

clf = SVR(kernel='linear')
clf.fit(X_train, y_train)
preds = clf.predict(X_test)
print('預測結果是:',preds,'元')

5、輸出結果

預測結果是: [17110.34942555] 元

Process finished with exit code 0

 

總結:2020年1月廣州車牌拍賣,最低價格爲14800元……跟預測結果還是有2千多塊錢的差距的。主要原因還是樣本數量太少了……

發佈了17 篇原創文章 · 獲贊 20 · 訪問量 2萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章