上接:2020美賽F獎論文(一):摘要、緒論和模型準備
全文:
3 傳球網絡模型(PNM)的建立和影響因子分析
爲了構造結構化的傳球網絡,用來分析球員間傳球配合的默契程度,應在不同多維度、狀態變化情況下進行分析。例如從微觀上兩兩球員之間的行爲,到宏觀上多個球員之間的行爲;以及時間尺度從比賽中的單位時刻到整個賽季。
3.1 傳球評價指標(PEI)
兩人傳球評價指數PassValue(pi,pj),用於評價兩人配合程度。在一場球賽中,宏觀來看,球員相對於球場可以視爲一個個節點,球場可以視爲一個網絡,每一次傳球可以視爲節點之間的連線。以兩人之間每次傳球累計評價PassValue(pi, pj)作爲2人的傳球評價指數。在多人傳球評價體系中,將三個節點連接成閉合環路,邊權之和即爲3人傳球評價指數。
PassValue(pi,pj,pk)= EdgeValue(i,j)+EdgeValue(i,k)+EdgeValue(j,k)
通過生活經驗和數據挖掘所發現的規律可以構建PEI計算模型:
- Weight table of pass types:
αi is constant for i in Pass Types.
- 計算傳球或接球時分別受到的防守壓力DefPress(pi)
DefPress(pi)=1−21tan[611×(100xpi−0.6)]
其中,x爲球員到對方球門的橫座標,與受到的防守壓力成負相關
- 兩人之間的邊權EdgeValue(i,j),即單次傳球評價,爲此次傳球類型的權重乘以防守壓力加權平均數,量化爲以下公式。
{EdgeValue(i,j)=PassValue(pi, pj)PassValue(pi, pj)=∑i in Passαi∗(DefPress(pi−from)∗0.3+DefPress(pi−to)∗0.7)
根據這一傳球評價指數模型,統計出一定時間範圍內所有參與比賽的N個球員的鄰接矩陣數據Arr。由Arr[i, j]=PassValue(pi, pj)得每兩人之間所有傳球價值評價總和圖:
3.2 傳球網絡模型構建及識別網絡模式
網絡上兩兩球員之間的聯繫,宏觀上體現爲球員間傳球的評價總和。篩選兩人傳球評價超過一定閾值的邊,運用圖論的方法選擇性剔除交叉邊,將基於傳球評價指數構建的line-up傳球網絡可視化,用線的深淺表示PassValue(pi, pj):
{lighter,PassValue(pi, pj) is lessdeeper,PassValue(pi, pj)is more
ColorPass(i,j)=Palette(PassValue(pa, pb)−PassValue(pa, pb)PassValue(pi, pj)−PassValue(pa, pb))
從這一模型的可視化中,我們可以直觀地分析傳球配合頻繁和默契地球員,還可以直觀的看出主力球員中多人傳球配合的組合。
N |
Players |
Score |
|
|
|
2 |
M1 |
F2 |
|
|
342.4 |
|
M1 |
M3 |
|
|
338.6 |
|
D5 |
F2 |
|
|
213.4 |
3 |
M1 |
M3 |
F2 |
|
816.1 |
|
D5 |
M1 |
F2 |
|
727.8 |
4 |
D5 |
M1 |
M3 |
F2 |
1113.5 |
3.3 時間尺度上傳球狀態波動
傳球頻率會在時間尺度上進行波動。定義Passes(0,t)
Passes(0,t) is the sum of passes before t.
並以Passes(0,t)作爲球隊實時狀態的指標。球賽剛開始時,球員身體還未warm
up,導致傳球概率密度較小,5—10分鐘過後,傳球效率逐漸提高並大致趨於穩定,即:
⎩⎪⎪⎨⎪⎪⎧Passes′(0,t)>0Passes′′(0,t)<0Passes(0,t)=P0t0<2Halftime
隨着時間推移,球員們體力消耗,傳球密度降低,即傳球數量的增速減緩(雖然一場球賽中成功傳球次數仍在增加,但傳球失敗頻率開始增加),此後傳球密度呈現下降趨勢,即:
⎩⎪⎪⎨⎪⎪⎧Passes′(0,t)<0Passes′′(0,t)>0Passes(0,t)=P1<P0t0>2Halftime
縱觀整個賽季中38場球賽球員們的傳球頻率密度,整體上看可以與單場球賽所展示出的頻率密度變化趨勢相同。以時間爲橫座標,成功傳球密度爲縱座標作圖:
Passes(t1,t2)=∫t2t1PassDiv(t)dt
總體來說,傳球的密度在時間尺度上相對穩定。若使用Monte Carlo方法對每次傳球進行模擬,設定在上一次傳球后下一次傳球還需要的時間概率分佈服從N(θ,1),其中θ爲統計的平均傳球間隔時間,則在樣本規模N滿足N≈2時會近似與左圖的分佈;隨着樣本規模增加,當滿足N>4後則會近似與右圖的分佈。因此我們可以認爲每一個時間點發生傳球事件的概率服從N(0,1)。
下接:2020美賽F獎論文(三):足球團隊指標和基於機器學習的球隊表現預測
全文: