2020美賽F獎論文(二):傳球網絡模型(PNM)的建立和影響因子分析

上接:2020美賽F獎論文(一):摘要、緒論和模型準備
全文:

3 傳球網絡模型(PNM)的建立和影響因子分析

爲了構造結構化的傳球網絡,用來分析球員間傳球配合的默契程度,應在不同多維度、狀態變化情況下進行分析。例如從微觀上兩兩球員之間的行爲,到宏觀上多個球員之間的行爲;以及時間尺度從比賽中的單位時刻到整個賽季。

3.1 傳球評價指標(PEI)

兩人傳球評價指數PassValue(pi,pj)\text{PassValue}(p_{i}, p_{j}),用於評價兩人配合程度。在一場球賽中,宏觀來看,球員相對於球場可以視爲一個個節點,球場可以視爲一個網絡,每一次傳球可以視爲節點之間的連線。以兩人之間每次傳球累計評價PassValue(pi, pj)P\text{assValue}\left( p_{i},\ p_{j} \right)作爲2人的傳球評價指數。在多人傳球評價體系中,將三個節點連接成閉合環路,邊權之和即爲3人傳球評價指數。

PassValue(pi,pj,pk)= EdgeValue(i,j)+EdgeValue(i,k)+EdgeValue(j,k) \text{Pass}\text{Value}\left( p_{i},p_{j},p_{k} \right) = \ \text{EdgeValue}\left( i,j \right) + \text{EdgeValue}\left( i,k \right) + E\text{dgeValue}\left( j,k \right)

通過生活經驗和數據挖掘所發現的規律可以構建PEI計算模型:

  1. Weight table of pass types:

αi is constant for i in Pass Types. \alpha_{i}\ \text{is}\ \text{constant}\ \text{for}\ i\ \text{in}\ \text{Pass}\ \text{Types}.

Pass weights

  1. 計算傳球或接球時分別受到的防守壓力DefPress(pi)\text{Def}\text{Press}\left( p_{i} \right)

DefPress(pi)=112tan[116×(xpi1000.6)] \text{Def}\text{Press}\left( p_{i} \right) = 1 - \frac{1}{2}\tan{\lbrack\frac{11}{6} \times (\frac{x_{p_{i}}}{100} - 0.6)\rbrack}

其中,x爲球員到對方球門的橫座標,與受到的防守壓力成負相關

  1. 兩人之間的邊權EdgeValue(i,j)\text{EdgeValue}\left( i,j \right),即單次傳球評價,爲此次傳球類型的權重乘以防守壓力加權平均數,量化爲以下公式。

{EdgeValue(i,j)=PassValue(pi, pj)PassValue(pi, pj)=i in Passαi(DefPress(pifrom)0.3+DefPress(pito)0.7)  \left\{ \begin{matrix} \text{EdgeValue}\left( i,j \right) = P\text{assValue}\left( p_{i},\ p_{j} \right) \\ P\text{assValue}\left( p_{i},\ p_{j} \right) = \sum_{i\ \text{in}\ \text{Pass}}^{}{\alpha_{i}*\left( \text{Def}\text{Press}\left( p_{i - \text{from}} \right)*0.3 + \text{Def}\text{Press}\left( p_{i - \text{to}} \right)*0.7 \right)} \\ \end{matrix} \right.\

根據這一傳球評價指數模型,統計出一定時間範圍內所有參與比賽的NN個球員的鄰接矩陣數據Arr\text{Arr}。由Arr[i, j]=PassValue(pi, pj)\text{Arr}\left\lbrack i,\ j \right\rbrack = P\text{assValue}\left( p_{i},\ p_{j} \right)得每兩人之間所有傳球價值評價總和圖:

整個賽季單次評價圖

3.2 傳球網絡模型構建及識別網絡模式

網絡上兩兩球員之間的聯繫,宏觀上體現爲球員間傳球的評價總和。篩選兩人傳球評價超過一定閾值的邊,運用圖論的方法選擇性剔除交叉邊,將基於傳球評價指數構建的line-up傳球網絡可視化,用線的深淺表示PassValue(pi, pj)P\text{assValue}\left( p_{i},\ p_{j} \right)

{lighter,PassValue(pi, pj) is lessdeeper,PassValue(pi, pj)is more  \left\{ \begin{matrix} \text{lig}h\text{ter},P\text{assValue}\left( p_{i},\ p_{j} \right)\ \text{is}\ \text{less} \\ \text{deeper},P\text{assValue}\left( p_{i},\ p_{j} \right)\text{is}\ \text{more} \\ \end{matrix} \right.\

ColorPass(i,j)=Palette(PassValue(pi, pj)PassValue(pa, pb)PassValue(pa, pb)PassValue(pa, pb)) \text{Color}_{\text{Pass}}\left( i,j \right) = \text{Palette}\left( \frac{P\text{assValue}\left( p_{i},\ p_{j} \right) - \operatorname{}{P\text{assValue}\left( p_{a},\ p_{b} \right)}}{\operatorname{}{P\text{assValue}\left( p_{a},\ p_{b} \right)} - \operatorname{}{P\text{assValue}\left( p_{a},\ p_{b} \right)}} \right)

單場比賽的兩兩傳球網絡圖

從這一模型的可視化中,我們可以直觀地分析傳球配合頻繁和默契地球員,還可以直觀的看出主力球員中多人傳球配合的組合。

N Players Score
2 M1 F2 342.4
M1 M3 338.6
D5 F2 213.4
3 M1 M3 F2 816.1
D5 M1 F2 727.8
4 D5 M1 M3 F2 1113.5

3.3 時間尺度上傳球狀態波動

傳球頻率會在時間尺度上進行波動。定義Passes(0,t)\text{Passe}s\left( 0,t \right)

Passes(0,t) is the sum of passes before t. \text{Passes}\left( 0,t \right)\ \text{is}\ the\ \text{sum}\ \text{of}\ \text{passes}\ \text{before}\ t.

並以Passes(0,t)\text{Passe}s\left( 0,t \right)作爲球隊實時狀態的指標。球賽剛開始時,球員身體還未warm
up,導致傳球概率密度較小,5—10分鐘過後,傳球效率逐漸提高並大致趨於穩定,即:

{Passes(0,t)>0Passes(0,t)<0Passes(0,t)=P0t0<Halftime2  \left\{ \begin{matrix} \text{Passe}s^{'}\left( 0,t \right) > 0 \\ \text{Passe}s^{''}\left( 0,t \right) < 0 \\ \operatorname{}\text{Passes}\left( 0,t \right) = P_{0} \\ t_{0} < \frac{\text{Halftime}}{2} \\ \end{matrix} \right.\
隨着時間推移,球員們體力消耗,傳球密度降低,即傳球數量的增速減緩(雖然一場球賽中成功傳球次數仍在增加,但傳球失敗頻率開始增加),此後傳球密度呈現下降趨勢,即:

{Passes(0,t)<0Passes(0,t)>0Passes(0,t)=P1<P0t0>Halftime2  \left\{ \begin{matrix} \text{Passe}s^{'}\left( 0,t \right) < 0 \\ \text{Passe}s^{''}\left( 0,t \right) > 0 \\ \operatorname{}\text{Passes}\left( 0,t \right) = P_{1} < P_{0} \\ t_{0} > \frac{\text{Halftime}}{2} \\ \end{matrix} \right.\

縱觀整個賽季中38場球賽球員們的傳球頻率密度,整體上看可以與單場球賽所展示出的頻率密度變化趨勢相同。以時間爲橫座標,成功傳球密度爲縱座標作圖:

Passes(t1,t2)=t2t1PassDiv(t)dt \text{Passes}\left( t_{1},t_{2} \right) = \int_{t_{2}}^{t_{1}}{\text{PassDiv}\left( t \right)\text{dt}}

第1場比賽傳球密度
整個賽季傳球密度

總體來說,傳球的密度在時間尺度上相對穩定。若使用Monte Carlo方法對每次傳球進行模擬,設定在上一次傳球后下一次傳球還需要的時間概率分佈服從N(θ,1)N\left( \theta,1 \right),其中θ\theta爲統計的平均傳球間隔時間,則在樣本規模NN滿足N2\operatorname{}N \approx 2時會近似與左圖的分佈;隨着樣本規模增加,當滿足N>4\operatorname{}N > 4後則會近似與右圖的分佈。因此我們可以認爲每一個時間點發生傳球事件的概率服從N(0,1)N\left( 0,1 \right)

下接:2020美賽F獎論文(三):足球團隊指標和基於機器學習的球隊表現預測
全文:

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章