《紙上籃球》第三章第2節:休賽期應該怎麼利用

《紙上籃球》第三章第2節:休賽期應該怎麼利用

我們上一節說到,休賽期是總結過去預測未來最好的時間點。那麼具體可以怎麼做呢?把球員們的錄影找來看一看肯定是有幫助的。除此之外我今天想分享的,是整理資料的方法。

整理資料分成兩部分。球隊部分相對簡單一些,按照攻守資料分開呈現,各自排名的原則,把百回合得失分、四要素和投籃分佈都整理到表格裡就可以了。另外synergy每種type的比重和得分率也可以做,這塊不是一定要去synergy的網站付費買,官網有相對簡化的版本。

球員資料會更麻煩一些,需要分成幾個步驟:

1。整理一份出場時間達標的球員名單,我的習慣是把標準設定為500分鐘。如果你覺得官網頂部的篩選器用起來還是有些複雜,可以直接去BBR的賽季名單里根據時間排個序即可,比如2019-20賽季的網址是https://www。basketball-reference。com/leagues/NBA_2020_totals。html。

2。按照時間篩出來的球員大概會有300多人,根據位置放進5個工作表裡。有條件參考CTG的主要位置最好,沒條件的話根據BBR也行,儘量是不要自己憑印象劃分。憑印象除了可能不準外,或許還會導致某個位置人數特別多或者特別少。

3。選擇你認為比較重要的資料(怎麼選參考前面的章節),包括但不限於身高、體重、年齡、真實命中率、回合佔有率、助攻率、失誤率、投籃分佈資料、synergy資料、各類一體化資料等等,手動填進表格裡;加一些色塊或者圖示來更清楚地顯示高低。其中部分涉及每36分鐘的資料,需要做二次運算。

最後這一步大家可能會覺得有點蠢,300多人,每個人幾十項資料手動填?接下來我來說說原因。

1。昨天說了,休賽期是NBA停下來等你4個月,最不缺的應該就是時間。如果考慮到這塊整理的是常規賽資料,其實還會多出兩個月。半年每天十幾分鐘的工作量,正常人都能完成。

2。少數人有利用爬蟲抓資料的技術。這個技術你留到賽季期間用就好,和休賽期手動整理並不衝突。抓資料是為了最快效率地得出結果,但倘若這個結果的生成速度嚴重超出你的感知速度,它的實際優勢非常有限。

我個人是覺得“記”比“看”會讓人更加印象深刻一些。當然把資料全爬下來以後,每天花十幾分鍾看幾個球員的效果是差不多的,還能一開始就有完整的排名。反正大家在這裡要理解的是,整理資料不是單純為了得到結果,而是為了在過程中感知結果,求快是沒用的。

3。CTG自帶分位置量化的功能,能否取代休賽期的手動記資料?部分可以,但它不能完全覆蓋需求。比如各位置的出手頻率,synergy資料,各類一體化資料。

而在這個過程裡,你有可能學到的東西包括:

1。每個球員的特點。要知道每個位置的人數在六七十人左右,當資料門類足夠豐富的時候,幾乎每個球員——哪怕是平時看起來都差不多的配角——也會有相對獨特的,特別靠前或者靠後的資料。你把它記住以後,對球員的優缺點了解就會立體得多,不會再是“射手”、“藍領”這種模糊的分類。如果個別人完全沒有特別靠前或者靠後的資料,Mr。Average也是一種特點。

2。我上一章花了很多篇幅,來說每個位置各項資料多少算高多少算低。但哪怕我把各種門檻說得比四分位值更細,也不如你自己做一遍去感受要來得印象深刻。這項技能get到以後,在賽季中看球員的資料(主要是官網和BBR這種沒有分位置量化功能網站的資料)時也用得到。

3。由於部分資料之間存在關聯,反覆記會有助於理解。這句話看起來不太好懂,我舉個例子。真實命中率是一項普及度很高的資料,懂得它的演算法以及多少算高多少算低並不難。但很多人對它還是會有一種霧裡看花的距離感,這是看到資料結果卻沒有反覆感受計算過程所導致的。如果把球員的真實命中率和投籃分佈資料都對照著仔細看一遍,距離感會小得多。

4。整理球員資料,對建立球隊的預期值也有很大幫助。假設一套新陣容裡沒有回合佔有率超過25%的球員,你肯定就會帶著“誰來扛球權”這個疑問來關注該隊的新賽季表現。我知道由於輪換細節的關係,由於防守資料更特殊的關係,把球員資料捏合起來展望球隊仍然有難度。但至少一些更簡單的問題,比如各隊空間好不好,是可以透過整理球員資料來得到更精準的答案的。

比較遺憾的是,ESPN最近幾年已經砍掉了給每個球員撰寫報告的環節了,不然大家既可以練英文,又可以藉此“驗收”一下夏天自己的整理成果。這個工作相當於打地基,地基打紮實了,開賽就是繼續添磚加瓦而已。

最後幾段我有些猶豫該不該寫。就是其實我自己也不太清楚這篇文章的具體受眾是誰。對於業餘愛好者而言,哪怕是每天十幾分鍾,做起來還是有些超綱了,可能只有少數真的樂在其中的硬核球迷會(或者有必要)去嘗試。對於從業者而言,我自己會認為這是值得花時間的工作。但現狀就是大部分的從業者是帶著一種“驕傲”的,不會覺得吸收知識的方式有什麼需要改進的地方,“觀點各有不同”嘛。

圈哥以前也說過類似的事情,大意就是從業者出的問題並不在於努力程度,而在於努力方向,大部分人就沒有資料分位置標準化的概念。當時那條微博我只是在底下評論說“這種話你講可以,我講就變成目中無人了”。關鍵是沒有概念是因為不知道方法,還是壓根兒不覺得它重要?後者是我做再多的科普,都很難改變的。具體受眾是誰,也只能隨緣就好了。

下一節會開始聊賽季期間的資訊更新。系列文章微博“旋貓”首發,每天晚上6點日更。