大数据真逆天!如何利用进球时间分布预测进球数.....「基础篇」

2016-05-12
分享到:更多 ()

大数据真逆天!如何利用进球时间分布预测进球数.....「基础篇

文选自《fbi足彩技术与资讯》期刊中大麦茶所写的“进球时间与入球关系”一文。借着重温进球分布基础知识的内容,后面大麦茶会跟大家展开进球时间分布一系列技巧跟玩法,敬请期待!


足球比赛的规则很简单,它所存在和建立的宗旨就是使得球队战术和球员之间的配合得以实现,从而转化为进球。尽管如此,也会因为种种原因使比赛存在进球多少和进不进球的差别,所以分析预测足球比赛的进球能力还有一定难度。


▲世界杯上的高科技:大数据

 

现代网络科技为我们提供了大量可以参考分析的海量数据,这为足球预测产业提供了前所未有的视角,能够运用丰富多样的数据分析手段,让足球比赛预测提高一个层级的全新时代已经来临。

 

进球时间统计也是数据分析手段其中的一种方法,进球时间统计大致分为以下几种:



整个联赛或者杯赛进球时间统计,它好比证券市场中的交易指数,通过这类数据可以判断出某个联赛或者杯赛进球时间特点及能力强弱的关系。



例如:英格兰2012~2013赛季38轮入球时间分布(0-90分钟六大时段) 

起始时间

0

16

31

46

61

76

终止时间

15

30

45

60

75

90

进球数

134

142

186

182

184

232

法国2012~2013赛季38轮入球时间分布(0-90分钟六大时段)

起始时间

0

16

31

46

61

76

终止时间

15

30

45

60

75

90

进球数

106

124

159

153

157

217

通过这2个表格,可以得出英格兰联赛每个时间段进球比高出法国近10%以上,如果再用上半场前15分钟和下半场后15分钟来做对比,法国联赛进球翻倍。通过对两个联赛上下半场进球对比,结论就是下半进球高出上半场73%以上。通过这样的联赛进球时间分布数据对比,我们就会知道在英格兰联赛的31至45分钟开始,才是介入进球投注分析的最佳时机,法国联赛则应看重下半时段的进球高发可能。


因此可以说,对联赛进球时间分布数据的比较,首先从宏观上就提高了选择哪些比赛和时机来做进球预测的科学性。而这些进球时间分布数据,在很多指数网和彩票网站也都有据可查。以下进球和失球时间分布数据,均来自新浪爱彩网的足球资料库中的“进球/失球时间分布统计”,里面也包含了多个赛季的球队总体得失球时间分布情况,建议大家参考。

    

欧洲俱乐部冠军杯2012~2013联赛96场入球时间分布

0

16

31

46

61

76

15

30

45

60

75

90

33

45

41

38

42

55

欧洲俱乐部冠军杯2011~2012联赛96场入球时间分布

0

16

31

46

61

76

15

30

45

60

75

90

31

47

55

45

42

64

欧洲俱乐部冠军杯2010~2011联赛96场入球时间分布

0

16

31

46

61

76

15

30

45

60

75

90

27

47

43

40

47

72

通过这3届冠军杯每个时间段波动不大的数据可以看出,虽然历届球队有所不同,但是总体上的进球时间分布和能力大致相同,高发期还是在76~90的“秒杀”时段,即使存在细节上的差异,但也足以说明进球分布数据有极高参考价值。



球队进球时间分布



它可分为:整个联赛进球时间分布、主场比赛进球时间分布、客场比赛进球时间分布(好比证券K线年/月/日)。通过入球时间分布,可以了解球队的攻击力,比分落后时进球能力及比分领先扩大战果能力。


案例1


比赛进球时间分布:

详细事件

3

时间

1

 约维蒂奇


41'



约维蒂奇


55'



阿圭罗


69'





83'


萨巴莱塔

首先,对双方上个赛季的进球时间分布特征做下了解。

2013-2014两队前38进球时间分布


球队

总赛

0

10

20

30

40

46

50

60

70

80

10

20

30

40

45+

50

60

70

80

90+

1

曼城

38

10

13

6

7

10

4

15

8

11

18

2

利物浦     

38

10

13

14

13

9

3

12

4

11

12

 曼城方面:

1、蓝色数字10、15、8分别代表了曼城出现第一个进球的高发时间,也就是40~45、50~60、60~70这三大时间段是在前面沉闷很久后曼城突然爆发,经常在这三大时段出现8到15个进球,所以这几个时段下曼城打出第一个进球是需要关注的重要阶段。


2、红色数字18显示出在下半场80分钟后,是曼城进球的高峰时间。

 

利物浦方面:

1、 红色数字14代表利物浦在20~30分钟是他们进球高峰时段。

2、 在46~50分钟时段,双方的进球发生率都在所有数据中最弱。

 

2013-2014两队(主场)进球时间分布


球队

总赛

0

10

20

30

40

46

50

60

70

80

10

20

30

40

45+

50

60

70

80

90+

1

曼城

19

6

7

3

7

6

1

8

6

8

11

2

利物浦

19

5

7

9

9

4

2

7

2

5

3

2013-2014两队(客场)进球时间分布


球队

总赛

0

10

20

30

40

46

50

60

70

80

10

20

30

40

45+

50

60

70

80

90+

1

曼城

19

4

6

3

0

4

2

8

2

3

7

2

利物浦

19

5

6

5

4

5

1

5

2

6

9

曼城方面: 

1、通过主客场比较,曼城的主场进球能力要比客场高很多。

2、曼城在客场在50~60分钟和80分钟后的进球能力较强。

3、曼城客场的80分钟后的进球能力低于主场。

 

利物浦方面:

1、总体上利物浦的客场进球能力要强于曼城的客场,从这场比分也充分说明利物浦客场具备进球和比分落后时的进球能力。

2、尤其要注意的是利物浦在客场80分钟以后时段进球能力要明显强于主场(主场3客场9)。

 

上面举例只用一个赛季的进球时间分布完成,这还不能反映的更为全面,如果用海量分析法去对球队近千场联赛进球时间分布数据进行罗列,这样对我们的判断进球能力会更有帮助。



利用让球方进球和受让方失球时间分布的海量数据分析(前提是把让球方假设为攻击方、受让方假设为防守方)

为了更为精确地分析进球和失球时间及能力,还可以通过进球和失球时间分布数据去对应排列找出集合区域,这个集合区域的意思就是主队进球高峰期与客队失球高峰期的交汇点,客队进球高峰期与主队失球高峰期的交汇点。如果主队的进球高发时间正好是客队失球较多时间,那么在这个时间段出现进球的机会就会增加。反之,对于客队进球高峰期也是相同。


下面这个是笔者自己手工制作的两队得失球时间分布图表,表中最下方小方框中的数据代表了比赛年份。


(注:10、11、12、13、14分别代表2010年、2011年、2012年、2013年、2014年)

(这块做下条状说明,红色代表10年、蓝色代表11绿色代表12黄色代表13年紫色代表14


(注:1011121314分别代表2010年、2011年、2012年、2013年、2014年)

(这块做下条状说明,红色代表10年、蓝色代表11年绿色代表12年黄色代表13年棕色代表14年

通过以上图表可以看出,从2011年以来,曼城实现第一个进球的高峰期恰是利物浦失球的高峰期,也就是30~45分钟这个时段,曼城第1个进球是曼城进球高峰区域也是利物浦失球高峰区域,第2和第3个进球也是相同道理。反观利物浦的进球81分钟也是利物浦进球高峰区域也是曼城失球高峰区域,曼城2011-2013赛季平均失球时间段分布:


0--15

15--30

30--45

45--60

60--75

75--90

2013赛季

2

6

6

6

6

11

2012赛季

4

6

3

7

8

6

2011赛季

-

1

5

8

8

7

通过进失球时间分布分析在走地中投注大球可以比较准确的找到切入大球的切入点,获得更高的回报率。在分析进失球时间分布如果是比较弱的队伍要以它的失球时间分布数据为主,还要注意球队战意问题,天气/受伤等不可抗拒问题影响。   


以下用几个实战案例详细解读这个方法的综合运用

 案例2 

详细事件

0

时间

1



75'


渡大生

双方的总体进球能力都很一般,主队熊本在错过了61分钟前的绝佳进球机会后,进球分布指数出现下滑时也恰巧是客队进球分布增强阶段出现失球。而在此后阶段,根据得失球时间分布,客队的进球概率极高,因为在76~90阶段是主队失球和客队进球高峰,但是赛前盘口2/2.5球高水和当时极高的1.5大水位,都令笔者产生了动摇。


因此,按照得失球时间分布预测进球也应该与足彩指数相结合,终究规律和历史也会受到很多因素影响而发生变化,而庄家在对信息的了解程度上的优势也是我们在注重历史规律基础上需要加以利用的重要分析资源。可以看出熊本深红在46-60时间段及76-90时间段是失球高发期,而北九州向日葵在76-90是进球高发时段。



案例3

详细事件

3

时间

2



13'


阿迪



16'


考德威尔

哈格隆德


62'



哈格隆德


70'



小布拉德利


89'



客队在半场15分钟前就已经领先2个球,0~15分钟客队的进球分布是9个球还不算低,主队在当时的失球分布是8个也不低,打出这个过程也基本符合。这场澳门大球从2.5/3球0.80降水到同盘0.75水,大球走势符合进球较多的条件,盘口思路从过程中得到验证。而此后主队开始疯狂的反击,从场面上完全地压制了对手,但是在16~60分钟的漫长时间内一直未能得到突破,而此时段客队失球分布很低。


就在客队失球分布数值开始加大时,主队的反击得到回报,在61~75时段主队连入两球扳平比分。76~90分钟是主队进球和客队失球的最高峰时期,当时的走地主盘还开在4.5/5球0.88水,在这样的时间开出这种盘水,与得失球时间分布和比赛激烈火爆的场面都十分贴合,最终主队遵照历史规律在关键时段打进制胜一球。在最后这个案例中,笔者将得失球时间分布、赛前盘和走地盘与比赛场面做出了结合,目的也在于希望读者不要过于依赖单一方法去预测比赛,应立足于某种有效方法基础上具备综合分析能力。



我注意到,财富社区的“威廉希尔不懂球”将我的我这套理论应用在了实战中,从他在社区头条和私下投注的成绩可以看出取得了一定的成功,但是也想对他曾经出现的一些失误做下总结。


就拿2014赛季中超最后一轮:北京国安0:0河南建业来说,可能是本人久居海外的缘故,我不太关注国内联赛,当然这里也有一些众所周知的原因,在此不便多说。我私下里给刘胜临、威廉等人做出的建议是,在做进球能力分析时必须要注意几个重点:

 1、如果因为赛季初期轮次较少而要参考上个赛季进球分布,需要注意下球队在攻防位置上人员实力变化情况。国安这场由于是联赛收官战,本赛季数据足以满足条件,而且球队属于全员作战,可以按照本赛季数据进行分析。    


2、要注意球队的战意问题,这场比赛按常理主客队都有战意,这个我看了威廉的社区赛事头条,但是在31分钟这个主队进球能力较强和客队失球较多的交汇时间内没能进球,说明场外因素可能影响了球队的比赛部署,战意还是存在问题。


3、注意临场大小球盘口,我很纳闷既然威廉已经判断出全场大球不乐观,却还在坚持半场和下半场都有进球的思路。从我们赛后交流得知,他还是看好全场2球可能,也被国安一定赢球的主观想法所误导(他是北京人更是国安球迷)。

说到这里,需要做个小结:

(1) 攻击球员和得分手确保上场

(2) 球队具备相当的战意

(3) 进球/失球时间分布中存在3个以上交汇点

(4) 在达到上述条件之下,大小球盘中的大球应处于低水方,临场继续降水为最佳

 


场地和天气情况,作为想用足彩赚钱的专业人士,分析比赛时尽可能要多考虑的全面周到。



预测进球时间分布也更是如此,进球是否遵照历史规律多是在特定条件下所实现,而一旦出现不正常的天气和场地,则极有可能改变进球分布和规律,这一点也是分析比赛的重要环节。虽然正谈到的这场比赛不存在异常天气和场地问题,但是在平时进行分析时也应该形成关注场地和天气的习惯。

 


尽可能地回避冠亚军争夺战、保级战和有多线作战任务球队的比赛。



因为这类赛事下球队的部署和想法都会比较复杂,往往不会按照以往的思想去进行比赛。就如国安这场,想必他们也知道山东鲁能根本不具备战胜恒大的实力和动力,放掉河南自己拿个亚军也算皆大欢喜。如是这样,就算场上进攻再猛烈,质量和结果如何就可想而知了。这个绝对不是马后炮,我自己是从来不参与这类比赛的,这个和我熟悉的朋友都知道。


后面我会给大家交流进球时间分布的分析方法,敬请期待!

声明:本文为足球财富原创或编译,版权及相关权利均为足球财富享有,未经许可任何人不得以商业用途转载,否则将依法追究法律责任。

扫码关注胜临足球310


150000人已关注
6

文章

10545

阅读数

美国华裔,现就职某公司市场投资评估师,精通体育赛事数据分析,曾发表《进球时间统计与进球能力实战研究》。

Copyright © 2016 京ICP备15045438号-1 足球财富技术门户

北京胜临智博文化传媒有限公司