+34 96 633 71 35
·WhatsApp·

7 Jun 2012

¿Quién ganará la liga española de fútbol? la influencia del rendimiento en el resultado de los equipos

En este trabajo se realiza una estimación matemática de la posición final esperable de los equipos en la Liga Española de Fútbol de la temporada 2006/2007 a partir del rendimiento y la puntuación alcanzada en la primera vuelta de la competición. Para ello se utiliza una metodología basada en la regresión lineal.

Autor(es): Carlos Lago Peñas, Joaquín Lago Ballesteros, Ezequiel Rey Eiras
Entidades(es): Universidad de Pontevedra
Congreso: III Congreso Internacional de las Ciencias del Deporte
Pontevedra 2007
ISBN:9788461160310
Palabras claves: Fútbol, rendimiento, resultado, clasificación, regresión lineal.

¿Quién ganará la liga española de fútbol? la influencia del rendimiento en el resultado de los equipos

Resumen:

En este trabajo se realiza una estimación matemática de la posición final esperable de los equipos en la Liga Española de Fútbol de la temporada 2006/2007 a partir del rendimiento y la puntuación alcanzada en la primera vuelta de la competición. Para ello se utiliza una metodología basada en la regresión lineal. La proxy de rendimiento utilizada consiste en la diferencia entre los lanzamientos realizados y recibidos por cada equipo en cada partido. Los resultados empíricos permiten justificar que el azar puede tener relevancia para explicar el resultado de los equipos en un único partido, pero que a partir de cierto número de encuentros el rendimiento es el factor determinante para explicar los puntos obtenidos por los equipos. A partir de estos resultados se realiza una estimación de la clasificación final en la Liga Española de Fútbol y se presentan distintas simulaciones de los puntos que cabría esperar que alcancen los equipos al finalizar la segunda vuelta dependiendo de los distintos valores de su rendimiento en la competición.

1.- INTRODUCCIÓN

Al finalizar la primera vuelta de la Liga de Fútbol varias preguntas ocupan la atención de aficionados, entrenadores y jugadores. ¿Qué va a pasar al final de la competición? ¿Se mantendrán los equipos en su posición actual o cambiará su clasificación? ¿Es posible estimar los resultados finales del campeonato a partir de la clasificación de la primera vuelta? Las distintas competiciones organizadas por la Federación Española de Fútbol pueden distribuirse entre competiciones de calendario corto y largo y competiciones de liga o de eliminación directa (Knock-Out: KO). La Liga es una competición de calendario largo y con un formato donde todos los equipos juegan contra todos los demás (liga) y la Copa del Rey es una competición de calendario corto y de eliminación directa. Los resultados de las investigaciones científicas sugieren que en las competiciones de calendario largo y formato de liga, el rendimiento alcanzado por los equipos es una variable muy importante para dar cuenta de los puntos que alcanzan los equipos en el campeonato y, además, que el azar puede tener influencia para explicar el resultado de los equipos en un único partido o en un número muy limitado de ellos (competiciones de calendario corto y de eliminación directa), pero no después de un número amplio de jornadas (Lago, 2005; 2006). Así, para Lago (2005) el resultado de un partido de fútbol puede modelizarse como una función de factores sistemáticos y no sistemáticos: y: ƒ(x, ?t), donde y es el resultado del partido, x es el rendimiento alcanzado por los equipos (factor sistemático) y ? t es el azar propio de la competición (factor no sistemático). Sin embargo, en un campeonato de calendario largo, el azar acaba siendo un factor que desaparece y no tienen influencia sobre la puntuación final de los equipos.

Dicho de otro modo, el resultado de los equipos en la competición es una función de su rendimiento. Ahora bien, la cuestión clave consiste en seleccionar una variable independiente del juego capaz de recoger el concepto de rendimiento. La acumulación de investigaciones científicas en los últimos años ha permitido generar conocimiento científico en ciertos aspectos del análisis del rendimiento en el fútbol. Dos reglas básicas han sido aceptadas en el análisis del juego y la evaluación del rendimiento: 1 El comportamiento estratégico de los jugadores y equipos puede modificarse a lo largo de un partido: debemos analizar las pautas sistemáticas de la actividad de los participantes en episodios similares dentro de un mismo partido o en encuentros diferentes (O´Donoghue y Tenga, 2001; Bloonmfield, Polman y O´Donoghue, 2005; James, Jones y Mellalieu, 2004; Lago y Martín Acero, 2005 y Lago, Martín Acero, Seirul-lo y Álvaro, 2006) 2 Los equipos tienen diferentes estilos de juego: no se pueden utilizar y cuantificar los mismos indicadores del rendimiento para todos ellos (Hughes y Bartlett, 2002; Lago y Martín Acero, 2005 y Lago, Martín Acero, Seirul-lo y Álvaro, 2006). Desde esta perspectiva resulta muy difícil seleccionar una variable del rendimiento capaz de servir simultáneamente a todos los equipos en partidos con evoluciones muy dispares. Asumiendo esta limitación, se propone como variable dependiente la diferencia entre los lanzamientos realizados y recibidos por un equipo en cada partido. Este variable permite, a nuestro juicio, recoger el éxito del proceso ofensivo y defensivo de los equipos. El objetivo del ataque es anotar goles mediante lanzamientos, y el de la defensa evitarlos. La diferencia entre ambos permite valorar con el mismo criterio a equipos con un estilo de juego más ofensivo o más defensivo. El objetivo de este trabajo es estimar el efecto causal del rendimiento en los puntos que alcanzan los equipos en la primera vuelta de la Liga Española de Fútbol y, a partir de ahí, realizar una previsión de la clasificación final de la competición.

Completa la información

Contenido disponible en el CD Colección Congresos nº13.

¡Consíguelo aquí!

2.- MATERIAL Y MÉTODO

Muestra La muestra consiste en los 190 partidos disputados en la primera vuelta de la Liga Española de Fútbol de la temporada 2006/2007. De cada partido se han recogido datos de cada uno de los dos equipos que se enfrentan entre sí con el fin de maximizar el número de observaciones y facilitar la inferencia estadística. De este modo el número total de observaciones es de 380. Los datos utilizados en esta investigación han sido tomados de la página oficial de la Federación Española de Fútbol (www.rfef.es). Para comprobar la validez de los datos se ha visionado un partido seleccionado al azar. El coeficiente Kappa de Cohen alcanzó el valor 0.95. Variable dependiente La variable dependiente es el número de puntos que alcanzan los equipos al finalizar la primera vuelta de la competición (en total, 19 jornadas). Variable independiente La variable independiente es el rendimiento alcanzado por los equipos en los diferentes partidos de la competición. La proxy de rendimiento utilizada consiste en la diferencia entre los lanzamientos realizados y recibidos por cada equipo en cada partido. Es decir, si en un encuentro el equipo A efectúa 15 lanzamientos a la portería rival y recibe 10, su rendimiento será de 5; mientras que el rendimiento de su oponente será de –5.

Lógicamente, el rendimiento positivo de un equipo se corresponde con un rendimiento negativo de la misma magnitud por parte de su rival: la suma de ambos rendimientos debe ser siempre por ello igual a 0. Hemos recogido en la variable lanzamientos a portería, tanto los remates que se producen entre los tres palos como aquellos que van fuera de la portería con el fin de maximizar el número de observaciones y facilitar la inferencia estadística. El elevado número de lanzamientos que se suceden, en comparación con la baja cantidad de goles que se producen, y la evidente relación que aquéllos guardan con el marcador final (a más lanzamientos realizados y menos recibidos parece lógico que se incremente la posibilidad de ganar) justifican el indicador del rendimiento seleccionado para este trabajo. Análisis estadístico Para determinar la influencia del rendimiento de los equipos sobre los puntos obtenidos en la primera vuelta de la competición se ha realizado un análisis de regresión lineal. En la regresión la variable dependiente es el número de puntos que alcanzan los equipos al finalizar la primera vuelta de la competición. El coeficiente positivo o negativo para el rendimiento (variable independiente o explicativa) implica que ésta tiene respectivamente influencia positiva o negativa sobre los valores de la variable dependiente. Además, para aceptar la relevancia estadística de las variables es preciso rechazar la hipótesis nula de que su coeficiente es igual a 0 (White, 1980; King, Keohane y Verba, 2000; Atkinson y Neville, 2001). El modelo propuesto es el siguiente: i 1 2 i i PUNTOS =? +? ?RENDIMIENTO +? donde PUNTOS es la puntuación obtenida por los equipos al finalizar la primera vuelta de la competición, RENDIMIENTO es el rendimiento que alcanzan los conjuntos y que es la diferencia entre los lanzamientos realizados y recibidos por cada equipo en cada partido y? es la perturbación aleatoria. Como hipótesis de la investigación se plantea que el rendimiento en el juego es un factor que determina los puntos que obtienen los equipos en la primera vuelta de la Liga. Cuanto mejor rendimiento tienen los equipos, más puntos tienen y están por ello mejor clasificados. Además se considera que es posible estimar la puntuación final de los equipos en la competición mediante la ecuación de regresión propuesta a partir del rendimiento de los equipos en la primera vuelta de la competición.

3. RESULTADOS Y DISCUSIÓN

Real Madrid y En la Tabla 1, se presenta el rendimiento alcanzado por los 20 equipos de la Liga Española de Fútbol ordenados de mejor a peor rendimiento. El equipo que mejor rendimiento ha tenido en la primera vuelta es el Atlético. Le siguen el Barcelona y el Sevilla. El Barcelona encabeza la clasificación, mientras el Atlético es quinto aunque sólo a cuatro puntos del primero. Real Madrid y Valencia también muestran niveles de rendimiento positivos que les permite ocupar el tercer y cuarto puesto de la clasificación. Por abajo, el Gimnástic y la Real Sociedad tienen el peor rendimiento de todos los equipos y son los últimos clasificados. Como norma general, se confirma que los equipos con un rendimiento alto se sitúan en los puestos altos de la clasificación y los conjuntos con un rendimiento bajo se encuentran en los puestos inferiores. Destaca el buen rendimiento del Mallorca (el cuarto de la Liga), que no se corresponde, sin embargo, con una puntuación elevada. En el sentido opuesto, el Villarreal tiene más puntos de los que cabría esperar por su rendimiento. Tabla 1. Rendimiento medio por partido y puntos alcanzados por los equipos en la primera vuelta de la Liga Española de Fútbol de la temporada 2006/2007

Tabla 1. ¿Quién ganará la liga española de fútbol? la influencia del rendimiento en el resultado de los equipos

Tabla 1. Rendimiento medio por partido y puntos alcanzados por los equipos

En la Figura 1, se muestra esta misma información pero ahora de forma gráfica, con el fin comparar las diferencias de rendimiento entre los equipos. De derecha a izquierda se presentan por orden los equipos de acuerdo con su posición en la clasificación: el Barcelona es el primero, el Sevilla el segundo y así sucesivamente. En la Tabla 2 se compara la influencia del rendimiento de los equipos sobre los puntos que alcanzan al final de la primera vuelta de la Liga Española de Fútbol en la temporada 2006/2007. Es preciso recordar que la victoria otorga 3 puntos, el empate 1 y la derrota 0. De este modo, el número máximo de puntos que un equipo podría alcanzar al final de la primera vuelta es de 57. En la jornada 19, el rendimiento de los equipos es estadísticamente significativo al nivel 1 por 100 para explicar los puntos obtenidos y además presenta el signo positivo esperado (cuanto mejor es el rendimiento, se obtienen más puntos). El modelo explica el 41 por 100 de la varianza de los puntos obtenidos por los equipos. La constante del modelo es significativa al 1 por 100 y se refiere a los puntos que cabría esperar que obtendría un equipo con un rendimiento de 0: en este caso 26 (redondeado). El coeficiente del rendimiento alcanza un valor de 2,59, es decir, que cada punto de mejora en el rendimiento otorga 2,59 puntos más en la clasificación. Así, por ejemplo, un rendimiento positivo de +2, supondría que un equipo sume 5 puntos más al finalizar la primera vuelta de la competición con respecto a un equipo con un rendimiento de 0. Del mismo modo, con un rendimiento de –2, cabría esperar que ese equipo tuviese 5 puntos menos. Figura 1. Correlación entre el rendimiento y la posición ocupada por los equipos de la Liga Española de Fútbol

Figura 1. ¿Quién ganará la liga española de fútbol? la influencia del rendimiento en el resultado de los equipos

Figura 1. Correlación entre el rendimiento y la posición ocupada por los equipos

Así, parece posible concluir dos cuestiones básicas acerca de la relación entre resultado, rendimiento y azar que verifican las hipótesis planteadas anteriormente: i) el rendimiento de los equipos es importante para dar cuenta de los puntos que alcanzan los equipos en el campeonato; ii) la suerte es un componente no sistemático del resultado de los equipos. Es decir, es posible que para un único partido o un número muy limitado el azar ocasione un resultado imprevisto por el rendimiento alcanzado por los equipos en la competición: “cada partido es una historia” Sin embargo, la suerte sólo afecta al partido en que ocurre. Después de un número amplio de observaciones, (como sucede en la muestra de este trabajo) la normalidad de las perturbaciones estoscásticas justificaría entonces que en el análisis empírico se excluya ? t y se exprese la influencia del rendimiento exclusivamente como el resultados de un componente sistemático o determinístico (si no fuera así, el azar sería un factor sistemático) (Lago, 2005). Tabla 2. Análisis de la influencia del rendimiento en los puntos obtenidos por los equipos en la primera vuelta (Jornada 19) de la Liga Española de Fútbol en la temporada 2006/2007

Tabla 2. ¿Quién ganará la liga española de fútbol? la influencia del rendimiento en el resultado de los equipos

Tabla 2. Análisis de la influencia del rendimiento en los puntos obtenidos por los equipos

FUENTE: Elaboración propia. NOTAS: Aparecen en primer lugar los coeficientes de regresión estimados, seguidos por las desviaciones típicas de los parámetros calculadas a partir de la matriz de varianzas y covarianzas estimada mediante el método de mínimos cuadrados ordinarios (MCO) y los errores robustos. R2 es el coeficiente de determinación. *p<0,01. A partir de los resultados alcanzados en el modelo de regresión presentado en la Tabla 2 es posible realizar una estimación de los puntos que cabe esperar que obtengan los equipos en la segunda vuelta de la Liga si mantienen su rendimiento. Lógicamente, la estimación se realiza sólo para la segunda vuelta, pues la puntuación de la primera vuelta ya es definitiva. La puntuación total en la Liga será pues la suma de los puntos obtenidos en la primera vuelta por los equipos, más la estimación realizada para la segunda. Según la estimación presentada en la Tabla 3, el Barcelona será el campeón de la Liga. Atlético, Sevilla y Real Madrid jugarán la Liga de Campeones y el Valencia y el Zaragoza la Copa de la UEFA.

Por abajo, Gimnástic, Real Sociedad y Betis ó Athletic ocuparán los puestos de descenso. Los equipos que más cambian su posición en la clasificación son el Atlético, que mejora en 3 puestos su situación al finalizar la primera vuelta, el Mallorca que en la estimación propuesta mejora en 5 puestos su clasificación y el Villarreal que pierde 4 puestos. En la Tabla 4 se presenta, a modo de ejemplo, una simulación de los puntos que cabría esperar que alcanzase el Celta de Vigo al finalizar la segunda vuelta de acuerdo con los resultados presentados en la Tabla 2. Como puede apreciarse tener un rendimiento positivo incrementa notablemente los puntos que obtiene el equipo: tener un rendimiento de +5 permite obtener en la segunda vuelta 13 puntos más que si se tiene un rendimiento de 0. Tabla 3. Clasificación final en la Liga Española de Fútbol de la temporada 2006/2007 a partir de del rendimiento y la puntuación de la primera vuelta

Tabla 3. ¿Quién ganará la liga española de fútbol? la influencia del rendimiento en el resultado de los equipos

Tabla 3. Clasificación final en la Liga Española de Fútbol de la temporada 2006 2007

Tabla 4. Estimación de los puntos previstos para el Celta al finalizar la Liga Española de Fútbol según el rendimiento alcanzado en la segunda vuelta

Tabla 4. ¿Quién ganará la liga española de fútbol? la influencia del rendimiento en el resultado de los equipos

Tabla 4. Estimación de los puntos previstos para el Celta al finalizar la Liga Española de Fútbol

En cualquier caso, esta previsión debe entenderse como una estimación de la clasificación final de los equipos dada su tendencia de resultados y rendimiento actual. Todavía puede existir margen para cambios. Es posible que algún conjunto mejore o empeore su rendimiento a partir de este momento. Pueden sucederse cambios de entrenadores, pueden surgir lesiones de jugadores clave, aparecer nuevos fichajes o puede influir participar simultáneamente en otras competiciones que alteren la evolución mostrada hasta el momento por los equipos. Eso sí, los entrenadores ya saben lo que puede suceder si continua su tendencia de juego y resultados. Algunos deberán entrenar para mantener su propuesta de juego. Otros deberán cambiar.

Además existen estimaciones para algunos equipos (Betis ó Levante) que debido a su reciente cambio de entrenador se han basado en el rendimiento mostrado con el preparador y el estilo de juego anterior. En estos casos la previsión debe ser matizada. 4. CONCLUSIONES En este trabajo hemos calculado cuáles fueron los efectos del rendimiento sobre los puntos obtenidos por los equipos en la primera vuelta de la Liga Española de Fútbol de la temporada 2006-2007. La diferencia de puntos obtenidos por los equipos situados en los primeros puestos de la clasificación en comparación con los demás, está influenciada más por el rendimiento que por la suerte. Los resultados empíricos demuestran que el azar puede tener relevancia para explicar el resultado de los equipos en un único partido o, a lo sumo, en un número muy limitado de ellos, pero que a partir de cierta cantidad de encuentros el rendimiento es determinante para dar cuenta de los puntos que alcanzan los conjuntos. A partir del modelo de regresión anterior hemos realizado una estimación matemática de la posición final esperable de los equipos en la Liga Española de Fútbol de la temporada 2006/2007 a partir del rendimiento y la puntuación alcanzada en la primera vuelta de la competición. Finalmente, hemos realizado diferentes simulaciones de los puntos que cabría esperar que alcanzase un equipo concreto al finalizar la segunda vuelta de la competición de acuerdo con diferentes niveles de su rendimiento. De todos modos, los resultados de estas simulaciones deben tomarse con cierta cautela, puesto que la capacidad predictiva del modelo no es perfecta. La predicción de las puntuaciones de los equipos pretende mostrar las tendencias o posibilidades de evolución en el campeonato que cabría esperar si se dan ciertas condiciones de rendimiento.

Bibliografía

Álvaro, J. (2005). El análisis de la competición como instrumento para la toma de decisión de los entrenadores: un estudio de la Liga Española de Fútbol Profesional de Primera División de la Temporada 2003-2004, Tesis Doctoral inédita, Madrid: Universidad Europea de Madrid.

Atkinson, G., Neville, A. (2001). Selected issues in the design and analysis of sport performance research, Journal of Sports Science, 19, 811-827.

Blommfield, J.R., Polman, R.C.J., O´Donoghue, P.G. (2005), Effects of score-line on team strategies in FA Premier League Soccer, Journal of Sports Science, 192-193.

Garganta, J. (2000). Análisis del juego del fútbol. El recorrido evolutivo de las concepciones, métodos e instrumentos”. Revista de Entrenamiento Deportivo, XIV, 2, 6-13.

Hughes, M.D. (1993). Notational Analysis of football. In Science and Football II (edited by T. Reilly, J. Clarys and A. Stibbe), pp. 151-159. London: E & FN Spon.

Hughes, M.D. (2003). Notational analysis. In Science and Soccer (edited by T. Reilly and M. Williams), pp. 245-264, London: Routledge.

Hughes, M.D.; Bartlett, R. (2002). The use of performance indicators in performance analysis. Journal of Sports Sciences, Special Edition, 20, 739-754.

Hughes, M.D., Evans, S.; Wells, J. (2001). Establishing normative profiles in performance analysis. International Journal of Performance Analysis of Sports, 1, 1-25.

James, N., Jones, P.D., Mellalieu, S.D. (2004). Possession as a Performance Indicator in Soccer. International Journal of Performance Analysis in Sport, 4, 1, 98-102.

James, N.; Mellalieu, S.D.; Holley, C. (2002). Analysis of strategies in soccer as a function of European and domestic competition, International Journal of Performance Analysis in Sport, 2, 1, 85-103.

King, G., Keohane, R. O., Verba, S. (2000). El diseño de la investigación científica. La inferencia científica en los estudios cualitativos, Madrid: Alianza.

Lago, C. (2005). Ganar o perder en el fútbol de alto nivel. ¿Una cuestión de suerte? Motricidad. European Journal of Human Movement, 14, 137-152.

Lago, C. (2006). El resultado de las selecciones en el Campeonato Mundial de Fútbol de Alemania 2006. La influencia del rendimiento y la suerte, Revista de Entrenamiento Deportivo, XX, 3, 19-26.

Lago, C., Martín Acero, R., Seirul-lo, F., Álvaro, J. (2006). La importancia de la dinámica del juego en la explicación de la posesión del balón en el fútbol. Un análisis empírico del F.C. Barcelona, Revista de Entrenamiento Deportivo, XX., 1, 5-12.

Martín Acero, R.; Lago, C. (2005). Deportes de equipo: comprender la complejidad para elevar el rendimiento, Barcelona: INDE.

McGarry, T., Franks, I. (2003). The science of match analysis, in Science and Soccer (eds T. Reilly and M. Williams), Routledge: London, 265-275.

Martín Acero, R. (2004). Planificación y programación en deportes de equipo. Tendencias de práctica e investigación, Valencia: Actas II Congreso de la Asociación Española de Ciencias de Deporte.

Neville, A.; Atkinson, G.; Hughes, M., Cooper, S.M. (2002). Statistical methods for analysing discrete and categorical data recorded in performance analysis. Journal of Sports Science. 20.829-844.

O´Donoghue, P.G.; Tenga, A. (2001). The effect of store-line on work rate in elite soccer, Journal of Sports Science, 19, 25-26.

O´Donoghue, P. (2005). Normative profiles of sports performance, International Journal of Performance Analysis in Sport, 5, 1, 104-119.

Seirul-lo, F, (1987). Opción de planificación en los deportes de equipo de largo período de competición, Revista de Entrenamiento Deportivo, Vol. I., 3, 37-45.

Trninié, S.; Milanovic, D.; Dizdar, D. (1997) ¿En qué se diferencian los ganadores de los perdedores en baloncesto? INFOCOES. II, 1, 56-66.

White, H. (1980). A Heterokedastic-Consistent Covariance Matrix Estimator y a Direct Test for Heterokedasticity, Econometrica, 48, 817-838.

Open chat
Saludos de Alto Rendimiento:

Para información sobre los cursos y másteres ONLINE, puede contactarnos por aquí.

Asegúrate de haber completado el formulario (azul) de información del curso/máster.

Gracias!