¿Quién ganará la liga española de fútbol? la influencia del rendimiento en el resultado de los equipos
¿Quién ganará la liga española de fútbol? la influencia del rendimiento en el resultado de los equipos
Resumen:
En este trabajo se realiza una estimación matemática de la posición final esperable de los equipos en la Liga Española de Fútbol de la temporada 2006/2007 a partir del rendimiento y la puntuación alcanzada en la primera vuelta de la competición. Para ello se utiliza una metodología basada en la regresión lineal. La proxy de rendimiento utilizada consiste en la diferencia entre los lanzamientos realizados y recibidos por cada equipo en cada partido. Los resultados empíricos permiten justificar que el azar puede tener relevancia para explicar el resultado de los equipos en un único partido, pero que a partir de cierto número de encuentros el rendimiento es el factor determinante para explicar los puntos obtenidos por los equipos. A partir de estos resultados se realiza una estimación de la clasificación final en la Liga Española de Fútbol y se presentan distintas simulaciones de los puntos que cabría esperar que alcancen los equipos al finalizar la segunda vuelta dependiendo de los distintos valores de su rendimiento en la competición.
1.- INTRODUCCIÓN
Al finalizar la primera vuelta de la Liga de Fútbol varias preguntas ocupan la atención de aficionados, entrenadores y jugadores. ¿Qué va a pasar al final de la competición? ¿Se mantendrán los equipos en su posición actual o cambiará su clasificación? ¿Es posible estimar los resultados finales del campeonato a partir de la clasificación de la primera vuelta? Las distintas competiciones organizadas por la Federación Española de Fútbol pueden distribuirse entre competiciones de calendario corto y largo y competiciones de liga o de eliminación directa (Knock-Out: KO). La Liga es una competición de calendario largo y con un formato donde todos los equipos juegan contra todos los demás (liga) y la Copa del Rey es una competición de calendario corto y de eliminación directa. Los resultados de las investigaciones científicas sugieren que en las competiciones de calendario largo y formato de liga, el rendimiento alcanzado por los equipos es una variable muy importante para dar cuenta de los puntos que alcanzan los equipos en el campeonato y, además, que el azar puede tener influencia para explicar el resultado de los equipos en un único partido o en un número muy limitado de ellos (competiciones de calendario corto y de eliminación directa), pero no después de un número amplio de jornadas (Lago, 2005; 2006). Así, para Lago (2005) el resultado de un partido de fútbol puede modelizarse como una función de factores sistemáticos y no sistemáticos: y: ƒ(x, ?t), donde y es el resultado del partido, x es el rendimiento alcanzado por los equipos (factor sistemático) y ? t es el azar propio de la competición (factor no sistemático). Sin embargo, en un campeonato de calendario largo, el azar acaba siendo un factor que desaparece y no tienen influencia sobre la puntuación final de los equipos.
Dicho de otro modo, el resultado de los equipos en la competición es una función de su rendimiento. Ahora bien, la cuestión clave consiste en seleccionar una variable independiente del juego capaz de recoger el concepto de rendimiento. La acumulación de investigaciones científicas en los últimos años ha permitido generar conocimiento científico en ciertos aspectos del análisis del rendimiento en el fútbol. Dos reglas básicas han sido aceptadas en el análisis del juego y la evaluación del rendimiento: 1 El comportamiento estratégico de los jugadores y equipos puede modificarse a lo largo de un partido: debemos analizar las pautas sistemáticas de la actividad de los participantes en episodios similares dentro de un mismo partido o en encuentros diferentes (O´Donoghue y Tenga, 2001; Bloonmfield, Polman y O´Donoghue, 2005; James, Jones y Mellalieu, 2004; Lago y Martín Acero, 2005 y Lago, Martín Acero, Seirul-lo y Álvaro, 2006) 2 Los equipos tienen diferentes estilos de juego: no se pueden utilizar y cuantificar los mismos indicadores del rendimiento para todos ellos (Hughes y Bartlett, 2002; Lago y Martín Acero, 2005 y Lago, Martín Acero, Seirul-lo y Álvaro, 2006). Desde esta perspectiva resulta muy difícil seleccionar una variable del rendimiento capaz de servir simultáneamente a todos los equipos en partidos con evoluciones muy dispares. Asumiendo esta limitación, se propone como variable dependiente la diferencia entre los lanzamientos realizados y recibidos por un equipo en cada partido. Este variable permite, a nuestro juicio, recoger el éxito del proceso ofensivo y defensivo de los equipos. El objetivo del ataque es anotar goles mediante lanzamientos, y el de la defensa evitarlos. La diferencia entre ambos permite valorar con el mismo criterio a equipos con un estilo de juego más ofensivo o más defensivo. El objetivo de este trabajo es estimar el efecto causal del rendimiento en los puntos que alcanzan los equipos en la primera vuelta de la Liga Española de Fútbol y, a partir de ahí, realizar una previsión de la clasificación final de la competición.
2.- MATERIAL Y MÉTODO
Muestra La muestra consiste en los 190 partidos disputados en la primera vuelta de la Liga Española de Fútbol de la temporada 2006/2007. De cada partido se han recogido datos de cada uno de los dos equipos que se enfrentan entre sí con el fin de maximizar el número de observaciones y facilitar la inferencia estadística. De este modo el número total de observaciones es de 380. Los datos utilizados en esta investigación han sido tomados de la página oficial de la Federación Española de Fútbol (www.rfef.es). Para comprobar la validez de los datos se ha visionado un partido seleccionado al azar. El coeficiente Kappa de Cohen alcanzó el valor 0.95. Variable dependiente La variable dependiente es el número de puntos que alcanzan los equipos al finalizar la primera vuelta de la competición (en total, 19 jornadas). Variable independiente La variable independiente es el rendimiento alcanzado por los equipos en los diferentes partidos de la competición. La proxy de rendimiento utilizada consiste en la diferencia entre los lanzamientos realizados y recibidos por cada equipo en cada partido. Es decir, si en un encuentro el equipo A efectúa 15 lanzamientos a la portería rival y recibe 10, su rendimiento será de 5; mientras que el rendimiento de su oponente será de –5.
Lógicamente, el rendimiento positivo de un equipo se corresponde con un rendimiento negativo de la misma magnitud por parte de su rival: la suma de ambos rendimientos debe ser siempre por ello igual a 0. Hemos recogido en la variable lanzamientos a portería, tanto los remates que se producen entre los tres palos como aquellos que van fuera de la portería con el fin de maximizar el número de observaciones y facilitar la inferencia estadística. El elevado número de lanzamientos que se suceden, en comparación con la baja cantidad de goles que se producen, y la evidente relación que aquéllos guardan con el marcador final (a más lanzamientos realizados y menos recibidos parece lógico que se incremente la posibilidad de ganar) justifican el indicador del rendimiento seleccionado para este trabajo. Análisis estadístico Para determinar la influencia del rendimiento de los equipos sobre los puntos obtenidos en la primera vuelta de la competición se ha realizado un análisis de regresión lineal. En la regresión la variable dependiente es el número de puntos que alcanzan los equipos al finalizar la primera vuelta de la competición. El coeficiente positivo o negativo para el rendimiento (variable independiente o explicativa) implica que ésta tiene respectivamente influencia positiva o negativa sobre los valores de la variable dependiente. Además, para aceptar la relevancia estadística de las variables es preciso rechazar la hipótesis nula de que su coeficiente es igual a 0 (White, 1980; King, Keohane y Verba, 2000; Atkinson y Neville, 2001). El modelo propuesto es el siguiente: i 1 2 i i PUNTOS =? +? ?RENDIMIENTO +? donde PUNTOS es la puntuación obtenida por los equipos al finalizar la primera vuelta de la competición, RENDIMIENTO es el rendimiento que alcanzan los conjuntos y que es la diferencia entre los lanzamientos realizados y recibidos por cada equipo en cada partido y? es la perturbación aleatoria. Como hipótesis de la investigación se plantea que el rendimiento en el juego es un factor que determina los puntos que obtienen los equipos en la primera vuelta de la Liga. Cuanto mejor rendimiento tienen los equipos, más puntos tienen y están por ello mejor clasificados. Además se considera que es posible estimar la puntuación final de los equipos en la competición mediante la ecuación de regresión propuesta a partir del rendimiento de los equipos en la primera vuelta de la competición.
3. RESULTADOS Y DISCUSIÓN
Real Madrid y En la Tabla 1, se presenta el rendimiento alcanzado por los 20 equipos de la Liga Española de Fútbol ordenados de mejor a peor rendimiento. El equipo que mejor rendimiento ha tenido en la primera vuelta es el Atlético. Le siguen el Barcelona y el Sevilla. El Barcelona encabeza la clasificación, mientras el Atlético es quinto aunque sólo a cuatro puntos del primero. Real Madrid y Valencia también muestran niveles de rendimiento positivos que les permite ocupar el tercer y cuarto puesto de la clasificación. Por abajo, el Gimnástic y la Real Sociedad tienen el peor rendimiento de todos los equipos y son los últimos clasificados. Como norma general, se confirma que los equipos con un rendimiento alto se sitúan en los puestos altos de la clasificación y los conjuntos con un rendimiento bajo se encuentran en los puestos inferiores. Destaca el buen rendimiento del Mallorca (el cuarto de la Liga), que no se corresponde, sin embargo, con una puntuación elevada. En el sentido opuesto, el Villarreal tiene más puntos de los que cabría esperar por su rendimiento. Tabla 1. Rendimiento medio por partido y puntos alcanzados por los equipos en la primera vuelta de la Liga Española de Fútbol de la temporada 2006/2007
Tabla 1. ¿Quién ganará la liga española de fútbol? la influencia del rendimiento en el resultado de los equipos
Figura 1. ¿Quién ganará la liga española de fútbol? la influencia del rendimiento en el resultado de los equipos
Tabla 2. ¿Quién ganará la liga española de fútbol? la influencia del rendimiento en el resultado de los equipos
Tabla 3. ¿Quién ganará la liga española de fútbol? la influencia del rendimiento en el resultado de los equipos
Tabla 4. ¿Quién ganará la liga española de fútbol? la influencia del rendimiento en el resultado de los equipos
Bibliografía
Álvaro, J. (2005). El análisis de la competición como instrumento para la toma de decisión de los entrenadores: un estudio de la Liga Española de Fútbol Profesional de Primera División de la Temporada 2003-2004, Tesis Doctoral inédita, Madrid: Universidad Europea de Madrid.
Atkinson, G., Neville, A. (2001). Selected issues in the design and analysis of sport performance research, Journal of Sports Science, 19, 811-827.
Blommfield, J.R., Polman, R.C.J., O´Donoghue, P.G. (2005), Effects of score-line on team strategies in FA Premier League Soccer, Journal of Sports Science, 192-193.
Garganta, J. (2000). Análisis del juego del fútbol. El recorrido evolutivo de las concepciones, métodos e instrumentos”. Revista de Entrenamiento Deportivo, XIV, 2, 6-13.
Hughes, M.D. (1993). Notational Analysis of football. In Science and Football II (edited by T. Reilly, J. Clarys and A. Stibbe), pp. 151-159. London: E & FN Spon.
Hughes, M.D. (2003). Notational analysis. In Science and Soccer (edited by T. Reilly and M. Williams), pp. 245-264, London: Routledge.
Hughes, M.D.; Bartlett, R. (2002). The use of performance indicators in performance analysis. Journal of Sports Sciences, Special Edition, 20, 739-754.
Hughes, M.D., Evans, S.; Wells, J. (2001). Establishing normative profiles in performance analysis. International Journal of Performance Analysis of Sports, 1, 1-25.
James, N., Jones, P.D., Mellalieu, S.D. (2004). Possession as a Performance Indicator in Soccer. International Journal of Performance Analysis in Sport, 4, 1, 98-102.
James, N.; Mellalieu, S.D.; Holley, C. (2002). Analysis of strategies in soccer as a function of European and domestic competition, International Journal of Performance Analysis in Sport, 2, 1, 85-103.
King, G., Keohane, R. O., Verba, S. (2000). El diseño de la investigación científica. La inferencia científica en los estudios cualitativos, Madrid: Alianza.
Lago, C. (2005). Ganar o perder en el fútbol de alto nivel. ¿Una cuestión de suerte? Motricidad. European Journal of Human Movement, 14, 137-152.
Lago, C. (2006). El resultado de las selecciones en el Campeonato Mundial de Fútbol de Alemania 2006. La influencia del rendimiento y la suerte, Revista de Entrenamiento Deportivo, XX, 3, 19-26.
Lago, C., Martín Acero, R., Seirul-lo, F., Álvaro, J. (2006). La importancia de la dinámica del juego en la explicación de la posesión del balón en el fútbol. Un análisis empírico del F.C. Barcelona, Revista de Entrenamiento Deportivo, XX., 1, 5-12.
Martín Acero, R.; Lago, C. (2005). Deportes de equipo: comprender la complejidad para elevar el rendimiento, Barcelona: INDE.
McGarry, T., Franks, I. (2003). The science of match analysis, in Science and Soccer (eds T. Reilly and M. Williams), Routledge: London, 265-275.
Martín Acero, R. (2004). Planificación y programación en deportes de equipo. Tendencias de práctica e investigación, Valencia: Actas II Congreso de la Asociación Española de Ciencias de Deporte.
Neville, A.; Atkinson, G.; Hughes, M., Cooper, S.M. (2002). Statistical methods for analysing discrete and categorical data recorded in performance analysis. Journal of Sports Science. 20.829-844.
O´Donoghue, P.G.; Tenga, A. (2001). The effect of store-line on work rate in elite soccer, Journal of Sports Science, 19, 25-26.
O´Donoghue, P. (2005). Normative profiles of sports performance, International Journal of Performance Analysis in Sport, 5, 1, 104-119.
Seirul-lo, F, (1987). Opción de planificación en los deportes de equipo de largo período de competición, Revista de Entrenamiento Deportivo, Vol. I., 3, 37-45.
Trninié, S.; Milanovic, D.; Dizdar, D. (1997) ¿En qué se diferencian los ganadores de los perdedores en baloncesto? INFOCOES. II, 1, 56-66.
White, H. (1980). A Heterokedastic-Consistent Covariance Matrix Estimator y a Direct Test for Heterokedasticity, Econometrica, 48, 817-838.