Analytics: Copa Mundial de la FIFA
Para este proyecto analicé los datos de las Copas Mundiales de la FIFA entre 1930 y el 2014. Este torneo es una competición internacional de fútbol, donde los paises utilizan a sus mejores jugadores para lograr clasificar y obtener el trofeo de campeón mundial. Se juega cada cuatro años desde su inaguracion en 1930, a excepción de 1942 y 1946 donde la Segunda Guerra Mundial impidió que se llevara a cabo la competición. El formato actual del campeonato consiste en 32 equipos los cuales, compiten entre ellos durante en un mes un país anfitrión.
A lo largo del proyecto se encuentra:
- Limpieza de datos y estandarización de los nombres de los países.
- Análisis de los ganadores de la Copa Mundial desde 1930 al 2014.
- Visualización de los partidos jugados y los equipos clasificados a cada una de las diferentes Copas del Mundo a través de los años.
- Análisis de la distribución de goles por partido.
- Análisis del promedio y del total de goles marcados para un equipo específico a lo largo de sus participaciones mundialistas.
Archivos y Tecnologías Utilizadas
El análisis fue hecho con dos archivos .csv descargados de Kaggle. ‘WorldCups.csv’ contiene información de cada partido que se ha jugado en las Copas del Mundo, el año en que se jugo, el país que gano el título, los equipos que ganaron medallas, los goles marcados, los equipos que clasificaron al torneo, partidos jugados y la asistencia total de público. Por otro lado, ‘WorldCupmatches.csv’ contine información de cada partido jugado en las Copas del Mundo incluyendo el año, la fase, el estadio, la ciudad, el equipo local y visitante y los numeros de goles marcados.
Ahora bien, en terminos de las tecnologías utilizadas, python fue utilizado para el análisis de datos con las siguientes herramientas: pandas para limpiar, estandarizar y manipular datos, numpy para operaciones y análisis númerico y matplotlib y seaborn para gráficar.
Análisis
Copas del Mundo 1930 - 2014

Figura 1: Ganadores de la Copa Mundial 1930 -2014
Hay 8 diferentes países (10.12%) que han sido campeones del mundo de 79 páises que han participado a lo largo de los diferentes torneos. De ellos, Brazil (1958, 1962, 1970, 1994, 2002), Alemania (1954, 1974, 1990, 2014) e Italia (1934, 1938, 1982, 2006) no solamente han ganado el 65% de las veces sino también encabezan el número de aparaciones en el campeonato (21, 19 y 18 respectivamente) y el número de partidos jugados (109, 109 y 83 respectivamente).
Como se puede ver en los gráficos a continuación, han habido cambios significativos en el número de equipos que se han calificado a la Copa del Mundo a lo largo de los años junto con, el número de partidos jugados por campeonato. El formato que se utiliza actualmente empezo a usarse en 1998, donde 32 equipos clasifican a la justa mundialista, son divididos en 8 grupos de 4 equipos cada uno y se juegan 64 partidos en total. Los primeros dos equipos de cada grupo clasifican a octavos donde se enfrentan a otro equipo en un solo partido. El equipo que pierde es eliminado mientras que, el que gana avanza a cuartos de final. Esta formula se repite para pasar a semi-finales y finalmente al partido final.

Figura 2: Partidos Jugados por Copa del Mundo.

Figura 3: Equipos Clasificados por Copa del Mundo.
Goles Marcados

Figura 4: Distribución de Goles por Partido.
Como lo muestra el diagrama de caja, la distribución de goles por partido ha cambiado a lo largo de los años. En los primeros años de la Copa del Mundo (1930 - 1950) hay una mediana de 4 goles por partido. Teniendo en cuenta que la mediana de equipos clasificados en esos torneos era 14, apenas el 44% de los equipos que se clasifican hoy en día, y la mediana de los partidos jugados era 18, el 28% de los partidos que se juegan hoy, la mediana del número de goles es alta, doblando incluso las Copas del Mundo 2002, 2006, 2010 y 2014. Esto se debe principalmente al hecho de que, los equipos se enfocaban en utilizar un estilo de juego vertical con transiciones rapidas entre defensa y ataque, lo que les permitía crear un mayor númeo de oportunidades de gol durante el juego.
La Copa del Mundo de 1954 en Suiza ha tenido hasta el momento la mediana mas alta de goles marcados por partido con 5. En este torneo países como Corea del Sur, Turquia y Escocia hicieron su debut, lo que llevo a que hubiera partidos con una gran cantidad de goles marcados. Hungria 9 - 0 Corea del Sur, Uruguay 7 - 0 Escocia y Turquia 7 - 0 Corea del Sur son algunos ejemplos del porqué el rango Q3 del diagrama de caja para ese año es tan grande.
Avanzando en el tiempo, de 1958 a 1994 la mediana de goles marcados por partido vario entre 3 y 2 goles. Nuevos países continuaron haciendo su debut y aunque el número de equipos participantes desde 1982 a 1994 aumento a 24 y el número de partidos jugados por torneo tambien aumento respectivamente, no hubo una variación siginificativa en la mediana de goles marcados por partido. Esto se debe principalmente, a que los equipos debutantes adoptaron un estilo de juego defensivo, sacrificando su ataque y enfoncandose en prevenir que su oponente cree oportunidades de gol.
Finalmente, de 1998 al 2014 se instauro el nuevo formato donde participan 32 equipos y se juegan 64 partidos. Durante este periodo, la mediana mas alta de goles por partido fue 3 en el campeonato de 1998 mientras que, para el resto la mediana se mantuvo en 2 goles. Los partidos se volvieron cada vez más tácticos y el contragolpe junto con una defensa ferrea se volvieron populares lo que llevo, a victorias por la mínima diferencia. Esto se puede ver mas claramente en las fases finales del torneo, como lo muestra el gráfico a continuación, donde el número de goles marcados en estas instancias fue disminuyendo con el pasar de los años. Incluso Brazil que era famoso por su estilo de juego de ataque y joga bonito fue influenciado por esta moda y durante este periodo solo gano la Copa del Mundo del 2002 tanto es así, que los equipos brasileños de ensueño son cosa del pasado.

Figura 5: Goles Marcados en Instancias Finales.
Análisis de Goles Marcados por un Equipo a lo Largo de los Mundiales
Hay 79 diferentes países que han participado a lo largo de las diferentes Copas del Mundo. En ese sentido, creé la función country_info que toma como parametros el nombre de un país y un dataset y retorna un DataFrame con la información de las participaciones en el torneo del país. Esta información es pasada como parametro a la funciones avg_goals_scored y total_goals_scored para gráficar los goles marcados por el país en los torneos que ha participado. A continuación, se ve los goles promedio por partido marcados por Italia y el total de goles marcados en cada una de sus participaciones.

Figura 6: Promedio de Goles de Italia Marcados por Partido.

Figura 7: Total de Goles de Italia por Copa del Mundo.
El mayor número de goles marcados por Italia en una Copa Mundial fue 12, esto ocurrió en el campeonato de 1934, 1982 y 2006 con un promedio de goles por partido de 2.4, 1.7 y 1.7 respectivamente. Un escalón más abajo con 11 goles se encuentra el torneo de 1938 con un promedio de 2.8 goles por partido siendo este, el promedio más alto de gol conseguido por Italia en todas sus participaciones. En todos estos años Italia alzo la Copa del Mundo. Por otro lado, sus peores marcas fueron en 1966 y 2014 , 2 goles marcados y un promedio de gol por partido de 0.7, lo sigue su participación en 1962 con 3 goles marcados y un promedio de gol por partido de 1 gol y en 1950 como en 2010 marco 4 goles y tuvo un promedio de gol por partido de 2 y 1.8 respectivamente. En estos años Italia fue eliminada en fase de grupos. En este sentido, hay una relación positiva entre el número de goles marcados en la Copa Mundial y la posición final en el torneo. Así pues, en las Copas Mundiales donde Italia marco una mayor cantidad de goles tuvo un mayor promedio de gol por partido lo que le permitio, tener una mayor probabilidad de avanzar por las diferentes etapas del torneo y llegar a la final.