Un pulpo Paul de big data

A finales del siglo pasado, o en los primeros años de los 90, un par de estudiantes estaban obsesionados con ganar una competición virtual de la liga de baloncesto universitario. Tantas horas pasaban en esta fantasy league que al final decidieron hackearla para obtener todos sus datos. Los organizaron, obtuvieron las probabilidades de cada equipo y lograron ganar la liga ese año.

Pero este no sería el único gran logro de dos estudiantes de la universidad estadounidense de Standford: Jerry Yang y David Filo. Al año siguiente dejarían los jueguecitos y se pondrían a organizar todas las webs del mundo mundial. Y en 1994 fundarían Yahoo. Una empresa que 15 años más tarde alcanzaría un valor de 40,000 millones de euros.

icono-yahoo

Pero no, no vamos a hablar de buscadores. Vamos a quedarnos con las ligas fantasy. Un negocio antiguo que no deja de renovarse, y que mueve, según Forbes, más de 60,000 millones de euros al año. Para este tipo de negocios, el big data es el futuro. ¿O quizá su gran amenaza?

Las ligas fantasy

Las competiciones de deportes fantasy, o rottaries, su nombre original, son el mejor ejemplo de cómo explotar la competitividad de los fans del deporte. También son una muestra de cómo sacar partido a los frikis de las estadísticas deportivas. Y de cómo expandirlo todo para lograr una legión mundial de jugadores.

Básicamente, una liga fantasy es una competición virtual en la que cada participante crea un equipo con jugadores reales dentro de una competición que puede ser pública o privada (entre amigos, familia, compañeros de trabajo…). Estos equipos puntúan cada jornada en función de la actuación de los jugadores en la vida real. Y el objetivo, claro está, es conseguir más puntos que tu vecino.

Cuando se inventaron las primeras en la década de 1960, los puntos se calculaban a mano y con papel y boli. Hoy se manejan completas bases de datos en tiempo real que generan las puntuaciones en base a un montón de variables diferentes.

ligas fantasy

Los datos, los puntos, el negocio

“Tenemos toda la información almacenada en un replica set de MongoDB, una base de datos NoSQL”, explica Daniel desde Futmondo, una de las muchas plataformas de este tipo que hay en Espña. “Para establecer las puntuaciones, tenemos procesos automáticos y procesos manuales, todo lo que se puede automatizar está automatizado y hoy en día dificultades en cuanto a puntuaciones, pocas”.

Muchas ligas fantasy como Futmondo, o la reina en España, Comunio, basan sus sistemas de puntuación en las valoraciones que cada jugador recibe en la prensa escrita. Es decir, según la opinión del periodista del diario Marca o As, o ambos, el programa otorga una serie de puntos. Todo, a priori, bastante subjetivo.

Algunas competiciones han dado un paso más y buscan alejarse del factor humano. ¿Cómo? Pues los jugadores virtuales, automáticamente, suman o restan puntos en función de los minutos que han jugado, goles marcados, pases dados o tarjetas recibidas, entre otros muchos factores.

“Hasta la fecha, almacenamos mucha información en nuestra infraestructura pero lo explotamos bastante poco aunque ya estamos pensando en fórmulas que permitan sacar más de toda esa información acumulada”, dicen desde Futmondo.

Las competiciones oficiales – sí, nadie quiere llegar tarde a la fiesta – han ido un poco más lejos. El acceso a todos los datos reales es una clara ventaja competitiva. “Los Puntos Fantasy se calculan en base a determinadas acciones reales que acontecen en cada partido de la Liga BBVA y se recogen en las estadísticas oficiales de la competición. Dichas acciones se traducen en Puntos Fantasy que va sumando cada jugador alineado en el juego”, se explica en la web de La Liga Fantasy, la competición virtual oficial de la liga de fútbol en España.

Y claro, y si hablamos de Estados Unidos, donde siempre encuentran cómo darle una vuelta más a la tuerca, las ligas más populares han llegado más lejos que nadie. El año pasado, la NFL, la liga de fútbol (americano), anunciaba un acuerdo con el proveedor tecnológico Zebra para instalar sensores de datos por radio-frecuencia en las hombreras de todos los jugadores y a lo largo y ancho de los estadios. El objetivo, recoger datos como velocidad, aceleración y localización de cada futbolista.

futbol-balon

De momento, esta inmensa cantidad de datos está disponible al término de cada partido para los aficionados y fans de las estadísticas. El objetivo a medio plazo: hacerlas visibles en tiempo real y sacarles un mayor beneficio económico.

El boom de data-lovers es tal que en los últimos años han surgido varias start-up que se dedican a analizar y organizar el big data para competiciones deportivas y jugadores de ligas fantasy.

Un ejemplo interesante es el de Edge Up Sports, un software diseñado sobre la tecnología Watson de IBM que genera datos de una forma diferente.

Este programa analiza miles de blogs, perfiles en redes sociales y artículos de periódicos sobre los jugadores y equipos de una determinada competición. Y presenta a los usuarios una plataforma con la que acceder, en tiempo real, a buena parte de lo que la red de redes publica sobre un determinado jugador, sus debilidades, puntos fuertes, estadísticas, evolución o condición física. Y compararlo con cualquier otro perfil.

El dinero manda

Como tantas veces desde que se abrió el universo de nuevas posibilidades de Internet, la pregunta es cómo hacer una gran idea rentable. Y en el mundo de las ligas fantasy la respuesta más inmediata es: a través de las apuestas.

Desde luego, las posibilidades de apostar pequeñas (o grandes) cantidades de dinero en estos juegos parecen infinitas. Quién correrá más, quién recuperará más balones o quién será expulsado antes. Todo, en teoría, está sujeto a una posible apuesta.

Pero, curiosamente, las casas de apuestas observan con desconfianza esta gran montaña de datos que se acumula ante su mirada.

Probablemente os acordéis del Pulpo Paul. Hasta que falleció (en circunstancias nada extrañas), este cefalópodo se dedicaba a pronosticar resultados. El mundo creía en este animal y se convirtió en el oráculo del siglo XXI. Pero falló. Fernando Torres marcaba para darle a España la Eurocopa 2008, aunque Paul había apostado por Alemania.

En el Mundial de Brasil 2014 ya no había pulpo, sino tres gigantes tecnológicos que se dedicaban a predecir resultados a través del big data: Baidu (el Google chino), Microsoft y la propia Google. El buscador de Sillicon Valley perdió la competición porque solo acertó el resultado de 14 de los últimos 15 partidos. Microsof y Baidu tuvieron una precisión del 100%. Larga vida a Paul.

Zhang Tong, director del Big Data Laba de Baidu, explica así su éxito en Techinasia.com.

La precisión depende principalmente de los datos y el modelo. Se analizaron cinco factores: la fuerza del equipo, la ventaja de campo, el rendimiento reciente, el rendimiento general en el Mundial, y las probabilidades de las casas de apuestas. Agregamos los datos de estas cinco dimensiones de una amplia variedad de fuentes de datos en Internet. Después, utilizamos un modelo de aprendizaje automático (machine learning) diseñado por nuestros científicos para hacer predicciones”.

Si predecir un resultado se vuelve tan sencillo, las apuestas básicas, y la Quiniela, perderán su razón de ser. Por eso las casas de apuestas se interesan cada vez más por las ligas fantasy, ya que las posibilidades de monetización parecen, de momento, infinitas. Y al mismo tiempo recelan del futuro.

el pulpo paul

Quizá pueda parecer un sinsentido. Tanta investigación y desarrollo para un juego online de fútbol. Seguramente existan muchos otros lugares donde tiempo y dinero estarían mejor invertidos.

Yo, de momento, solo rezo por que mis primos (con los que tengo una de estas ligas fantasy) no se conviertan en data scientist.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *