Estadísticas en el PSI. Para estómagos duros. (por Arifán)
Foro A Galopar & Turfinternet, 20/11/2006

Hola,
hace poco he enviado a alguien el siguiente archivo que escribí hace tiempo. Es un tostón estadístico pero a lo mejor a alguien le interesa así que lo cuelgo. El archivo original estaba en word, así que no sé cómo quedarán representadas las tablas una vez insertado el mensaje. Ahí va:

Estadísticas en el PSI

EL AVERAGE EARNING INDEX

AEI: Average earning index. Comenzado por Joe Estes en EEUU. Durante muchos años fue el criterio principal para determinar la capacidad de un semental. Representa la media de ganancias de sus hijos con respecto a la media de ganancias de los productos en el país en el que corren. Por poner un ejemplo. En el 2004 corrieron 12 hijos de Don Roberto. Ganaron sus hijos 45.000 euros en carreras y por tanto la media de los don roberto fue de 3750 eur/producto. Ese año las ganancias medias de los productos que corrieron en España fueron de 3354 euros. Por tanto el AEI de Don Roberto en el 2004 fue de 3750/3354= 1,12. Dicho de otra forma, sus productos ganaron un 12% más que la media.

Esto sirve para calcular el AEI de un semental en un año. El valor que merece la pena es el AEI acumulado a lo largo de los años. Se puede calcular de dos formas, una basta y otra mejor:

   - Basta: Coges los AEIs del semental cada año y los divides por el número de años que se han analizado. Es muy basto, pues sólo funciona si todos los años corren más o menos el mismo número de productos.
   - Mejor: Ponderando el AEI de cada año con el número de productos suyos que han corrido en ese año. Por poner un ejemplo simple y no real. Imaginemos que en el 2003 corrieron 6 hijos de Don Roberto y su AEI fue de 2. En este caso su AEI acumulado se calcularía: (2x6+1,12X12)/18. Así das más peso al valor obtenido en el año que han corrido más hijos suyos.

En un país en el que la media de ganancias es bastante constante, se puede hacer de una forma mucho más sencilla, pues sacas la media de todos los productos de un semental y lo divides entre esas ganancias medias estables. Eso no pasa en España, y las ganancias medias por caballo han crecido bastante en los últimos años.

Si se quiere ya hilar fino, conviene separar a los dos años del resto y calcular por separado el AEI de los sementales de dos años y tres o mayores. Por ejemplo en España en el 2004, anduvo un poco por encima de los 2000 euros/producto. Ese año Limpid sólo tenía dos años, y por tanto sería no real comparar su AEI con el de los sementales que ya tenían caballos viejos en pista, pues la media nacional de ganancias por producto era bien diferente entre los viejos y los dos años. En este caso, para consolidar el AEI total del semental se calculan por separado el AEI tres o más y el AEI dos años. Después se pondera entre el número de caballos igual que antes.

Existe una dificultad añadida a este factor y es los hijos de un semental que corren en dos países diferentes como pueden ser España y Francia. Por ejemplo en el caso de Limpid, analizar su descendencia sin tener en cuenta a Negralejo no es real. En este caso se hace lo siguiente. Se cogen las actuaciones del caballo en ambos países. Por ejemplo imaginemos un caballo que corre dos en Francia y 8 en España. En Francia la media de ganancias en el 2005 fue de 12570 euros, mientras que en España fue de 4200 euros. Si la mayoría de los productos de un semental han corrido en España, la media de ganancias con la que comparar la media de sus productos es la española. Para sacar las ganancias de ese caballo con respecto a la media se hace lo siguiente: Ganancias del caballo dividido entre ((2x12570+8x4200)/10). Después, para trasladarlo a las estadísticas del semental, se coge el ratio resultante y se pondera entre el número de caballos. Es un método muy tedioso y existe otra forma un poco más rápida. Se cogen a los caballos que hayan corrido en dos países y se hace lo siguiente: En el ejemplo que hemos puesto supongamos que el hijo del semental ha ganado 10000 euros en Francia. Se minoran esos 10.000 euros con el ratio resultante de dividir 4200/12570. Así todas las ganancias del caballo están en una base común, que es la media de ganancias de los caballos en España. Es más rápido y más fácil, aunque no evita el tener que ir uno a uno con los hijos que hayan corrido en dos países. Lo que hacen los ingleses es simplemente despreciar a los caballos que no corren en las islas.

Puntos fuertes del AEI

   - Permite comparaciones entre países
   - Da los resultados de un semental con respecto a la media

Puntos débiles

   - Muy gordo: No tiene en cuenta la calidad de las yeguas que cubre un semental
   - Si un semental ha tenido poca producción y uno de sus hijos ha destacado mucho, tendrá un falso AEI y será muy elevado. Esto se puede corregir calculando la mediana de las ganancias de los hijos de un semental o simplemente eliminando al caballo en cuestión del cálculo (existe luego tampoco es bueno eliminarlo).

EL COMPARABLE INDEX

Los americanos tienen pasión por las estadísticas y se dieron cuenta de que el AEI no aporta la información necesaria para valorar las actuaciones de un semental. Así, inventaron el CI. El comparable index mide la media de las ganancias de los productos de las yeguas que cubre un determinado semental, cuando esas yeguas han sido cubiertas por otros sementales, con respecto a la media de ganancias del país en el que corren.

Dicho de otra forma el CI es el AEI medio de las yeguas que cubre un semental cuando han sido cubiertas por otros. Por poner un ejemplo:

Esta tabla pertenece al cálculo que hice para Alexandrovich en su AEI y CI acumulado hasta el 2004. He seleccionado dos madres que han tenido productos por Alexandrovich; Bala y Believe me Not. Si te fijas, para cada yegua cojo cada uno de sus productos que no son por alexandrovich y enfrento sus ganancias totales, con la suma de las ganancias medias en España en los años que corrió. Al final, tienes el total de ganancias de sus hijos cuando ha sido cubierta con otros sementales y el total de ganancias medias de España en los años que corrieron cada uno de sus hijos. Así, sacas el AEI de la yegua. En el caso de Bala, podemos ver que es una gran madre cuyos hijos ganaban de media un 76% más que la media.

Después coges los productos de todas las yeguas que ha cubierto Alexandrovich y sacas la siguiente tabla:

Producto

Año

Padre

Año competición

Ganancias

Ganancias medias en sus años de competición

Alodio

2002

Villa d'este

04

800

2208

Baleira

1994

Bass

96-98

3546

7487

Bali

1986

Barilone

89-91

15250

8700

Batu

1993

Bass

95-97

59610

9614

Belesar

1996

Dernier Rivage

98-00

11109

7248

Black Princess

2001

Villa d'este

03-04

2330

5540

Brigadier

1990

Barilone

92-94

18361

10630

Bubal

1997

Dernier Rivage

00-04

18282

16586

Carlota Junior

1994

Vichisky

96-97

2404

4224

Celta

1997

Bass

99-00

0

5137

Chantadina

1989

Mr. Crum

91-93

4778

9329

Concello

1990

Skycolt

92-96

21584

18206

Cor Neyer

1989

Neyeef

91-92

1022

5825

Devesa

1995

Vichisky

98-99

6671

4580

Dracma

1996

Bass

98-01

11088

10588

Eiroa

1998

Dernier Rivage

01-02

0

7117

El Ya

1995

Bass

98-01

20279

10588

Escrimachi

1993

Villa d'este

95-99

18390

9700

Fion

1997

Bass

00-03

25021

9892

Imanol

1988

Charlie Bubles

90-92

15295

8725

Neskazaharra

1995

Villa d'este

98

0

2111

Nogueira

1992

New Kingdom

94-95

0

8439

Nuxilde

1992

Vichisky

94-95

720

8439

Oleiros

1996

Bass

99-01

4327

5137

Pelegrin

1990

Barilone

92-95

24100

14868

Plaza Roja

2001

Villa d'este

03-04

1200

5540

Pompadour

1995

Bass

97-00

34257

9286

Ribada

2002

Villa d'este

04

0

2208

Ribeira

1993

Bass

95-98

19893

9614

Risueño

1988

Barilone

90-91

240

5800

Shadowfax

2001

Villa d'este

03-04

240

5540

Soka

1992

Mighty Flute

94

0

2581

Sr. Torres

1992

Skycolt

95-96

6791

7576

Tablada

1994

Dernier Rivage

97

0

2038

Veiga

1991

New Kingdom

93-95

6731

11943

Viana

1991

Magic Flute

93-94

120

7705

Vilaseco

1991

Skycolt

93-94-95

4568

10966

Xeada

1993

Manjam

95-96

2404

6226

Xunqueira

1991

Carral

93-95

5289

10966

 

 

 

 

366700

308907

 

 

 

 

 

1,19

Así, se obtiene que las yeguas que ha cubierto Alexandrovich, de media han dado productos que ganan un 19% que la media de los corredores en España.

Aprovecho para comentar la potencia de este factor. Alexandrovich tenía a final de 2004 un AEI acumulado de 0,77, es decir que sus productos ganaban de media un 23% menos que la media de los corredores en España. Este AEI en contra de lo que parece es bueno, ya que los caballos nacionales ganan de media un 50% menos (depende del año) que la media de corredores en España. Hay que tener en cuenta que hay muchos caballos importados en España que son mejores en general que los que criamos aquí. Pero realmente las estadísticas de Alexandrovich son realmente malas, ya que empeora las yeguas que cubre. AEI/CI= 0.64. Dicho de otra forma, los productos de las yeguas que ha cubierto han ganado un 36% menos cuando han visitado a Alexandrovich.

Se dan los mismos casos que con el AEI en cuanto a dos años y a caballos que corren en distintos países. El procedimiento de corrección es el mismo.

IMPORTANTE

El binomio AEI CI es el mejor parámetro que existe para calcular la habilidad de un semental. Sólo deja de ser efectivo con muy pocos caballos en pista y con un supercrack entre su progenie. En EEUU se puede comprar esta información. En Europa se cuidan de darla porque si lo hicieran, muchos sementales comerciales caerían en picado.

El AEI sin el CI no dice nada de nada.

Si quieren calcular de alguna forma el mérito genético de un semental esta es la mejor. Tras muchos años de búsqueda en EEUU, son los dos parámetros que más se usan y no creo que los americanos sean tontos.

INDICADORES VARIOS

Los valores más frecuentes que se suelen encontrar en las webs y estadísticas del sector son los siguientes:

   - Ganancias medias por producto: Es la versión anterior al AEI. No vale para nada si no se conocen las ganancias medias de los corredores en ese país.
   - % de ganadores. Sin conocer las yeguas que ha cubierto un semental no es muy orientativo aunque si ayuda a ver que algunos sementales dan muchos ganadores.
   - % de ganadores de Stakes: Es el % de ganadores de Listed o Grupo. Es un criterio de comparación muy utilizado, pero que en mi opinión sólo sirve para establecer comparaciones entre los sementales top, que reciben la misma calidad de yeguas.
   - Timeform medio: Es una variante de ganancias medias por producto. Representa la media del valor asignado a los hijos de un determinado semental.
   - MOR. Alguna vez leerán estas siglas. Quiere decir Mother Other Runners. Es una variante del CI.
   - GSW: Me lo preguntaste. Quiere decir Graded Stakes Winners o en castellano ganadores de grupo. Se suele presentar en número total o en % sobre los foals. Repito lo dicho en % de ganadores de Stakes.

EL DOSAGE

Por la charla vi que ya habían investigado el tema del dosage. Hago simplemente una breve descripción:

El dosage se basa en que hay una serie de caballos absolutamente dominantes (jefes de raza) que determinan la evolución del PSI. Cada uno de esos caballos transmite una de las siguientes cualidades (algunos más de una):

   - Brillante
   - Intermedio
   - Clásico
   - Duro/Distancia
   - Profesional (Stayer)
De arriba hacia debajo de más velocidad a más Stamina.

En función de la generación donde se encuentre el jefe de raza, se le da más o menos puntuación. El sistema supone que los padres aportan el 50% del producto, los abuelos el 25%, los bisabuelos el 12,5% y así sucesivamente. Siempre se ha calculado para 4 generaciones, aunque en algunos programas calculan hasta la quinta. A cada generación se le asigna un 16 puntos, de forma que el padre si es jefe de raza aportará 16 puntos, cada abuelo 8, cada bisabuelo 4 etc….Siempre y cuando sean jefes de raza.
Así llegas a lo que se llama el perfil de dosage de un caballo:

En el ejemplo, el caballo anterior tiene más influencia de velocidad que otra cosa. Para determinar el ratio entre velocidad y stamina, se utiliza el DI (Dosage index). Para calcular el DI, se divide el perfil en dos grupos:

  - Velocidad= puntos Brilliant+puntos intermediate+1/2 puntos clasic
  - Stamina= puntos Proefesional+puntos Stout+1/2 puntos clasic

En el ejemplo: DI= (10+6+4)/(2+4+4)= 2

Este valor se ha asociado históricamente a la forma de correr del caballo. DI alto igual a caballo con punta de velocidad.

El segundo valor que se estudia es el centro de distribución del caballo. En teoría determina si el caballo va a ser más fondista o más sprinter. Se calcula de la siguiente forma: Se asigna a cada característica un valor. A Brillante 2, a Intermedio 1 a classic 0, a Stout -1 y a professional -2. Se multiplican estos factores por el valor en cada casilla y se dividen entre el total de puntos.

En el ejemplo: CD= ((2x10+6-4-2x2)/30)=0,6

Se supone que cuanto mayor es el valor, menos distancia tiene el caballo. Si es negativo estamos ante un stayer.

Existen tablas que relacionan cada DI y CD con la media de las distancias de los productos que tienen un DI y CD equivalente.

En mi opinión el dosage sirve para poco, si acaso en aquellos caballos con un número de puntos muy elevado para determinar su distancia más adecuada. El sistema tiene muchas goteras:

   - Caballos con pocos puntos de dosage quedan indeterminados
   - Hay sementales que por su excepcional performance en carreras o en el stud han sido determinados como jefes de raza. Luego resulta que no marcaban nada a las madres y lo que se hizo fue asignarles dos casillas de factores. Así te encuentras con caballos que aportan la mitad brillante y la otra mitad clásico.
   - Hay sementales que no son jefes de raza que marcan mucho. Esos no aparecen en el dosage
   - La selección de jefes de raza es dudosa

Saludos.