¿Qué es un percentil?
Un percentil es una medida estadística. Se refiere al conjunto de los valores de una partición que divide la población total de una distribución, en partes iguales centesimales. De este modo el percentil 50 corresponde a la mediana de la población.
Los percentiles pertenecen a un grupo de medidas en un conjunto de datos, en este caso de medidas de posición no central: los cuantiles. Dentro de ellos tenemos los cuartiles, deciles y percentiles. La función de ellos es dar información del valor de la variable que ocupará su posición con respecto al conjunto.
- Los cuartiles dividen la distribución en 4 partes iguales por lo que existen 3 cuartiles: Q1, Q2 y Q3. El Q2 representa la mediana.
- Los deciles dividen la sucesión de datos en 10 partes iguales, siendo nueve los deciles: D1, D2,… D9. El decil D5 coincide con la mediana de la distribución.
- Los percentiles dividen los datos en 100 partes porcentualmente iguales: desde P1 hasta P99. El P50, coincide con la mediana de la distribución.
Características principales de los percentiles
Sus particularidades más destacadas son las siguientes:
- Son medidas de posición no central. Sirven para dar información sobre la posición de un dato respecto al conjunto de valores.
- Resultan de gran utilidad para agrupar grandes cantidades de valores numéricos, ya que otros cuantiles darían grupos más numerosos y complicados de interpretar.
- Marcan la posición que dejan por debajo de sí. Por ejemplo: el centil (P1) es el valor que deja por debajo al 1% de la población y por encima al 99% restante. Del mismo modo, el centil 20 expresa el valor de la variable que deja el 20% de los valores por debajo de él y el 80% por encima.
Conceptos relacionados con los percentiles
Los percentiles se encuentran ligados a los porcentajes, pero hay que dejar claro que no son lo mismo:
Los porcentajes posibilitan visualizar una cantidad como fracción entre cien partes iguales.
Los percentiles indican las posiciones que ocupan los datos respecto a una distribución.
Los percentiles son las medidas de posición más utilizadas. Los 99 percentiles que dividen la distribución de datos, indican el valor recorrido de una variable, bajo el cual se encuentra una proporción determinada de los datos. Los percentiles (P1, P2,…) muestran la variable que deja detrás una frecuencia acumulada igual al valor del percentil. Por ejemplo:
El P32, es aquel valor de la variable tal que el 32% de las observaciones toman valores inferiores o iguales a él y es superado por el 68% de los restantes.
Cálculo de percentiles
El cálculo de percentiles es un proceso relativamente sencillo, pero hay que diferenciar entre una distribución de datos agrupados o no agrupados.
Para el caso de los datos no agrupados:
Se construye la tabla de frecuencias con los datos ordenados de menor a mayor
Se calcula la columna de frecuencias absolutas acumuladas
Es el primer valor cuya frecuencia absoluta acumulada excede la cantidad:
Pk= k N100
Siendo: ? el percentil que se quiere calcula: 1, 2, 3, … , 99 y ?: el número de datos de la distribución (tamaño muestral).
Para el caso de los datos agrupados:
Se aplica una fórmula disinta:
Pk= Li + k N100 – Ni-1ni ai
En este caso, Li es el límite inferior de la clase donde se encuentra el percentil, N es la suma de las frecuencias absolutas, ni es el número de elementos de la muestra, Ni-1es la frecuencia acumulada anterior a la clase del percentil y ai es la amplitud de la clase.
¿Qué usos tienen los percentiles en climatología?
Los percentiles permiten trabajar con gran volumen de datos y precisar posiciones para los valores de una distribución. De esta manera, podemos determinar si una variable se halla dentro de los parámetros normales, por encima o por debajo de la media, así como caracterizar los extremos.
En el campo de la climatología es bastante común el cálculo de percentiles para distintas variables como la temperatura, las precipitaciones, etc. Un ejemplo muy común para el empleo de los percentiles se utiliza a la hora de decretar una ola de calor en nuestro país. Uno de los requisitos es que las temperaturas máximas deben estar por encima del percentil 95 de la serie de temperaturas máximas diarias en los meses de julio y agosto durante al menos 3 días seguidos.
Una vez calculado el percentil 95 de una serie temporal larga de datos se localizan el 5% de los días más cálidos y se toma como «temperatura umbral de ola de calor» la más baja de las máximas de dicha partición.
Inconvenientes
El percentil no es útil cuando las muestras disponen de pocos datos, dado que se obtienen grupos demasiado pequeños y, por lo tanto, es mejor optar por el cuartil o el decil.