Make your own free website on Tripod.com


 

TEMA 10 CORRELACIÓN

1-DEFINICIÓN Y CLASES

    Cuando encontramos dos variables que sin estar ligadas entre sí matemáticamente,  lo están estadísticamente,   hablamos de variables correlacionadas. Lo están matemáticamente la altura en metros y la altura en centímetros, el peso en quilos y en gramos.

    La relación altura-peso es la de dos variables correlacionadas , ya que conocida la altura de una persona no podemos decir exactamente su peso, pero lo más probable es que esté comprendido entre ciertos límites ajustados. Para un caso particular no se puede determinar sino estimar.

    No hay un único tipo de correlación. En función de la relación matemática que más se ajuste a los pares de valores de las dos series podemos hablar de correlación o regresión lineal (que estudiaremos), parabólica, exponencial, sinoidal, etc.

    Naturalmente en muchos casos no hay ni relación matemática, ni estadística.

 

2-CORRELACIÓN DE DATOS. REGRESIÓN LINEAL SIMPLE

    La regresión lineal simple es una técnica estadística que pretende determinar la función matemática lineal  (RECTA) que mejor se ajuste a la relación existente entre dos variables, una de las cuales ,"X", se supone independiente, y la otra, "Y", dependiente de la anterior.

    Toda recta viene representada por la expresión    Y = a + b X

    El problema consiste en determinar los parámetros ("a" y "b") que mejor se ajusten a los pares de valores (X,Y). Nosotros explicaremos el método de mínimos cuadrados.

wpe05138.gif (37639 bytes) La mejor recta es la  que hace que las distancias de cada par de valores a la recta sea mínima, o lo que es lo mismo

å dimínima  ,y siendo

di = Yi- Y*

en el que Yi es el obtenido por la observación y Y* el obtenido en la recta que se pretende determinar.

 

El método de mínimos cuadrados se justifica en la afirmación de que la mejor recta será aquella que haga que el cuadrado de la suma de las desviaciones sea mínimo  =

Ya que ådi2 = å(Yi - Y*)2 = å (Yi - a - b Xi)2

Para que ådi2 sea mínima debe darse que las derivadas con respecto a "a" y a "b" sea cero.

Por lo que

2 å (Yi - a - b Xi) (-1)  = 0

2 å (Yi - a - b Xi)  (- Xi ) = 0

 

Con lo que en definitiva

å Yi =    n a + b å Xi       

å Xi Yi =    a  å Xi + b å Xi2

Tenemos dos ecuaciones con dos incógnitas ("a" y "b") que podremos resolver calculando los demás elementos de las ecuaciones.

   Con lo que habremos calculado la recta de ajuste que nos permitirá realizar estimaciones de la variable dependiente en función de los valores de la independiente y también  predecir la evolución de una variable en el tiempo.

 

    Supuesto que hemos calculado la recta de ajuste y suponiendo que todos los pares de puntos están sobre la línea podríamos concluir que las dos variables presentan una correlación lineal perfecta

    -positiva si la pendiente de la recta lo es (línea creciente)

    -negativa si la pendiente de la recta lo es (línea decreciente)

 

    No obstante, muchas veces no todos los pares de valores están situados sobre la recta , en este caso hablaremos de correlación no perfecta, que podrá ser mayor o menor , positiva o negativa.

    El coeficiente de correlación lineal es una medida de la intensidad de correlación lineal. Definido entre -1 y 1 , cuando adopta el valor 1 hablamos de correlación lineal perfecta positiva , cuando adopta el valor -1 hablamos de correlación lineal perfecta negativa y cuando adopta el valor 0 de inexistencia de correlación lineal. Cuanto más se acerca a cero menos correlación lineal hay.

El coeficiente de correlación lineal se define como:

 wpe14264.gif (30290 bytes)

-Ejercicio de correlación lineal. 14 de mayo de 2002