Entrar Página Discusión Historial Go to the site toolbox

Rectas de mejor ajuste en Excel

De Laplace

Contenido

[ocultar]

1 Introducción

En la mayoría de las prácticas de laboratorio se requiere el trazado de una o varias “rectas de mejor ajuste” o “rectas de mínimos cuadrados” (en nuestro contexto, ambos términos son sinónimos). En este artículo se trata de explicar de froma lo más clara posible qué son, como se calculan y sobre todo, cómo se representan gráficamente de forma correcta. Aparte de las fórmulas, explicaremos el procedimiento particularizado en el programa Excel.

2 Que es una recta de mejor ajuste

Muchas leyes físicas obedecen un comportamiento lineal, que quiere decir que una variable depende de otra como una función de primer grado. Así, por ejemplo, la ley de Hooke nos relaciona la fuerza aplicada a un muelle con la elongación de éste respecto a la posición de equilibrio)

|\vec{F}| = k(l-l_\mathrm{eq})\qquad\Rightarrow\qquad l=l_\mathrm{eq}+\frac{|\vec{F}|}{k}

Si esta fuerza la aplicamos colgando sucesivas masas, obtenemos la relación teórica entre longitud del muelle y masa colgada

l =l_\mathrm{eq} + \frac{g}{k}m

que es un caso particular de relación lineal

l = a + b m\qquad\qquad a = l_\mathrm{eq}\qquad\qquad b = \frac{g}{k}

donde a es la llamada ordenada en el origen y b es la pendiente.

Idealmente, si representamos la longitud del resorte frente a la masa obtendremos una recta cuya pendiente es b y que corta el eje de ordenadas a una altura a.

Esta es una ley teórica, que se apoya en evidencias experimentales. Esto quiere decir que si, para un muelle dado, medimos la elongación para distintas masas concretas, deberíamos obtener una serie de puntos alineados. A partir de la recta que pasa por estos puntos pondemos determinar la constante k del muelle o su longitud de equilibrio, por ejemplo.

Cuando se tienen dos puntos experimentales, existe solo una recta que pasa por ellos, por lo que con solo dos puntos seríamos capaces de hallar a y b.

Sin embargo, solo dos medidas puede ser demasiado poco. Si han salido mal, por la razón que sea, lo que se deduzca de ellas estará igualmente mal. Por ello, es preferible hacer más medidas, cuantas más mejor. De esta forma, los posibles errores se reduce, ya que si en algunos hemos medido de más, en otros se medirá de menos, y el efecto de una mala medida se amortigua.

El problema es que cuando se tienen más de dos puntos experimentales, ya no habrá una recta que pase por todos ellos, ya que nunca van a estar perfectamente alineados.

Lo que se en ese caso es buscar la “recta de mejor ajuste”, que es aquella que probablemente no pase por ninguno de los puntos experimentales, pero es la que, en promedio, pasa más cerca de todos ellos. Una vez calculada la ecuación de esta recta, podemos emplear sus coeficientes para determinar las magnitudes del problema.

3 Por qué se llama “de mínimos cuadrados”

En el contexto de las prácticas de Física usamos indistintamente los términos de “recta de mejor ajuste” y “recta de mínimos cuadrados”, aunque siendo precisos, el segundo término corresponde al método concreto que se emplea para hallar la recta de mejor ajuste (existiendo más de un método).

El principio del método es el siguiente: puesto que no podemos conseguir una recta que pase por todos los puntos experimentales, buscamos una que se la que pase más cerca de todos ellos.

Supongamos que tenemos un conjunto de datos experimentales (xi,yi) y suponemos una recta, cuya pendiente y ordenada en el origen son aun desconocidas

y = a + b x\,

Para un valor xi la diferencia entre lo que predice la recta y lo que se ha medido es el llamado residuo

\epsilon_i = y_i -(a+b x_i)\,

Un residuo puede ser positivo o negativo. Por ello, si queremos minimizar los residuos, consideramos la suma de sus cuadrados (que son siempre positivos)

\chi^2 = \sum_i\epsilon_i^2 = \sum_i(y_i-(a+bx_i))^2

El método de los mínimos cuadrados consiste entonces en hallar los valores de a y b que hacen mínima esta suma de cuadrados. De ahí el nombre del método. El resultado de esta minimización produce los resultados que se ven en las secciones siguientes.

A este método también se lo denomina "regresión lineal" (“linear regression” en inglés), razón por la que en las calculadoras se lo suele identificar como modo LR.

4 Antes de calcular: representando los puntos

4.1 Medidas experimentales

Supongamos que tenemos un resorte del cual vamos suspendiendo diferentes pesos y medimos, para cada pesa, la longitud total del muelle, empleando una regla graduada en milímetros. Obtenemos, tras una serie de medidas, la siguiente tabla:

m (\mathrm{g}) \pm 1\,\mathrm{g}\, L (\mathrm{cm})\pm 0.1\mathrm{cm}\,
50 15.6
100 15.7
200 15.9
500 16.5
1000 17.4
2000 19.4

De una tabla como esta hay que resaltar que en la cabecera hay que indicar las unidades y el error; se entiende que lo que se ponga en la cabecera se aplica a todas las celdas de la columna. Solo si las unidades o errores fueran diferentes para cada dato habría que indicarlo en cada celda

4.2 Implementación en Excel

Para hacer nuestro análisis, abrimos un fichero nuevo de Excel, en el cual introducimos los valores. Por corrección (aunque no hace falta para los cálculos; evita confusiones) añadimos una cabecera con las magnitudes y unidades.

Archivo:ejemplo-recta-datos.png

En este ejemplo, los datos de las x estarán en las celdas B3 a B8 y los de las y de la C3 a la C8. Evidentemente, en cada caso concreto la ubicación de estas celdas cambiará.

4.3 Haciendo una gráfica de los datos

Antes de hacer ningún cálculo, conviene hacer una gráfica de los datos, que refinaremos más tarde. El objeto de esta gráfica es comprobar si los puntos están más o menos alineados o si hay que descartar alguno que se salga de la tendencia.

Para ello, seleccionamos (con el ratón o los cursores) las celdas que contienen los datos y aplicamos la operación de “Insertar” y luego elegimos un gráfico del tipo "Dispersión" (o "XY"), que contiene los puntos experimentales.

Archivo:ejemplo-recta-graf-puntos.png

En este ejemplo, los límites de los ejes por defecto que aplica el programa no son los apropiados para ver con claridad si los datos están alineados. Esta es una lección permanente: hacer una gráfica no consiste en aceptar de forma acrítica los resultados de la aplicaicón. Consiste en ir fijando los parámetros adecuadamente hasta que salga la gráfica deseada.

En nuestro caso, pinchamos con el botón de la derecha del ratón en uno de los números del eje de ordenadas. Esto hace aparecer la opción "Dar formato al eje...". Dentro de esta, podemos seleccionar los límites de los ejes. Puesto que nuestros datos valen como mínimo 15.6 y como máximo 19.4 tomamos como mínimo un valor fijo de 15 y como máximo uno fijo de 20. De esta forma se ve mucho más claro.

Archivo:ejemplo-recta-graf-puntos-02.png

El resultado es que, efectivamente, parece que están alineados, y no hay ningún dato extraño, por lo que podemos continuar con los cálculos.

5 Como se calcula

5.1 Pendiente, b

Supongamos que tenemos una lista de datos en dos columnas de una hoja de Excel, que como en la figura, se encuentran en las celdas B3 a B8 (los valores de xi) y de C3 a C8 los de yi. En ese caso la pendiente de la recta de mejor ajuste se calcula con la función PENDIENTE. Escribimos en la celda correspondiente

=PENDIENTE(C3:C8;B3:B8)

donde los argumentos de la función son en primer lugar los datos de las yi y luego los de las xi. Los argumentos se separan por un punto y coma; los extremos de cada columna por dos puntos.

Archivo:ejemplo-recta-pendiente.png

En este caso la operación produce un resultado 0.001961271 (al cual luego le tendremos que hallar el error).

La pendiente es una magnitud con unidades, siendo sus dimensiones las de y divididas por las de x. En este caso sería

b = 0.001961271\frac{\mathrm{cm}}{\mathrm{g}}

5.2 Ordenada en el origen, a

La ordenada en el origen, a, se halla de manera análoga empleando en este caso la función INTERSECCION.EJE

=INTERSECCION.EJE(C3:C8;B3:B8)
Archivo:ejemplo-recta-ordenada.png

El resultado en este caso es 15.50670443 (que luego redondearemos teniendo en cuenta el error). La ordenada en el origen tiene las mismas dimensiones que “y”, que en este ejemplo es una longitud medida en centímetros, por lo que

a = 15.50670443\,\mathrm{cm}

5.3 Coeficiente de correlación, r

El tercer parámetro que caracteriza a una recta de mejor ajuste es el coeficiente de correlación. Este mide la “bondad” de la recta. Es un número adimensional comprendido entre -1 y +1. Cuanto más se acerque en valor absoluto a la unidad, mayor es el grado de alineando de los puntos (siendo |r| = 1 una recta perfecta).

En las prácticas de laboratorio de física, los comportamientos lineales son muy precisos por lo que el coeficiente de correlación está muy cerca de 1 casi siempre. En este caso, la verdadera información la obtenemos de cuánto se acerca a la unidad. Para ello, en lugar de redondearlo a partir de un cálculo de errores, lo que hacemos es conservar tantos nueves como contenga tras el punto decimal y la primera cifra que no sea un 9. Así una r = 0.992 sería una recta menos alineada que r = 0.99997, ya que la primera es de solo "dos nueves" y la segunda de "cuatro nueves".

El coeficiente de correlación se calcula de forma similar a la pendiente b y a la ordenada en el origen, a. En este caso se emplea la función COEF.DE.CORREL

=COEF.DE.CORREL(C3:C8;B3:B8)
Archivo:ejemplo-recta-correlacion.png

El resultado en este caso es 0.999883747. Aplicando la regla del redondeo particular para el coeficiente de correlación escribimos

r = 0.9998\,

5.4 Incertidumbre de la pendiente, Eb

El cálculo anterior de la pendiente hay que refinarlo calculando la incertidumbre de ésta. Esta incertidumbre se debe tanto al hecho de que cada dato es incierta (por las limitaciones propias del proceso de medida) como al hecho de que se trata de una estimación estadística. Para que fuera exacta deberíamos reunir infinitos datos.

La mejor estimación de la incertidumbre de la pendiente puede hallarse recurriendo de nuevo a un cálculo del mínimo de una función y el resultado es

E_b = \frac{2b}{r}\sqrt{\frac{1-r^2}{n-2}}

siendo b la propia pendiente, r el coeficiente de correlación y n el número de datos. vemos que cuando n tiende a infinito el error de la pendiente se anula.

Para calcular este error con Excel debemos recurrir a las funciones RAIZ(), que halla la raíz cuadrada y CONTAR(), que nos da el número de datos de la columna (sin incluir las celdas vacías).

En nuestro ejemplo, con los valores en las celdas que hemos empleado, queda

=2*E4/E8*RAIZ((1-E8^2)/(CONTAR(B3:B8)-2))

siendo E4 la casilla donde está almacenada b, y E8 donde está r. Obviamente, en otro ejemplo habrá que cambiar estas referencias por las que correspondan.

Archivo:Ejemplo-recta-error-pendiente.png

El resultado del cálculo en este caso nos da 2.99083E-05, esto es 2.99083×10-05. La incertidumbre de b tienes las mismas unidades que b, es decir

E_b = 2.99083\times 10^{-5}\frac{\mathrm{cm}}{\mathrm{g}}

5.5 Expresión de la pendiente con su incertidumbre

Si expresamos b con su incertidumbre nos queda

b = (0.001961271 \pm 0.0000299083)\frac{\mathrm{cm}}{\mathrm{g}}

Aplicamos ahora las técnicas del redondeo: colocamos el error bajo la maginitud

0.001961271
0.0000299083

Consideramos las dos primeras cifras significativas del error (29), puesto que son mayores de 25 redondeamos a una cifra

0.001961271
0.00003

Redondeamos ahora la pendiente hasta la cifra en que hemos cortado el error

0.00196
0.00003

Volvemos a escribir la pendiente con su error, ya redondeados:

b = (0.00196 \pm 0.00003)\frac{\mathrm{cm}}{\mathrm{g}}

o, en forma compacta

b = 0.00196(3)\frac{\mathrm{cm}}{\mathrm{g}}

o, en notación científica

b = 1.96(3)\times 10^{-3}\frac{\mathrm{cm}}{\mathrm{g}}

Si ahora pasamos a las magnitudes fundamentales del sistema internacional

b = 1.96(3)\times 10^{-3}\frac{\mathrm{cm}}{\mathrm{g}}\times \frac{1000\,\mathrm{g}}{1\,\mathrm{kg}}\times \frac{1\,\mathrm{m}}{100\,\mathrm{cm}} = 1.96(3)\times 10^{-2}\frac{\mathrm{m}}{\mathrm{kg}}

Por tanto, escribiremos en la celda correspondiente del formulario de prácticas

b = 1.96(3)\times 10^{-2}\frac{\mathrm{m}}{\mathrm{kg}}

o

b = 0.0196(3)\frac{\mathrm{m}}{\mathrm{kg}}

o

b = (0.0196\pm 0.00003)\frac{\mathrm{m}}{\mathrm{kg}}

Cualquiera de estas tres formas es válida, aunque por las limitaciones de espacio, es preferible la forma compacta con la incertidumbre entre paréntesis.

5.6 Incertidumbre de la ordenada, Ea

La ordenada en el origen tiene también su propia incertidumbre, causada en este caso por tres factores:

  • Por la incertidumbre de cada una de las medidas individuales
  • Por el hecho de que se trata de una estimación estadística
  • Por la incertidumbre en la pendiente. Este último factor influye en que según la pendiente sea un poco mayor o un poco menor, el punto de corte con el eje de ordenadas bajará o subirá.

La fórmula para el error en la ordenada en el origen es

E_a = E_b\sqrt{\overline{x}^2+\sigma_x^2}

donde Eb es la incertidumbre de la pendiente (que hallamos antes), \overline{x} es el valor medio de las x (que en Excel se halla con la función PROMEDIO) y \sigma_x^2 es la varianza de la población

\sigma_x = \sqrt{\frac{\sum_i (x_i-\overline{x})^2}{n}}

Esta cantidad se halla en Excel 2010 con la función VAR.P, (en Excel 2007 y anteriores con la función VAR; también funciona en Excel 2010). Con esto nos queda la orden

=F4*RAIZ(PROMEDIO(B3:B8)^2+VAR(B3:B8))

siendo F4 la celda donde está almacenada la incertidumbre de la pendiente.

Archivo:ejemplo-recta-error-ordenada.png

En nuestro ejemplo nos da un valor de 0.029579829. Teniendo en cuenta que la incertidumbre de la ordenada tiene las mismas unidades que ésta, sería

E_a = 0.029579829\,\mathrm{cm}

5.7 Expresión de la ordenada con su incertidumbre

Reuniendo el valor de a con el de su incertidumbre queda

a = (15.50670443\pm 0.029579829)\,\mathrm{cm}

Ahora corresponde redondear empleando las mismas técnicas que para cualquier otra magnitud con incertidumbre. Escribimos el valor de la magnitud y el de su incertidumbre uno bajo el otro, alineando los puntos decimales

15.50670443
 0.029579829

Consideramos las dos primeras cifras significativas de la incertidumbre (29). Al ser mayores que 25 se redondea a una sola cifra

15.50670443
 0.03

Redondeamos la magnitud hasta la última cifra del error. Puesto que la siguiente cifra (6) es mayor que 5, redondeamos hacia arriba

15.51
 0.03

Con esto nos queda el valor de la ordenada

a = (15.51\pm 0.03)\,\mathrm{cm}

En forma compacta, escribiendo la incertidumbre entre paréntesis

a = 15.51(3)\,\mathrm{cm}

Pasamos este valor a las unidades fundamentales del sistema internacional

a = 0.1551(3)\,\mathrm{m}

Esto es lo que tenemos que escribir en la casilla correspondiente del formulario. Alternativamente, podemos poner

a = (0.1551\pm 0.0003)\,\mathrm{m}

aunque por las limitaciones de espacio, es preferible la forma compacta.

5.8 Resumen de los pasos

Resumiendo, tenemos los siguientes pasos para hacer los cálculos de la recta de mejor ajuste

y = a + b x\,

a una serie de datos (xi,yi)

Archivo:Ejemplo-recta-numeros-todos.png
  1. Se almacenan los datos en una tabla de dos columnas
  2. Se hace una gráfica de los puntos experimentales, para ver si hay alguno que descartar. Si lo hubiera, se borra de la tabla.
  3. Se calcula la pendiente, b.
  4. Se calcula la ordenada en el origen, a.
  5. Se halla el coeficiente de correlación, r. Se expresa hasta el primer número que no sea un 9 tras el punto decimal.
  6. Se calcula la incertidumbre de la pendiente, Eb (que requiere conocer b y r)
  7. Se expresa la pendiente con su incertidumbre, redondeando donde sea preciso y colocando las unidades adecuadas.
  8. Se halla la incertidumbre de la ordenada, Ea (precisa de Eb)
  9. Se expresa la ordenada en el origen con su incertidumbre, redondeando donde sea preciso y colocando las unidades adecuadas.

Detalles a tener en cuenta:

  • b es la pendiente y a es la ordenada en el origen; en algunas calculadoras y textos de referencia, se usa la notación inversa, por lo que hay que tener mucho cuidado.
  • La pendiente tiene unidades, las de “y” divididas por las de “x”. Es un error muy grave escribir la pendiente sin unidades porque “es un número que da la calculadora (o Excel)”. En general, convendrá pasar a las unidades fundamentales del SI.
  • La ordenada en el origen también tiene unidades, las de “y”. También está mal el cálculo si no se ponen.
  • La regla de redondeo para r es diferente que para las otras dos cantidades.

6 Haciendo la gráfica

Herramientas:

Herramientas personales
TOOLBOX
LANGUAGES
licencia de Creative Commons
Aviso legal - Acerca de Laplace