Entrar Página Discusión Historial Go to the site toolbox

Rectas de regresión

De Laplace

(Diferencias entre revisiones)
Línea 1: Línea 1:
-
#REDIRECT [[Rectas de regresión. Introducción]]
+
==Introducción==
 +
En numerosas ocasiones no debemos determinar cuánto vale una cantidad directa o indirectamente, sino cómo depende una variable de otra.
 +
 
 +
A la hora de establecer una dependencia vamos variando una cierta magnitud <math>x</math> (a la que denominaremos ''entrada''}) en una serie de valores <math>x_i</math>. Para cada uno de estos valores medimos un valor <math>y_i</math> de una magnitud <math>y</math> (la  ''respuesta'' o ''salida''). El resultado puede tabularse en una tabla de dos columnas, y representarse gráficamente.
 +
 
 +
;Ejemplo: Supongamos que fijamos la tensión en los extremos de un cable y medimos la corriente que circula por él, obteniendo el siguiente resultado
 +
 
 +
{|class="bordeado"
 +
|-
 +
! <math>V\ (\mathrm{mV})</math>
 +
! <math>I\ (\mathrm{mA})</math>
 +
|-
 +
|  3.25
 +
| 1.40
 +
|-
 +
|  3.50
 +
| 2.93
 +
|-
 +
|  3.75
 +
| 3.28
 +
|-
 +
|  4.00
 +
| 4.30
 +
|-
 +
|  4.25
 +
| 11.92
 +
|-
 +
|  4.50
 +
| 6.65
 +
|-
 +
|  4.75
 +
| 8.57
 +
|-
 +
|  5.00
 +
| 9.56
 +
|-
 +
|  5.25
 +
| 11.58
 +
|-
 +
|  5.50
 +
| 13.61
 +
|-
 +
|  5.75
 +
| 15.64
 +
|-
 +
|}
 +
 
 +
Es evidente, de este comportamiento, que existe una relación funcional entre <math>x</math> e <math>y</math> (<math>I</math> y <math>V</math> en este caso). Ahora bien, ¿qué función representa correctamente esta conducta, una recta, una parábola, una exponencial? Y, si se trata de una parábola, ¿cuáles son los coeficientes <math>a</math>, <math>b</math>, <math>c</math> de la función <math>y=a x^2+b x +c</math>?
 +
 
 +
Además, sospechamos que el punto que se aparta mucho del resto es un error experimental y no debe ser tenido en cuenta. Sin embargo, ¿cómo
 +
podemos estar seguros de ello? Quizás la dependencia entre <math>x</math> e <math>y</math> sea muy compleja y el punto separado sea correcto.
 +
 
 +
Este tipo de problema se denomina ''ajuste de una función'' y como vemos puede ser extremadamente complicado, dependiendo del tipo de función y del número de datos y parámetros empleados para describirla.
 +
 
 +
Aquí nos limitaremos al caso más simple: el ajuste de una recta por el ''método de mínimos cuadrados''. Partimos de una serie de datos más o menos alineados y trataremos de buscar la recta que pasa más cerca de ellos.
 +
 
 +
Este tipo de ajuste es de interés en varias situaciones diferentes
 +
 
 +
# Cuando tenemos una serie de entradas y salidas, para las cuales no sabemos si existe una relación funcional, pero lo sospechamos, como en la figura anterior. En este caso, la ''bondad'' de la recta de regresión (esto es, cuánto se aproxima a los datos) nos informa de si esta relación existe o no.
 +
# Cuando tenemos un conjunto de datos, de los cuales sabemos con seguridad que deberían estar alineados y queremos emplear la recta de mejor ajuste para determinar alguna cantidad indirecta. Por ejemplo, supongamos que conocemos una serie de pares de valores de tensión <math>V</math> frente a intensidad de corriente <math>I</math> para un cable y queremos determinar la resistencia de acuerdo con la ley de Ohm, <math>V = IR</math>. En lugar de determinar una resistencia para cada dato, buscaremos la recta de mejor ajuste, cuya pendiente será la resistencia buscada.
 +
# Las rectas de mejor ajuste también pueden usarse para hallar el valor de la salida para entradas que no hayamos medido experimentalmente. Esto es lo que se conoce como [[interpolación]] si <math>x</math> se encuentra en el mismo intervalo que los datos experimentales y [[extrapolación]] si está fuera de éste.
 +
# Cuando tenemos un conjunto de datos para los cuales existe una relación funcional complicada, como la ilustrada en la figura, pero para la cual sabemos que en determinadas regiones, más o menos grandes, la conducta es aproximadamente lineal. En este caso, si nos restringimos a una de estas regiones, podemos aproximar la función por la recta de mejor ajuste, lo que simplifica los cálculos. Por supuesto, en este caso la recta de mejor ajuste dependerá de la región en que nos encontremos, por lo que deberemos ser conscientes en todo momento de los límites de validez de la aproximación que empleemos. En estas aproximaciones también podemos emplear la recta de mejor ajuste para interpolar. Sin embargo, las extrapolaciones son mucho más arriesgadas, ya que podemos salirnos de los límites de validez.
 +
 
 +
El cálculo de la recta de mínimos cuadrados es inseparable del trazado de la gráfica correspondiente.
 +
 
 +
==Antes de hacer ningún cálculo: gráfica de los puntos==
 +
Antes incluso de determinar la pendiente y la ordenada en el origen de la recta de mejor ajuste, podemos establecer si los puntos están  más o menos alineados.
 +
 
 +
Para ello, antes de hacer ningún cálculo, situamos los puntos en una gráfica, sea por ordenador o sobre papel milimetrado. Una simple inspección de su posición nos indicará si es conveniente ajustar una recta, si necesitáramos una función más complicada o si no se ve ninguna relación entre las entradas y las salidas. Igualmente en esta fase podemos descartar algún punto que se aparte excesivamente del resto. En este caso, dicho punto no se incluirá en los cálculos, aunque si debe indicarse en la gráfica. Debe rodearse por un pequeño círculo, como indicación de que no ha sido considerado.
 +
 
 +
Aplicando esto a nuestra lista de datos, eliminamos el punto <math>(1.25\,\mathrm{mV}, 11.92\,\mathrm{mA})</math>, que en lo sucesivo no será incluido en los cálculos, salvo que indiquemos lo contrario.
 +
 
 +
La nube de puntos resultantes quedaran cubiertos por una elipse (que no hay que trazar). Los puntos estarán tanto más alineados cuanto más se aproxima esta elipse a una recta, esto es, cuanto más ``estrecha'' es.
 +
 
 +
===Ejes e intervalos en una gráfica===
 +
La representación de una serie de datos deberá hacerse de forma que los puntos ocupen el máximo posible de papel. Para ello se elegirán los
 +
intervalos desde ligeramente por debajo del dato menor a un poco por encima del dato mayor. Así, para la tabla anterior, intervalos  posibles serían de 3&thinsp;mV a 6&thinsp;mV para las <math>x</math> y de 0&thinsp;mA a 16&thinsp;mA para las <math>y</math>. No importa que el origen de coordenadas quede fuera de la gráfica, ni que los intervalos de cada escala tengan diferente extensión.
 +
 
 +
Los ejes se dividirán en segmentos adecuados, de forma que haya 5 ó 6 en cada uno (en nuestro caso podrían ser de 0.5&thinsp;mV en
 +
0.5&thinsp;mV en las <math>x</math> y de 2.5&thinsp;mA en 2.5&thinsp;mA en las <math>y</math>). No obstante, debe procurarse que las escalas y sus divisiones sean &ldquo;normales&rdquo;, en cuanto a que puede dividirse una unidad en medios o en cuartos, pero no es normal dividirla en séptimos, por ejemplo.
 +
 
 +
En los extremos de los ejes se indicarán las magnitudes y las unidades en las que mide entre paréntesis, (<math>I\ (\mathrm{A})</math> y <math>V\ (\mathrm{mV}</math>) en este caso).
 +
 
 +
'''No''' hay que escribir las coordenadas de los datos, ni en los ejes ni cerca de cada punto. Esto es redundante y dificulta la observación de la gráfica.
 +
 
 +
===Ubicación===
 +
Las gráficas que se hagan, sean exclusivamente de los datos experimentales, de rectas de mínimos cuadrados, u otras solicitadas explícitamente, deben adjuntarse al final de la memoria, estando convenientemente etiquetadas.
 +
 
 +
Toda gráfica deberá ir numerada y con un título explicativo. Si hay varias curvas o rectas trazadas en la misma hoja se indicará cuál es cada una.
 +
 
 +
 
 +
[[Categoría:Prácticas de laboratorio]]

Revisión de 12:56 24 mar 2010

Contenido

1 Introducción

En numerosas ocasiones no debemos determinar cuánto vale una cantidad directa o indirectamente, sino cómo depende una variable de otra.

A la hora de establecer una dependencia vamos variando una cierta magnitud x (a la que denominaremos entrada}) en una serie de valores xi. Para cada uno de estos valores medimos un valor yi de una magnitud y (la respuesta o salida). El resultado puede tabularse en una tabla de dos columnas, y representarse gráficamente.

Ejemplo
Supongamos que fijamos la tensión en los extremos de un cable y medimos la corriente que circula por él, obteniendo el siguiente resultado
V\ (\mathrm{mV}) I\ (\mathrm{mA})
3.25 1.40
3.50 2.93
3.75 3.28
4.00 4.30
4.25 11.92
4.50 6.65
4.75 8.57
5.00 9.56
5.25 11.58
5.50 13.61
5.75 15.64

Es evidente, de este comportamiento, que existe una relación funcional entre x e y (I y V en este caso). Ahora bien, ¿qué función representa correctamente esta conducta, una recta, una parábola, una exponencial? Y, si se trata de una parábola, ¿cuáles son los coeficientes a, b, c de la función y = ax2 + bx + c?

Además, sospechamos que el punto que se aparta mucho del resto es un error experimental y no debe ser tenido en cuenta. Sin embargo, ¿cómo podemos estar seguros de ello? Quizás la dependencia entre x e y sea muy compleja y el punto separado sea correcto.

Este tipo de problema se denomina ajuste de una función y como vemos puede ser extremadamente complicado, dependiendo del tipo de función y del número de datos y parámetros empleados para describirla.

Aquí nos limitaremos al caso más simple: el ajuste de una recta por el método de mínimos cuadrados. Partimos de una serie de datos más o menos alineados y trataremos de buscar la recta que pasa más cerca de ellos.

Este tipo de ajuste es de interés en varias situaciones diferentes

  1. Cuando tenemos una serie de entradas y salidas, para las cuales no sabemos si existe una relación funcional, pero lo sospechamos, como en la figura anterior. En este caso, la bondad de la recta de regresión (esto es, cuánto se aproxima a los datos) nos informa de si esta relación existe o no.
  2. Cuando tenemos un conjunto de datos, de los cuales sabemos con seguridad que deberían estar alineados y queremos emplear la recta de mejor ajuste para determinar alguna cantidad indirecta. Por ejemplo, supongamos que conocemos una serie de pares de valores de tensión V frente a intensidad de corriente I para un cable y queremos determinar la resistencia de acuerdo con la ley de Ohm, V = IR. En lugar de determinar una resistencia para cada dato, buscaremos la recta de mejor ajuste, cuya pendiente será la resistencia buscada.
  3. Las rectas de mejor ajuste también pueden usarse para hallar el valor de la salida para entradas que no hayamos medido experimentalmente. Esto es lo que se conoce como interpolación si x se encuentra en el mismo intervalo que los datos experimentales y extrapolación si está fuera de éste.
  4. Cuando tenemos un conjunto de datos para los cuales existe una relación funcional complicada, como la ilustrada en la figura, pero para la cual sabemos que en determinadas regiones, más o menos grandes, la conducta es aproximadamente lineal. En este caso, si nos restringimos a una de estas regiones, podemos aproximar la función por la recta de mejor ajuste, lo que simplifica los cálculos. Por supuesto, en este caso la recta de mejor ajuste dependerá de la región en que nos encontremos, por lo que deberemos ser conscientes en todo momento de los límites de validez de la aproximación que empleemos. En estas aproximaciones también podemos emplear la recta de mejor ajuste para interpolar. Sin embargo, las extrapolaciones son mucho más arriesgadas, ya que podemos salirnos de los límites de validez.

El cálculo de la recta de mínimos cuadrados es inseparable del trazado de la gráfica correspondiente.

2 Antes de hacer ningún cálculo: gráfica de los puntos

Antes incluso de determinar la pendiente y la ordenada en el origen de la recta de mejor ajuste, podemos establecer si los puntos están más o menos alineados.

Para ello, antes de hacer ningún cálculo, situamos los puntos en una gráfica, sea por ordenador o sobre papel milimetrado. Una simple inspección de su posición nos indicará si es conveniente ajustar una recta, si necesitáramos una función más complicada o si no se ve ninguna relación entre las entradas y las salidas. Igualmente en esta fase podemos descartar algún punto que se aparte excesivamente del resto. En este caso, dicho punto no se incluirá en los cálculos, aunque si debe indicarse en la gráfica. Debe rodearse por un pequeño círculo, como indicación de que no ha sido considerado.

Aplicando esto a nuestra lista de datos, eliminamos el punto (1.25\,\mathrm{mV}, 11.92\,\mathrm{mA}), que en lo sucesivo no será incluido en los cálculos, salvo que indiquemos lo contrario.

La nube de puntos resultantes quedaran cubiertos por una elipse (que no hay que trazar). Los puntos estarán tanto más alineados cuanto más se aproxima esta elipse a una recta, esto es, cuanto más ``estrecha es.

2.1 Ejes e intervalos en una gráfica

La representación de una serie de datos deberá hacerse de forma que los puntos ocupen el máximo posible de papel. Para ello se elegirán los intervalos desde ligeramente por debajo del dato menor a un poco por encima del dato mayor. Así, para la tabla anterior, intervalos posibles serían de 3 mV a 6 mV para las x y de 0 mA a 16 mA para las y. No importa que el origen de coordenadas quede fuera de la gráfica, ni que los intervalos de cada escala tengan diferente extensión.

Los ejes se dividirán en segmentos adecuados, de forma que haya 5 ó 6 en cada uno (en nuestro caso podrían ser de 0.5 mV en 0.5 mV en las x y de 2.5 mA en 2.5 mA en las y). No obstante, debe procurarse que las escalas y sus divisiones sean “normales”, en cuanto a que puede dividirse una unidad en medios o en cuartos, pero no es normal dividirla en séptimos, por ejemplo.

En los extremos de los ejes se indicarán las magnitudes y las unidades en las que mide entre paréntesis, (I\ (\mathrm{A}) y V\ (\mathrm{mV}) en este caso).

No hay que escribir las coordenadas de los datos, ni en los ejes ni cerca de cada punto. Esto es redundante y dificulta la observación de la gráfica.

2.2 Ubicación

Las gráficas que se hagan, sean exclusivamente de los datos experimentales, de rectas de mínimos cuadrados, u otras solicitadas explícitamente, deben adjuntarse al final de la memoria, estando convenientemente etiquetadas.

Toda gráfica deberá ir numerada y con un título explicativo. Si hay varias curvas o rectas trazadas en la misma hoja se indicará cuál es cada una.

Herramientas:

Herramientas personales
TOOLBOX
LANGUAGES
licencia de Creative Commons
Aviso legal - Acerca de Laplace