Modèle de régression simple

Les autres valeurs affichées sont S, R-SQ (adj), PRESS et R-SQ (Pred). Ces valeurs mesurent différents aspects de l`adéquation du modèle de régression. Par exemple, la valeur de S est la racine carrée de l`erreur moyenne carrée, et représente l`erreur standard du modèle. Une valeur inférieure de S indique un modèle de meilleur ajustement. Les valeurs de S, R-SQ et R-SQ (adj) indiquent à quel point le modèle correspond bien aux données observées. Les valeurs de PRESS et de R-SQ (Pred) sont des indicateurs de la façon dont le modèle de régression prédit de nouvelles observations. Les R-SQ (adj), PRESS et R-SQ (Pred) sont expliqués dans l`analyse de régression linéaire multiple. Si un intervalle de confiance doit être obtenu sur, alors cet intervalle devrait inclure à la fois l`erreur du modèle ajusté et l`erreur associée aux observations ultérieures. Cela est dû au fait que représente l`estimation d`une valeur qui n`a pas été utilisée pour obtenir le modèle de régression. L`intervalle de confiance est appelé l`intervalle de prédiction. Un intervalle de prédiction de 100 () pour cent sur une nouvelle observation est obtenu comme suit: parfois, il est approprié de forcer la ligne de régression à traverser l`origine, car x et y sont supposés être proportionnels. Pour le modèle sans le terme d`interception, y = βx, l`estimateur OLS pour β simplifie il peut vous surprendre, mais les calculs présentés dans cette section sont sans hypothèse. Bien sûr, si la relation entre X et Y n`était pas linéaire, une fonction de forme différente pourrait mieux adapter les données.

Les statistiques inférentielles dans la régression reposent sur plusieurs hypothèses, et ces hypothèses sont présentées dans une section ultérieure de ce chapitre. Une ligne de régression peut afficher une relation linéaire positive, une relation linéaire négative ou aucune relation. Si la ligne tracée dans une régression linéaire simple est plate (pas inclinée), il n`y a aucune relation entre les deux variables. Si la ligne de régression descend vers le haut avec l`extrémité inférieure de la ligne à l`intersection y (axe) du graphe, et l`extrémité supérieure de la ligne s`étendant vers le haut dans le champ de graphe, loin de l`intersection x (axe) une relation linéaire positive existe. Si la ligne de régression descend vers le bas avec l`extrémité supérieure de la ligne à l`intersection y (axe) du graphe, et l`extrémité inférieure de la ligne s`étendant vers le bas dans le champ du graphe, vers l`intersection x (axe) une relation linéaire négative existe.