Stata: Datenanalyse und statistische Software Brian P. Poi, StataCorp Viele Menschen haben an die technischen Mitarbeiter schriftlich über die Unterschiede zwischen Vorhersage und Anpassung geschrieben. In dieser FAQ präsentiere ich ein einfaches Beispiel mit dem Auto-Dataset. Dies ist kein Ersatz für die Referenzhandbuch-Einträge für die Einstellung oder Vorhersage. Vermutlich haben Sie diese schon gelesen. Wenn nicht, wäre das eine gute Idee. Zum Anfang, letrsquos laden Sie die auto. dta-Dataset und regress mpg gegen Gewicht. Länge. Und fremd. Als nächstes berechnen Sie die lineare Vorhersage der abhängigen Variablen und fassen sie durch rep78 zusammen. Vergleichen Sie dies mit dem, was wir erhalten, wenn wir den Anpassungsbefehl verwenden: Die Ergebnisse sind die gleichen Wenn Sie den Anpassungsbefehl ohne Angeben von Variablen verwenden, fasst er einfach die linearen Vorhersagen der Regression durch rep78 zusammen. Nehmen wir an, dass ich stattdessen den Schlüssel zum Verständnis dessen, was hier passiert ist, die beiden Zeilen an der Spitze des Ausgangs sind: Für zwei unabhängige Variablen in unserer Regression, Gewicht und Länge. Anpassung hatte nichts, was sie links, wie es ist. Bei der Berechnung der linearen Vorhersage von mpg nutzte die Anpassung jedoch nicht die tatsächlichen Werte von Fremddaten, die sich im Datensatz befinden. Stattdessen berechnete sie die Vorhersage, indem sie vorgab, dass der Wert des Auslands für jede Beobachtung in dem Datensatz 0.30434781 betrug. Einige Leute würden argumentieren, dass die Auswertung der Gleichung mit ausländischen gleich 0.304 ist Unsinn, weil fremd ist eine Dummy-Variable, die nur die Werte 0 oder 1 entweder das Auto ist fremd, oder es ist inländisch. Auf der anderen Seite könnte man die Ergebnisse mit Fremdwörtern gleich 0,304 in Bezug auf ein Auto, das 70 inländische Teile und 30 ausländische Teile enthält interpretieren. Ob eine Dummy-Variable erzwungen werden muss, um 0 oder 1 zu bleiben, wenn Vorhersagen gebildet werden, hängt vollständig vom Kontext des Modells ab. Die wirkliche Leistung der Anpassung ist in der Lage, Vorhersagen zu erstellen, die bestimmte Werte für einige der unabhängigen Variablen annehmen. Angenommen, ich wollte wissen, die durchschnittliche prognostizierte Kraftstoffverbrauch von Autos von rep78 unter der Annahme, dass alle Autos inländischen sind. Mit Einstellung. Dies ist einfach zu tun: Natürlich können Sie mehr als eine Variable mit einstellen. Und Sie können einige Variablen auf Werte, die Sie angeben, und andere Variablen auf ihre Mittel gesetzt haben. Zum Beispiel, jetzt möchte ich wissen, die durchschnittliche Kraftstoffverbrauch durch rep78 unter den Annahmen, dass alle Autos sind inländischen und alle Autos sind von der gleichen (durchschnittlichen) Länge. Ich habe keine Ahnung, was die durchschnittliche Länge der Autos ist, so dass ich lassen Sie einstellen Abbildung es aus: Wie die Spitze der Ausgabe zeigt, stellen Sie die eingestellte Länge gleich ihrem Mittelwert von 188.28986, und es setzt fremd gleich 0, wie wir Beantragt. Weil wir die Ergebnisse aufgrund von rep78 tabelliert haben. Der Mittelwert der Länge wurde unter Verwendung nur der 69 Beobachtungen berechnet, für die rep78 nicht fehlt. Die 5 Beobachtungen mit fehlender rep78 werden komplett ignoriert. Obwohl sie in der ursprünglichen Regression verwendet wurden. In der Tat, Anpassung ist wirklich nur ein Front-End für die Vorhersage. Und es ist hilfreich, durch die Mechanik eines Beispiels zu arbeiten, um dies zu illustrieren. Die vorherige Tabelle der Ergebnisse könnte in der folgenden Weise erhalten werden: Der Vorteil der Anpassung ist, dass wir nicht haben, um unsere Daten zu erhalten, zusammenzufassen und zu ersetzen, und rufen Sie dann tabstat uns. Predicted Value Y-Hat Y-Hat () Ist das Symbol, das die vorhergesagte Gleichung für eine Linie der besten Übereinstimmung in der linearen Regression darstellt. Die Gleichung nimmt die Form an, wobei b die Steigung und a das y-Intercept ist. Es wird verwendet, um zwischen den vorhergesagten (oder angepassten) Daten und den beobachteten Daten y zu unterscheiden. Y-Hut wird auch bei der Berechnung der Residuen verwendet. Die die vertikalen Unterschiede zwischen den beobachteten und eingepassten Werten sind. Die Matrix der Werte, die die beobachteten und eingepassten Werte betreffen, wird als Hutmatrix (H) bezeichnet, da sie einen Hut auf y setzt. . Lektion über den vorhergesagten Wert Y-Hut Voraussichtlicher Wert Y-Hut Statistik und Wahrscheinlichkeit Chegg Tutoren Benötigen Sie mehr Hilfe Verständnis vorhergesagter Wert y-hat Weve haben Sie mit unserer Online-Studie Tools QA im Zusammenhang mit Predicted Value Y-Hut Experten Antwort in so wenig wie 30 Minuten Saftmanu g werden in der Tabelle nar angezeigt, alle Schüler auf p. 102. Angenommen, ein Hersteller möchte den Namen jeder o einfachen linearen Regression verwenden, um die Süße und die Resonanz (y) aus der Menge des Pektins (x) vorherzusagen. Kapitel 3 Einfache lineare Regression I40 (mit ausgewählten Beobachtungen in der Tabelle o der vorherigen Seite.). Man betrachte eine lineare lineare Regressionsanalyse der Daten. Interpretieren Sie die Ergebnisse. 3.6. Zwischen den SET-Werten von 0,68. RMP und (a) Geben Sie die Gleichung eines linearen Modells an (b) Geben Sie eine praktische Interpretation des Wertes .68 (c) Ist die geschätzte Steigung der Linie, Teil a, Positiv oder Negativ E. n: n Limitierende Verteilung von In einer Zufallsstichprobe Xi Yn ausgewählt aus Verteilung mit Cdf X 7 CD o Ansonsten
No comments:
Post a Comment