Mathe/Statistik Help [de]

Kann mir jemand erklären, was Regressionsgerade, Kovarianz & Korrelation und deren Matrizen, sowie Normalapproximation sind, tun und wie man die anwendet?
Oder einfach irgendnen Link reinklatschen, wo das ausführlich/anschaulich/verständlich erklärt wird?
Comments
56
Da geb ich die Wörter ein, versteh auf der ersten Seite nur Bahnhof und bin frustriert.
Parent
sry kann da auch nicht helfen..in mathe hatte ich nur 5en und habs gehasst wie die pest
Parent
gl ... ;)
Studierst du Psychologie oder warum musst du dich mit Statistiken auskennen?^^
Ich würde dir ja gern helfen aber Mathe war nie meine Stärke und wird es nie sein :x (seit der 7ten Klasse 4- bis 5+ bis zum Ende)
sowas lernt man sogar in manchen ausbildungen bzw standartabweichungen und blabla darüber gibs dann tolle prüfungsaufgaben. ich habs in den letzten 3wochen meiner ausbildung versucht zu erlenen aber unser lehrer war dumm wie brot keiner hat es verstanden und 3wochen später hatten wir dann theoretische abschlussprüfung und dann mach die aufgaben erst ma ...
Parent
*Geographie
In der Schule konnt ich Mathe noch :s
Parent
Regressionsgerade ist quasi eine Näherungsgerade,wird meist verwendet,wenn du Messwerte hast,die nicht auf einer Geraden liegen.Die gebildete Regressionsgerade ist die "beste" Näherung,da die Punkte zu dieser Geraden den minimalsten Abstand haben.

Kovarianz würd ich dir den Wikipediaartikel nahelegen,der scheint nicht schlecht zu sein (hab ihn aber nur überflogen).

Korrelation verwendet man (meines Wissensstandes nach) nicht,die kann man beobachten und interpretieren.Auch hier hat mir der Wikiartikel geholfen. Korrelation ist oft in Systemen mehrere Variablen zu finden, allerdings bedeutet eine Korrelation nicht, dass die Variablen sich gegenseitig beeinflussen.

Matrizen machen wir erst noch und das letzte hab ich noch nie gehört.

Ansonsten Unibib =)
Ich bedanke mich! Unibib is leider schlecht, weil ich morgen schon schreib..aber für die Nachholklausur muss ich dann auf jeden Fall mal rein, sofern ich morgen nicht extremst lucke.
Parent
GL auf jeden Fall,vllt hilfts dir ja moin^^
Parent
was sind Polynome?
Parent
Eine Summe beliebig vielfacher Potenzen der selben Variablen (zB: a+b*x+c*x^2+d*x^3+e*x^4+...+z*x^n)
oder

kleine blassgrüne Gnome aus Polen,spezialisiert darauf, WoW-Gold zu klauene.
Parent
die zweite Version wird mir im Leben weiterhelfen.
Parent
die Summe soll endlich sein, sonst hat man eine Reihe :)
Parent
i can, if you make a post in english :)
What is regression line, covariance & correlation + their matrix and the normalapproximation(?), what can i do with those and how to use them?
Parent
lol, you are expecting us to teach u this in a few minutes :P?
this shit is easy but i cant teach u in english in a few minutes, sorry

ask your teacher
Parent
expected comment.
Parent
exam tomorrow + "teachers" in uni don't care about sudents

I'm a fast learner, the explanation i have doesn't explain shit though.
Parent
ask rize he is a pro in math.
lol, also wer das nicht weiß... xDDD
Erklären oder shush!
Parent
würd ich gern, aber bei mathe kamen wir über die grundrechenarten nie hinaus, und ich verstehe um ehrlich zu sein nur bahnhof :[

aber das kleine einmaleins kann ich ganz gut, wenn du da mal hilfe brauchst, einfach ne pm ;D
Parent
:P Nicht schlecht, für dein Alter..
Parent
hmm, in der reihenfolge:

korrelation: Wenn zwei Datensätze bzw die Variablen die diese Datensätze in einem mathematischen Modell wiedergeben nicht unabhängig voneinander sind. Unabhängig nicht in dem Sinne, dass der eine Datensatz vom anderen abhängt (als funktion oder so), sondern in dem Sinne, dass einfach ein gegenseitiger (nicht zwingend kausaler) Einfluss besteht.

kovarianz ist eine statistische größe, die ein maß für die korrelation darstellt.

regressionsgerade? ftw, zu meiner zeit nannte man das noch schlicht ausgleichsgerade ;c also einfach eine gerade durch alle (mess)punkte, so dass der summierte Abstand zwischen Punkten und Gerade minimal ist.

Normalapproximation: Man muss auch nicht alles wisse ;D

PS: alles nur ansichten eines physikers! korrelationen gibt es in vielen wissenschaften und fast jeder meint damit was andres ;P
Vielen Dank, du Pro! Ich werd versuchen, das mal auf die Aufgaben anzuwenden, wenn ich dann demnächst bei dem Themenbereich angekommen bin..
Hast du irgendne Seite, wo sowas detailliert beschrieben wird, weil ich mal annehme, dass du später bei eventuellen Rückfragen nicht mehr on bist ;)
Parent
hm, ne, ne seite wüsst ich nun net, nur ne ganze menge schlauer bücher :D haben wir uns net im xfire? also heut abend bin ich bestimmt wieder on und stehe gerne für fragen zur Verfügung, kann nur nicht versprechen, dass ich auf alles ne antwort weiß :D bin ja auch nur physiker und kein mathematiker ^^
Parent
oke
Glaube nur bei meiner alten xfire-ID, wo ich das Pw nichtmehr weiß..
->n1con oder #187.et
Parent
ich adde dich einfach heut abend ma und wenn denne noch fragen sind will ich gerne versuchen zu helfen :>
Parent
Orite, vll reichts ja auch schon..
Parent
nachm abi im letzten sommer hab ich nichts mehr mit mathe am hut :P sry
Könnte versuchen dir alles zu erklären, ist aber schwer via internet, les dich einfach mal bei wikipedia in die Sachen ein, sind teils gute Sachen dabei.
wie schon oben erklärt wurde, stellt eine Regressionsgerade (in diesem Fall lineare Regression) die beste lineare Annäherung an eine Punktwolke dar. Mit "beste" ist gemeint, dass die Summe der quadrierten Residuen (Abstände zwischen empirischen und Schätzwerten) minimal ist. Man kan beweisen, dass der OLS-Schätzer die beste Approximation liefert, also die Koeffizienten der "besten" linearen Funktion bestimmt.

imo wiki erklärt das Thema ziemlich gut.

Die Kovarianz bzw Korrelation geben ein Mass für einen linearen Zusammenhang zwischen zwei Variablen an

Mit Matrizen meinst du anscheinend Kovarianzmatrizen (ist bloss eine Zusammenfassung aller Kovarianzen zwischen den einzelnen Komponenten der Zufallsvektoren); mit der Normalapproximation meinst du vielleicht den n-dimensionalen Zentralen Grenzwertsatz, oder? Dieser ist nichts anderes als ein 1-dim. zentraler Grenzwertsatz, und besagt, dass die standardisierte Folge von Summen von ZVen asymptotisch gegen die Normalverteilung konvergieren.
1. Danke :), so langsam fang ich an, zu verstehen was das sein soll, aber mit den ganzen Zusammenhängen bzgl. der Verwendung in Aufgaben läufts noch nicht so ganz...
2. Mit Normalapproximation müsste bei mir sowas wie die Normalverteilung sein (also mehr oder weniger ein Histogramm mit unendlich vielen Versuchen/Wiederholungen)...Wobei ich denke, dass es zw. den beiden doch eigentlich nen Unterschied geben müsste?
Parent
1. wir haben die Zusammenhänge nie vertieft betrachtet, sondern bloss ausgerechnet im Sinne von "berechnen sie die Kovarianz blabla" und das wars dann auch schon. Ich denke, mehr wird da auch nicht gefragt.

2. Ich weiss nicht ob ich dich richtig verstehe: Asympototisch bedeutet, dass man das Ergebnis für sehr grosses n betrachtet, also nach sehr vielen Versuchen. IM ZGS geht es darum, dass die standardisierte Summe (Zuvallsvariable) für grosses n normalverteilt ist. Die Konvergenz gegen die Normalverteilung findest du übrigens nicht nur im ZGS, sondern auch in lokalen Konvergenzsätzen, wie zb Poisson-oder Binomialapproximation.
Parent
Der Erinnerung nach schon etwas anders, aber ich bin noch bei der Korrelation momentan..Werd ich dann sehn, müsste glaub das nächste Thema sein.

Hört sich so an, wie ich auch meinte..Möglicherweise ist der Unterschied auch nicht weiter relevant..
Parent
Summe der quadrierten Residuen :D sry, ich musste darauf noch ma replyen :D Ne ma im Ernst, wenn mein Prof ma wieder Fehlerquadratsumme sagt, sage ich: ne das heißt Summe der quadrierten Residuen :DDD
Parent
vielleicht ist es seine Art, sich kürzer auszudrücken :)
Parent
ich glaube eher bequemlichkeit ^^ hast du/studierst du informatik btw?
Parent
ne, ich studiere Mathe mit Schwerpunkt Statistik :)
Parent
Könnte versuchen dir alles zu erklären, ist aber schwer via internet, les dich einfach mal bei wikipedia in die Sachen ein, sind teils gute Sachen dabei.
Stimme den anderen weitestgehend zu ,

Kovarianz = cxy , falls > 0 -> gleichläufig korreliert ( linear steigend )
=0 -> kein linearer Zusammenhang
< 0 -> gegenläufiger Zusammenhang ( linear fallend )

Alle diese Maßzahlen beziehen sich auf den Zusammenhang mehrere Merkmale X und Y ..
dabei gibt die Kovarianz die Art des Zusammenhangs wieder ( s.o.)
Durch die regressionsgerade siehste dann auch die graphische darstellung und auch die stärke des zusammenhangs, dazu musst du aber zunächst den regressionskoeffizienten berechnen.
meistens ist alles von der skalierung der merkmale abhängig, danach entscheidest du was du berechnest ( zB nominal,ordinal,kardinal & diskret bzw. stetig )
cxy heißt? :o
Parent
Kovarianz des Merkmals x und y ( zusammenhang beider merkmale)

ist einfach das "zeichen" der kovarianz , wobei x und y im index stehen ,konntes nur hier schlecht als index setzen
Parent
Ahh, cov(x,y) bei uns.. Werds mir in den Aufgaben mal genauer anschauen, sobald ich die Korrelationskoeffizienzaufgaben durch hab..
Parent
jep , ist das selbe :)
Parent
Wie berechnet man die denn? :o
Hab hier in meinem Skript:

cov(x,y)=Mittel von ((x-Mittel der x)*(y-Mittel der y))

sowie falls x!=y: cov(x,y)= r*SD(x)*SD(y) und wieder was anderes für x=y


ABER 1. versteh ich die erste Formel nicht: Ich hab doch mehrere x-Werte und nicht nur einen und wie soll ich das Mittel von einem Produkt nehmen? und 2. ist die erste Formel doch auch für x!=y oder nicht?

Ich will weinen:<
Parent
im Normalfall ist die Kovarianz zwischen zwei Zuvallsvariablen (dh eindimensionalen) definiert als Cov(X,Y)=E(X-EX)*(Y-EY) = eine reelle Zahl. Wenn man die Zufallsvariablen nicht kennt, sonder bloss eine Menge von Realisierungen von Zufallsvariablen gegeben ist, so berechnet man im Normalfall die empirische Kovarianz, indem man für den Erwartungswert E den Mittelwert (als der beste erwartungstreue Schätzer) einsetzt, das bedeutet, diese lässt sich berechnet genau wie du es oben angegeben hast.
Zb du hast 10 x- und y-Werte (paarweise), so ist die empirische Kovarianz gleich:

Cov(x,y)=1/10*(Summe...

Die SUmme bildest du von i = 1 bis 10 und in den Klammern setzt du alle xi- und yi-Werte ein, wobei "Mittel der x" genau das Mittelwert aller xi-Werte angibt.

In Fall von Zufallsvektoren X,Y (dh mehrdimensionaler Fall) bildest du eine Kovarianzmatrix, indem du die Kovarianzen Komponentenweise berechnest und dann zu einer Matrix zusammenfasst. Zb wenn X=(X1,X2) und Y=(Y1,Y2,Y2), so ist die Kovarianzmatrix eine 2x3-Matrix, welche aus einzelnen Kovarianzen zwischen den einzelnen Komponenten von Zufallsvektoren zusammengefasst ist.
Parent
QuoteZb du hast 10 x- und y-Werte (paarweise), so ist die empirische Kovarianz gleich:

Cov(x,y)=1/10*(Summe...

Die SUmme bildest du von i = 1 bis 10 und in den Klammern setzt du alle xi- und yi-Werte ein, wobei "Mittel der x" genau das Mittelwert aller xi-Werte angibt.

In Fall von Zufallsvektoren X,Y (dh mehrdimensionaler Fall) bildest du eine Kovarianzmatrix, indem du die Kovarianzen Komponentenweise berechnest und dann zu einer Matrix zusammenfasst. Zb wenn X=(X1,X2) und Y=(Y1,Y2,Y2), so ist die Kovarianzmatrix eine 2x3-Matrix, welche aus einzelnen Kovarianzen zwischen den einzelnen Komponenten von Zufallsvektoren zusammengefasst ist.


Könntest du mir das anhand von nem Beispiel genau zeigen? Ist das was ich geschrieben hab nicht ein Produkt und keine Summe? :o

z.B. hab ich als Angabe
x1 x2 x3
1 2 2
2 3 3
3 1 1
4 4 4
5 6 6
6 5 7
7 7 5

->Berechnen Sie für jedes Paar von Variablen (xi;xj) (i,j=1,...,3) die Kovarianz cov(xi,xj). Fassen Sie die Resultate in der Kovarianzmatrix zusammen.

Ich weiß weder was i&j ist, noch wie die Gleichung aussehen soll, noch wie das dann in der Matrix angeordnet wird :s
Parent
du sollst dann eine 3x3 -Kovarianzmatrix bestimmen, wobei der Eintrag in der i-ten Zeile und der j-ten Spalte nichts anderes als Cov(xi,xj) bedeutet.
Nun, zur Berechnung dieser Kovarianz:
nehmen wir mal an, wir wollen Cov(x1,x2) berechnen, dann ist diese gleich:

Cov(x1,x2)=1/7*[(1-"Mittelwert von x1")*(2-"Mittelwert von x2")+(2-"Mittelwert von x1")*(3-"Mittelwert von x2")+(3-"Mittelwert von x1")*(1-"Mittelwert von x2")+...+(7-"Mittelwert von x1")*(7-"Mittelwert von x2")]

wobei: "Mittelwert von x1" = (1+2+3+4+5+6+7)/7
"Mittelwert von x2" = (2+3+1+4+6+5+7)/7
Parent
Ah, jetz versteh ich dat (die Matrix immernoch nicht :s), aber das zu automatisieren bis morgen wird hart!
Aber solangsam halt ich 50% für nicht ganz unmöglich und wenn nicht sollt ichs zumindest bis zur 2. Klausur halbwegs raus haben.
Parent
die Matrix macht es nicht schwerer, in die Matrix werden bloss alle berechneten Kovarianzen eingetragen. Zb haben wir die Kovarianz(x1,x2) berechnet, dh dieser reelle Wert soll dann in der 1n Zeile 2r Spalte in der Matrix stehen.
Da du die Kovarianz für alle Kombinationen (xi,yj) mit i,j=1,..,3 berechnest, so erhälst du alle 9 Matrixeinträge
Parent
Ich weiß nur nicht, wofür i und j stehen..
Parent
lol :) das sind bloss Koeffizienten, für die du natürliche Zahlen einsetzen kannst. In diesem Fall, da die ZV X=(X1,X2,X3), betrachtest du jedes Xi mit i=1,2,3
Parent
x) Ich brauch ein Beispiel, oder muss mir das ausführlich anschauen..Aber für den 1. Versuch mach ich jetzt mal Schluss mit Lernen, bin fick und fertig._.
Parent
Back to top