Statistisches Testen von Schrittvariablen

866
wonea

Ich habe drei Variablen, die ich analysieren möchte. Zwei davon sind Stufenwerte - ein Satz reicht von 1-6 und der andere von 1-5. Die dritte Variable ist kein Schrittwert, kann jedoch einen relativ weiten Bereich möglicher Werte haben. Ich versuche festzustellen, ob meine dritte Variable mit einem der beiden Schrittwerte zusammenhängt.

Die Stufenwerte repräsentieren unterschiedliche Gehaltsstufen und Rankings, während die Nicht-Stufenvariable Lohn darstellt. Wie kann ich testen, ob sich die Bezahlung auf die Gehaltsstufe und / oder das Ranking bezieht? Und gibt es eine Möglichkeit, alle drei Variablen in einem Diagramm darzustellen?

1
Warum wurde dies von SO migriert? J. Polfer vor 15 Jahren 0

3 Antworten auf die Frage

1
Henry Troup

Sollte in der Lage sein, das mit einem 3-D-Oberflächendiagramm oder "Walddiagramm" darzustellen - die zwei Stufenfunktionen definieren die Ebene und der Nicht-Stufenwert ist die Höhe.

Um die Korrelation zu analysieren, würde ich eine kombinierte Stufenfunktion über die dreißig Zellen definieren, die durch die Ebene der beiden vorhandenen Stufenfunktionen definiert werden.

0
JDB

JHC-R Statistical ist ein Open Source-Statistikpaket, das auf allen gängigen Plattformen ( http://www.r-project.org/ ) ausgeführt werden kann und eine sehr gute Analysearbeit leistet. Der folgende Beispielcode würde kopierte Daten (Spalten mit Rang, Rang und Gehalt) übernehmen und Ihnen die gewünschte Analyse liefern.

mydata <- read.table ("Zwischenablage", Header = TRUE);

Antwort = Mydata $ Pay ~ Mydata $ Rank + Mydata $ Grade;

Auftrag (Antwort);

kopiert (Rang ~ Grade | Pay, Daten = Mydata);

fit = lm (Antwort);

afit = anova (fit);

ein Anfall;

Plot (fit);

cor (mydata $ Rank, mydata $ Grade)

(Weitere Informationen - Hilfe mit folgenden Befehlen suchen :) help (lm); Hilfe (Anova); Hilfe (Coplot);

0

Sorry JDB - Ich habe es mit R versucht und ich verstehe es einfach nicht. Ich kann R nicht dazu bringen, meine Daten einzulesen (verdammt noch mal nicht, wo R möchte, dass ich die Daten einstelle).

Von dem, was ich im Codebeispiel sehe. Sie schlagen vor, einen ANOVA-Test zu verwenden? Gibt es einen Grund, warum die Cor-Funktion nur Rank und Grade berücksichtigt?

@ user11629: read.table ("Zwischenablage") liest Daten aus der Zwischenablage in Windows ein (Sie müssen die Daten aus einem anderen Programm / Texteditor / etc kopiert haben). Soweit die Funktion "cor" gilt, ist dies nur eine einfache Korrelation bei zwei Variablen. cor (mydata $ Rank, mydata $ Grade) kann auch cor (mydata $ Rank, mydata $ pay) oder cor (mydata $ pay, mydata $ grade) sein. Da es um die Frage ging, diese Variablen grafisch darzustellen und Korrelationen zu bestimmen, würde dies die Arbeit erledigen. Der ursprüngliche Fragesteller muss jedoch die Statistiken hinter diesen Analysen berücksichtigen. JDB vor 14 Jahren 0