Berechnen Sie den Median basierend auf der Anzahl der Werte

1065
Gnutt

Ich habe Daten darüber, wie viele einer bestimmten CPU wir haben, und ihre CPU-Marken. Auf dieser Grundlage möchte ich die Median- und Quartil-Statistiken dynamisch berechnen.

Zum Beispiel habe ich eine Tabelle, die aussieht

Name Count Marks i7-5820k 3,3 GHz 6 Kerne 11, 12.996 i7-950 3,1 GHz 4 Kerne 4 5595 i7-3820 3,6 GHz 4 Kerne 7 8998 i5-3570k 3,4 GHz 4 Kerne 1 7153 

Was ich mit den Daten tun möchte, ist, die Markierungen der ersten Zeile 11 mal, die zweite 4 mal usw. zu zählen.

Derzeit wird in Google Spreadsheets damit gearbeitet, aber ich denke, eine ähnliche Funktion sollte in den meisten Spreadsheeting-Anwendungen verfügbar sein.

3

2 Antworten auf die Frage

3
A.S.H

Abgesehen von der Mathematik können Sie die folgende Matrixformel verwenden :

=MEDIAN(IF(COLUMN(A:Z)<=B2:B5,C2:C5)) 

CtrlShiftEnter

Anmerkungen:

  • IF(COLUMN(A:Z)<=B2:B5,C2:C5)erzeugt ein 2D-Array, in 4 rows, 26 columnsdem jede Zeile die Zelle in Spalte C so oft wiederholt, wie in der Zelle von Spalte B angegeben; Die restlichen Einträge in der Zeile sind FALSE.

  • Die MEDIANFunktion ignoriert die FALSEZellen und wertet die tatsächlichen Einträge im generierten 2D-Array aus.

Clevere Lösung! +1 Excellll vor 6 Jahren 1
Das ist ziemlich glatt, @ASH Bandersnatch vor 6 Jahren 1
0
Bandersnatch

Excel verfügt über eine QUARTILE () - Funktion, die Sie verwenden können. Ihr Datensatz ist jedoch so klein, dass Sie die Antwort fast durch Einsicht erhalten.

Verschieben Sie zuerst die Reihe mit den i7-950-CPUs an das Ende der Liste. Es gibt insgesamt 23 CPUs, der Medianwert ist also die Punktzahl der 11,5-stufigen CPU. In ähnlicher Weise ist das 1. Quartil die Punktzahl der 5.75 platzierten CPU.

In Ihrem Fall sind diese Antworten 8998. Das ist ein bisschen seltsam, aber es hat mit der Verteilung Ihrer Daten zu tun. Sowohl das erste als auch das zweite Quartil liegen in derselben "Ablage". Stellen Sie sich vor, jeder in den USA wog 150 Pfund. Dann wären das mittlere Gewicht und alle% -Anteile 150 Pfund.

Sie könnten argumentieren, dass Ihre Quartil- und Medianwerte beide zwischen Datenpunkten liegen und dann zwischen den Datenpunkten interpolieren. Dann würden Sie das Quartil als 3/4 des Weges zwischen 5595 und 8998 berechnen. Und der Median als Mitte zwischen 8998 und 12.996.

Ich bekomme 8197.25 und 10.997.

Erstellen Sie eine Spalte mit 11 12,996, 7 8998, 1 7153 und 4 5595, um zu sehen, was die QUARTILE () - Funktion denkt.

Verwenden Sie dann QUARTILE (Bereich 1) und QUARTILE (Bereich 2), um das 1. Quartil und den Median zu berechnen. Hier ist "Bereich" die Liste von 23 Marken.

BEARBEITEN: Die Interpolation ist hier nicht unbedingt koscher, da die CPU-Werte alle genau sind und nicht der Durchschnitt einer Reihe von Ergebnissen. Ich DENKEN . Ich nehme an, Sie haben die veröffentlichten Werte der Benchmark-Ergebnisse für jede CPU nachgeschlagen.

Ich bin nicht sicher, was passieren würde, wenn Sie tatsächlich den Benchmark auf jeder CPU ausführen würden. Würde derselbe CPU-Typ alle eine identische Bewertung erzielen, oder würde es eine Reihe von Ergebnissen geben? Wenn sich die Bewertungen für identische CPUs unterscheiden würden (etwa aufgrund von Temperatur oder ??), wäre die Interpolation gerechtfertigt, denke ich.

Kommentare sind hier willkommen.