Perzentile in der Statistik sind Werte, die eine gegebene Prozentzahl der Werte in einer Datenmenge repräsentieren. Beispielsweise repräsentiert das 50. Perzentil (auch als Median bezeichnet) den Wert, der die Hälfte aller Werte in der Datenmenge unter sich hat.
Um die Perzentile einer Datenmenge zu berechnen, müssen die Werte zunächst sortiert werden. Anschließend kann man das gewünschte Perzentil wie folgt berechnen:
- Finde die Stelle in der sortierten Datenmenge, die dem gewünschten Perzentil entspricht. Wenn die Datenmenge N Werte enthält, entspricht dies der Stelle (P/100) * N, wobei P das gewünschte Perzentil in Prozent ist.
- Wenn die Stelle, die man berechnet hat, keine ganze Zahl ist, muss man den Wert an dieser Stelle interpoliert werden, um das Perzentil zu bestimmen.
Hier ist ein Beispiel in Python:
def calculate_percentile(data, percentile):
data.sort()
index = (percentile / 100) * len(data)
if index % 1 == 0:
return data[int(index)]
else:
lower = data[int(index // 1)]
upper = data[int(index // 1) + 1]
return lower + (upper - lower) * (index % 1)
In dieser Funktion wird das gegebene Perzentil P für die gegebene Datenmenge data berechnet. Zunächst werden die Daten sortiert und der Index für das Perzentil wird berechnet. Wenn der Index eine ganze Zahl ist, wird der Wert an dieser Stelle als Perzentil zurückgegeben. Andernfalls werden der Wert an der niedrigeren Stelle und der Wert an der höheren Stelle interpoliert, um das Perzentil zu bestimmen.