In der Datenanalytik werden die Begriffe “Recall” und “True Positive Rate” (TPR) oft synonym verwendet. Beide beziehen sich auf das gleiche Konzept in der Klassifizierung und Bewertung von maschinellen Lernmodellen, insbesondere in der Bewertung von binären Klassifizierungsmodellen. Hier ist eine detaillierte Erklärung dieser Begriffe:
- Recall (Rückrufrate): Recall misst den Anteil der tatsächlichen Positiven, die korrekt als positiv identifiziert wurden. Es beantwortet die Frage: “Wie viele der tatsächlichen positiven Fälle konnte das Modell korrekt erkennen?” Der Recall wird berechnet, indem man die Anzahl der wahren Positiven (TP) durch die Summe aus den wahren Positiven und den falsch Negativen (FN) teilt. Das bedeutet, er misst, wie gut das Modell alle relevanten Fälle (oder Klassen) erfasst hat. Die Formel für den Recall ist: Recall = TP / (TP + FN)
- True Positive Rate (TPR): Die True Positive Rate ist ein weiterer Name für Recall. In der Signalentdeckungstheorie und in anderen Bereichen wird der Begriff TPR häufig verwendet. Die TPR gibt den Anteil der positiven Datenpunkte an, die korrekt als positiv identifiziert wurden, im Verhältnis zu allen tatsächlich positiven Datenpunkten. Die Berechnung der TPR ist identisch mit der des Recall: True Positive Rate = TP / (TP + FN)
In Zusammenfassung: “Recall” und “True Positive Rate” sind zwei Begriffe, die dasselbe Maß in der Bewertung von Klassifizierungsmodellen beschreiben. Sie sind besonders wichtig in Situationen, in denen das Erkennen aller positiven Fälle (z.B. bei der Krankheitserkennung oder Betrugserkennung) von großer Bedeutung ist.