Beräkning av prestandamått i maskininlärning
Innehållsförteckning
- Introduktion
- Metoder för att hitta prestandamått
- 2.1 Accurancy
- 2.2 Missklassificeringsgrad
- 2.3 True Positive Rate
- 2.4 False Positive Rate
- 2.5 True Negative Rate
- 2.6 Precision
- 2.7 Prevalens
- Användning av prestandamått i maskininlärning
- Exempel på beräkningar
- Sammanfattning
- Vanliga frågor och svar
- Källor
Introduktion
I denna artikel kommer vi att utforska olika prestandamått inom maskininlärning och hur man beräknar dem baserat på en given förvirringsmatris. Prestandamått är viktiga verktyg för att utvärdera och bedöma effektiviteten hos en maskininlärningsmodell. Genom att förstå dessa mått kan vi få insikt i hur väl en modell fungerar och vilka felaktigheter den kan ha. Vi kommer att titta på några vanliga prestandamått, inklusive accuracy, missklassificeringsgrad, true positive rate, false positive rate, true negative rate, precision och prevalens.
Metoder för att hitta prestandamått
2.1 Accurancy
Accuracy (noggrannhet) är ett prestandamått som mäter hur korrekt en klassificeringsmodell predicerar rätt svar. Formeln för att beräkna accurancy är:
Accuracy = (True Negative + True Positive) / Totala antalet förutsägelser
2.2 Missklassificeringsgrad
Missklassificeringsgraden mäter hur ofta klassificeringen görs fel. Den beräknas genom att dividera antalet missklassificeringar med det totala antalet exempel.
2.3 True Positive Rate
True Positive Rate (även känd som sensitivity eller recall) mäter hur ofta en positivt klassad observation predikteras som positiv. Formeln för att beräkna true positive rate är:
True Positive Rate = True Positive / Aktuella posiiva exempel
2.4 False Positive Rate
False Positive Rate mäter hur ofta en negativt klassad observation predikteras som positiv. Den beräknas genom att dividera antalet falska positiva med det totala antalet faktiska negativa exempel.
2.5 True Negative Rate
True Negative Rate (även känd som specificitet) mäter hur ofta en negativt klassad observation predikteras som negativ. Formeln för att beräkna true negative rate är:
True Negative Rate = True Negative / Aktuella negativa exempel
2.6 Precision
Precision mäter hur ofta en positiv prediktion är korrekt. Den beräknas genom att dividera antalet sanna positiva med det totala antalet positiva förutsägelser.
2.7 Prevalens
Prevalens (förekomst) mäter hur ofta ett visst villkor faktiskt förekommer i vår sampel. Den beräknas genom att dividera antalet faktiskt positiva exempel med det totala antalet exempel i datamängden.
Användning av prestandamått i maskininlärning
Prestandamått används inom maskininlärning för att bedöma hur bra en modell presterar och för att jämföra olika modeller. Genom att analysera prestandamått kan vi få en bättre förståelse för modellens styrkor och svagheter. Detta hjälper oss att fatta informerade beslut och förbättra modellens prestanda.
Exempel på beräkningar
Låt oss illustrera beräkningen av dessa prestandamått med hjälp av ett exempel. Vi har en förvirringsmatris med 150 förutsägelser, varav 100 prediktioner är av typen "Ja" och 50 prediktioner är av typen "Nej". Genom att tilldela namn till varje siffra i matrisen kan vi beräkna de olika prestandamåtten för denna klassificerare.
- True Negative: 45
- False Positive: 5
- False Negative: 5
- True Positive: 95
Med hjälp av ovanstående värden kan vi beräkna accuracy, missklassificeringsgrad, true positive rate, false positive rate, true negative rate, precision och prevalens för denna modell.
Sammanfattning
Prestandamått är viktiga för att utvärdera och bedöma effektiviteten hos en maskininlärningsmodell. Genom att använda olika mått kan vi få insikt i hur väl modellen fungerar och vilka felaktigheter den kan ha. I denna artikel har vi utforskat olika prestandamått, inklusive accuracy, missklassificeringsgrad, true positive rate, false positive rate, true negative rate, precision och prevalens. Genom att förstå och använda dessa mått kan vi förbättra våra maskininlärningsmodeller och fatta informerade beslut baserade på deras prestanda.
Vanliga frågor och svar
Fråga: Vad är accuracy och hur beräknas den?
Svar: Accuracy mäter den totala korrektheten i en klassificeringsmodell. Den beräknas genom att addera antalet sanna negativa och sanna positiva och dividera det med det totala antalet förutsägelser.
Fråga: Vad är falska positiva och falska negativa?
Svar: Falska positiva är när en negativ observation felaktigt klassificeras positivt och falska negativa är när en positiv observation felaktigt klassificeras negativt.
Fråga: Vad används precision till?
Svar: Precision mäter andelen korrekta positiva förutsägelser i förhållande till det totala antalet positiva förutsägelser. Det hjälper oss att bedöma exaktheten hos våra positiva förutsägelser.