Linjär regression är ett statistiskt verktyg som avgör hur väl en rak linje passar en uppsättning parade data. Den raka linjen som bäst passar den informationen kallas den minsta kvadraters regressionslinje. Denna rad kan användas på ett antal sätt. En av dessa användningar är att uppskatta värdet på en svarsvariabel för ett givet värde på en förklarande variabel. Relaterad till denna idé är en rest.
(1, 2), (2, 3), (3, 7), (3, 6), (4, 9), (5, 9)
För att beräkna återstoden vid punkterna x = 5, vi drar bort det förutspådda värdet från vårt observerade värde. Sedan y koordinaten för vår datapunkt var 9, detta ger en rest av 9 - 10 = -1.
Det finns flera användningsområden för rester. En användning är att hjälpa oss att avgöra om vi har en datauppsättning som har en övergripande linjär trend, eller om vi bör överväga en annan modell. Anledningen till detta är att rester hjälper till att förstärka alla olinjära mönster i våra data. Vad som kan vara svårt att se genom att titta på en spridplot kan lättare observeras genom att undersöka resterna och en motsvarande restplott.
Ett annat skäl att överväga rester är att kontrollera att villkoren för inferens för linjär regression är uppfyllda. Efter verifiering av en linjär trend (genom att kontrollera resterna), kontrollerar vi också fördelningen av resterna. För att kunna utföra regressionsstörning, vill vi att återstoden om vår regressionslinje ska vara ungefär normalt fördelad. EN histogram eller stemplot av resterna hjälper till att verifiera att detta villkor har uppfyllts.