Pak kohë më parë në artikullin tim Si të parashikohen kuantilet në një mënyrë më inteligjente (ose 'Bye-bye regresion quantile, hello Conformalized Quantile Regression') kam mbuluar Regresionin Kuantile të Konformalizuar - një nga modelet më të njohura të Parashikimit Konformal. Sot, ne do të shikojmë një model tjetër të fuqishëm të Parashikimit Konformal për përcaktimin sasior të pasigurisë në regresion - Jackknife+.

Jackknife+ është një metodë e fuqishme e parashikimit konformal që u zhvillua nga studiuesit kryesorë të mësimit të makinerive nga Universiteti i Çikagos, Stanford, Carnegie Mellon dhe Berkeley dhe u botua në gazetën "Përfundimi parashikues me jackknife +".

Teknika jackknife fillimisht u konceptua nga Maurice Quenouille midis viteve 1949 dhe 1956. Më vonë në vitin 1958, John Tukey, një statisticien i njohur, e përsosi më tej këtë teknikë. Ai propozoi termin 'jackknife' si një metaforë për këtë metodë për shkak të zbatueshmërisë dhe shkathtësisë së saj të gjerë. Ashtu si një thikë fizike - një thikë kompakte dhe e palosshme - kjo metodë statistikore ofron një zgjidhje fleksibël dhe të adaptueshme për një spektër të gjerë problemesh, pavarësisht nga ekzistenca e mjeteve të tjera që mund të zgjidhin probleme specifike në mënyrë më efikase.

Objektivi ynë është të krijojmë një funksion regresioni duke përdorur të dhënat e trajnimit, i cili përbëhet nga çifte tipare (Xi, Yi). Ne kërkojmë të parashikojmë daljen Yn+1 për një vektor të ri tipar Xn+1=x dhe të gjenerojmë një interval pasigurie përkatëse për këtë parashikim. Synimi është që ky interval të përfshijë Yn+1 të vërtetë me një probabilitet mbulimi të paracaktuar.

Një qasje e drejtpërdrejtë mund të jetë përshtatja e modelit themelor të regresionit me të dhënat e trajnimit, llogaritja e mbetjeve dhe më pas përdorimi i këtyre mbetjeve për të vlerësuar sasinë. Kjo kuantil mund të përdoret më pas për të përcaktuar gjerësinë e intervalit të parashikimit për pikën e re të provës. Megjithatë, kjo metodë tenton të nënvlerësojë pasigurinë aktuale për shkak të përshtatjes së tepërt - mbetjet që rrjedhin nga grupi i trajnimit janë zakonisht më të vogla se ato që do të merrnit nga të dhënat e padukshme të testit.

Për të zbutur çështjen e përshtatjes së tepërt, u shpik një teknikë e fuqishme statistikore e quajtur 'jackknife'. Qëllimi fillestar i kësaj teknike ishte të reduktonte paragjykimet dhe të siguronte një vlerësim për variancën. Ai funksionon mbi parimin e përjashtimit të njëpasnjëshëm të një vëzhgimi nga grupi i të dhënave dhe rivlerësimit të modelit. Kjo metodologji ofron një mjet empirik për të vlerësuar stabilitetin e modelit dhe…