Bagging vs. Boosting: Një përmbledhje e metodave të ansamblit në mësimin e makinerisë

Mësimi i makinerisë është një fushë me rritje të shpejtë. Një nga teknikat më të fuqishme në mësimin e makinerive është mësimi i grupit, i cili përfshin kombinimin e parashikimeve të modeleve të shumta për të prodhuar një parashikim të përgjithshëm më të saktë. Dy metoda të njohura të të mësuarit të ansamblit janë grumbullimi dhe nxitja.

Bagging, ose grumbullimi i bootstrap-it, është një "teknikë që përfshin krijimin e modeleve të shumta" duke përdorur mostra të të dhënave të trajnimit të lidhura me bootstrap. Këto modele kombinohen më pas duke marrë mesataren e parashikimeve të tyre. Bagazhimi është veçanërisht efektiv kur kemi të bëjmë me të dhëna të zhurmshme, pasi redukton variancën në parashikimet e modeleve individuale. Nga ana tjetër, rritja përfshin modele të trajnimit në mënyrë të përsëritur në të njëjtin grup të dhënash, me secilin model pasues duke u fokusuar në shembujt që janë klasifikuar gabimisht nga modeli i mëparshëm. Rritja është veçanërisht efektive kur kemi të bëjmë me të dhëna të njëanshme, pasi redukton paragjykimet në parashikimet e modeleve individuale.

Metodat e Ansamblit

"Metodat e ansamblit janë një grup teknikash të mësimit të makinës" që kombinojnë vendimet e disa modeleve bazë për të krijuar një model parashikues më të saktë dhe më të fortë. Ideja prapa metodave të ansamblit është që duke kombinuar parashikimet e modeleve të shumta, ne mund të zvogëlojmë rrezikun e "përshtatjes së tepërt dhe të përmirësojmë saktësinë e përgjithshme të modelit".

Qese

Bagging, i njohur gjithashtu si bootstrap agregating, është një metodë "të mësuarit të ansamblit" që redukton variancën brenda një grupi të dhënash të zhurmshme. Në paketim, një kampion i rastësishëm i të dhënave në një grup trajnimi zgjidhet me zëvendësim, që do të thotë se pikat individuale të të dhënave mund të zgjidhen më shumë se një herë. Pasi të krijohen disa mostra të dhënash, këto mostra përdoren për të trajnuar një grup modelesh bazë. Parashikimet e këtyre modeleve kombinohen më pas për të krijuar modelin përfundimtar të ansamblit.

Thithja në çanta është veçanërisht efektive kur modelet bazë janë të paqëndrueshme ose të prirur për përshtatje të tepërt. Duke trajnuar modele të shumta në nëngrupe të ndryshme të të dhënave, grumbullimi mund të ndihmojë në zvogëlimin e ndikimit të të dhënave të jashtme dhe zhurmës në të dhëna.

Nxitja

Rritja është një tjetër metodë e të mësuarit të ansamblit që përdoret për të përmirësuar saktësinë e një "modeli parashikues". Ndryshe nga bagazhi, i cili trajnon çdo model bazë në mënyrë të pavarur, rritja e trajnon secilin model në mënyrë sekuenciale, me çdo model pasues që përpiqet të korrigjojë gabimet e modelit të mëparshëm.

Rritja është veçanërisht efektive kur modelet bazë janë të dobëta ose të pamjaftueshme. Duke trajnuar në mënyrë sekuenciale modelet për të korrigjuar gabimet e modelit të mëparshëm, rritja mund të ndihmojë në përmirësimin e "saktësisë së modelit përfundimtar të ansamblit".

Përmbajtja origjinale është nga blogu im. Vazhdo të lexosh "këtu"

Shiko gjithashtu:

Materiale të reja

Masterclass Coroutines: Kapitulli-3: Anulimi i korutinave dhe trajtimi i përjashtimeve.

Mirë se vini në udhëzuesin gjithëpërfshirës mbi Kotlin Coroutines! Në këtë seri artikujsh, unë do t'ju çoj në një udhëtim magjepsës, duke filluar nga bazat dhe gradualisht duke u thelluar në..

Faketojeni derisa ta arrini me të dhënat false

A e gjeni ndonjëherë veten duke ndërtuar një aplikacion të ri dhe keni nevojë për të dhëna testimi që duken dhe duken më realiste ose një grup i madh të dhënash për performancën e ngarkesës...

Si të përdorni kërkesën API në Python

Kërkesë API në GitHub për të marrë depot e përdoruesve duke përdorur Python. Në këtë artikull, unë shpjegoj procesin hap pas hapi për të trajtuar një kërkesë API për të marrë të dhëna nga..

Një udhëzues hap pas hapi për të zotëruar React

Në këtë artikull, do të mësoni se si të krijoni aplikacionin React, do të mësoni se si funksionon React dhe konceptet thelbësore që duhet të dini për të ndërtuar aplikacione React. Learning..

AI dhe Psikologjia — Pjesa 2

Në pjesën 2 të serisë sonë të AI dhe Psikologji ne diskutojmë se si makineritë mbledhin dhe përpunojnë të dhëna për të mësuar emocione dhe ndjenja të ndryshme në mendjen e njeriut, duke ndihmuar..

Esencialet e punës ditore të kodit tim VS

Shtesat e mia të preferuara - Git Graph 💹 Kjo shtesë është vërtet e mahnitshme, e përdor përpara se të filloj të punoj për të kontrolluar dy herë ndryshimet dhe degët më të fundit, mund të..

Pse Python? Zbulimi i fuqisë së gjithanshme të një gjiganti programues

Në peizazhin gjithnjë në zhvillim të gjuhëve të programimit, Python është shfaqur si një forcë dominuese. Rritja e tij meteorike nuk është rastësi. Joshja e Python qëndron në thjeshtësinë,..

Etiketa

Machine Learning JavaScript Data Science Artificial Intelligence Python Web Development Software Development Coding Deep Learning AI React Programming Languages Software Engineering Java Nodejs Algorithms Front End Development Data Tech Computer Science Development AWS HTML CSS Neural Networks Angular ChatGPT Python Programming Learning To Code Developer Code Typescript Tutorial NLP Open Source Productivity Computer Vision Linear Regression