Mësimi i makinerisë është një fushë me rritje të shpejtë. Një nga teknikat më të fuqishme në mësimin e makinerive është mësimi i grupit, i cili përfshin kombinimin e parashikimeve të modeleve të shumta për të prodhuar një parashikim të përgjithshëm më të saktë. Dy metoda të njohura të të mësuarit të ansamblit janë grumbullimi dhe nxitja.

Bagging, ose grumbullimi i bootstrap-it, është një "teknikë që përfshin krijimin e modeleve të shumta" duke përdorur mostra të të dhënave të trajnimit të lidhura me bootstrap. Këto modele kombinohen më pas duke marrë mesataren e parashikimeve të tyre. Bagazhimi është veçanërisht efektiv kur kemi të bëjmë me të dhëna të zhurmshme, pasi redukton variancën në parashikimet e modeleve individuale. Nga ana tjetër, rritja përfshin modele të trajnimit në mënyrë të përsëritur në të njëjtin grup të dhënash, me secilin model pasues duke u fokusuar në shembujt që janë klasifikuar gabimisht nga modeli i mëparshëm. Rritja është veçanërisht efektive kur kemi të bëjmë me të dhëna të njëanshme, pasi redukton paragjykimet në parashikimet e modeleve individuale.

Metodat e Ansamblit

"Metodat e ansamblit janë një grup teknikash të mësimit të makinës" që kombinojnë vendimet e disa modeleve bazë për të krijuar një model parashikues më të saktë dhe më të fortë. Ideja prapa metodave të ansamblit është që duke kombinuar parashikimet e modeleve të shumta, ne mund të zvogëlojmë rrezikun e "përshtatjes së tepërt dhe të përmirësojmë saktësinë e përgjithshme të modelit".

Qese

Bagging, i njohur gjithashtu si bootstrap agregating, është një metodë "të mësuarit të ansamblit" që redukton variancën brenda një grupi të dhënash të zhurmshme. Në paketim, një kampion i rastësishëm i të dhënave në një grup trajnimi zgjidhet me zëvendësim, që do të thotë se pikat individuale të të dhënave mund të zgjidhen më shumë se një herë. Pasi të krijohen disa mostra të dhënash, këto mostra përdoren për të trajnuar një grup modelesh bazë. Parashikimet e këtyre modeleve kombinohen më pas për të krijuar modelin përfundimtar të ansamblit.

Thithja në çanta është veçanërisht efektive kur modelet bazë janë të paqëndrueshme ose të prirur për përshtatje të tepërt. Duke trajnuar modele të shumta në nëngrupe të ndryshme të të dhënave, grumbullimi mund të ndihmojë në zvogëlimin e ndikimit të të dhënave të jashtme dhe zhurmës në të dhëna.

Nxitja

Rritja është një tjetër metodë e të mësuarit të ansamblit që përdoret për të përmirësuar saktësinë e një "modeli parashikues". Ndryshe nga bagazhi, i cili trajnon çdo model bazë në mënyrë të pavarur, rritja e trajnon secilin model në mënyrë sekuenciale, me çdo model pasues që përpiqet të korrigjojë gabimet e modelit të mëparshëm.

Rritja është veçanërisht efektive kur modelet bazë janë të dobëta ose të pamjaftueshme. Duke trajnuar në mënyrë sekuenciale modelet për të korrigjuar gabimet e modelit të mëparshëm, rritja mund të ndihmojë në përmirësimin e "saktësisë së modelit përfundimtar të ansamblit".

Përmbajtja origjinale është nga blogu im. Vazhdo të lexosh "këtu"