Strategjitë e mësimit të makinerisë Pjesa 07: Adresimi i paragjykimeve dhe variancave

Në artikujt e mëparshëm, pamë se ekzistojnë dy komponentë kryesorë të gabimit, të quajtur paragjykim i shmangshëm dhe variancë. Në këtë artikull, ne do të shohim se si t'i trajtojmë ato.

Drejtimi i paragjykimeve dhe variancës

Këtu është zgjidhja për të adresuar problemet e paragjykimit dhe variancës:

Nëse keni një paragjykim të lartë të shmangshëm; atëherë rekomandohet përdorimi i një modeli më të madh, pra një rrjet nervor me më shumë shtresa të fshehura dhe njësi të fshehura.
Nëse hasni në një problem me variancë të lartë; atëherë preferohet të përdorni më shumë të dhëna për të trajnuar modelin tuaj.

Trajnimi i një rrjeti më të madh nervor mund të zgjidhë problemet tuaja të paragjykimit të shmangshëm; megjithatë, rritja e madhësisë së modelit e bën stërvitjen tuaj të ngadaltë dhe kërkon fuqi të lartë llogaritëse. Një rrjet më gjigant dhe të dhëna të mëdha do të përmirësojnë ndjeshëm performancën. Megjithatë, mund të mos jetë e mundur të mblidhet një grup i madh i të dhënave për disa detyra.

Arkitekturat e ndryshme të rrjeteve nervore do të kenë probleme të ndryshme të paragjykimit/variancës. Është e rëndësishme të kërkoni për arkitekturën e performancës optimale. Literatura akademike dhe zbatimet me burim të hapur në GitHub janë burime të shkëlqyera frymëzimi kur jeni duke kërkuar për një arkitekturë modeli optimal që redukton problemet e paragjykimit dhe variancës.

Rritja e madhësisë së modelit mund të rrisë mundësinë e përshtatjes së tepërt, duke rritur variancën duke reduktuar paragjykimet. Duket sikur ka një shkëmbim midis paragjykimit dhe variancës. Megjithatë, ju mund të rrisni në mënyrë efektive madhësinë e modelit pa rritur variancën duke përdorur rregullimin. Për shembull, nëse po përdorni rregullim të tillë si rregullimi i L2 ose braktisja me modelin tuaj të të mësuarit të thellë që funksionon mirë në grupin tuaj të verifikimit të kryqëzuar, atëherë rritja e madhësisë së modelit nuk do të dëmtojë performancën, do të mbetet e njëjtë ose përmirësuar. E vetmja pengesë e përdorimit të një modeli më të madh është kostoja llogaritëse.

Bashkimi paragjykim kundër variancës

Ju mund të keni dëgjuar për paragjykimet kundër ndryshimit. Ju bëni ndryshime në modelin tuaj të të mësuarit për të reduktuar paragjykimet dhe variancën, ka disa ndryshime që mund të rrisin variancën dhe të ulin paragjykimet dhe anasjelltas. Për shembull, në një sistem të njohjes së të folurit, ju keni variancë të lartë dhe paragjykim të ulët; ju mund të përdorni parametrat e rregullimit për të reduktuar variancën, por paragjykimi juaj do të rritet. Në mënyrë të ngjashme, nëse keni një paragjykim të lartë, atëherë mund ta zvogëloni atë duke rritur madhësinë e modelit tuaj, si p.sh. më shumë njësi të fshehura, më shumë shtresa të fshehura ose stërvitje më gjatë. Megjithatë, kjo do të shtojë një kompromis. Si do ta trajtonit këtë?

Në epokën e të dhënave të mëdha dhe të të mësuarit të thellë, tani keni shumë më tepër fleksibilitet. Ju mund të zvogëloni paragjykimet pa dëmtuar variancën, dhe anasjelltas. Kjo është kryesisht për shkak të disponueshmërisë së të dhënave të mëdha dhe fuqisë llogaritëse për të trajnuar rrjete të thella gjigante. Për shembull, ju mund të trajnoni një rrjet më të madh me një parametër rregullimi optimal për të reduktuar paragjykimet pa dëmtuar variancën dhe mund të zvogëloni variancën duke përdorur shumë të dhëna.

Teknikat për reduktimin e paragjykimeve të shmangshme

Nëse e trajnoni modelin tuaj të mësimit të makinerive dhe shihni se algoritmi juaj vuan nga paragjykime të larta të shmangshme, mund të përdorni teknikat e mëposhtme për ta reduktuar atë.

Rrisni madhësinë e modelit:kjo teknikë do të reduktojë paragjykimet e shmangshme pasi do t'i përshtatet mirë grupit të trajnimit. Ju mund të rrisni madhësinë e modelit tuaj duke shtuar më shumë shtresa të fshehura dhe njësi të fshehura. Për të shmangur përshtatjen e tepërt, mund të përdorni rregullimin ose braktisjen e L2.
Modifiko veçoritë e hyrjes bazuar në njohuritë nga analiza e gabimeve: Gjatë analizës së gabimeve, nëse ke parë se shtimi i disa veçorive do të reduktojë paragjykimet e tua të shmangshme, atëherë mund të kesh veçori shtesë për përmirësimin e performancës.
Zvogëloni ose hiqni qafe rregullimin:Mund të zvogëloni ose eliminoni vlerën e L2, L1 ose vlerës së rregullimit të braktisjes për të reduktuar paragjykimet e shmangshme, megjithatë, mund të rrisë variancën.
Kërkimi i arkitekturës së modelit:do t'ju duhet të kërkoni për arkitekturën e modelit optimal që mund të zvogëlojë problemet e paragjykimit dhe variancës.

Teknikat për reduktimin e variancës

Nëse algoritmi juaj i të mësuarit vuan nga variancë të lartë, mund të provoni sa më poshtë për ta trajtuar atë:

Shtimi i më shumë të dhënave të trajnimit: Kjo është mënyra më e thjeshtë dhe më e besueshme për të adresuar problemin e variancës, nëse keni akses në më shumë të dhëna dhe fuqi llogaritëse, atëherë ky është hapi i rekomanduar për adresimin e variancës.
Përdor rregullimin:Kjo teknikë redukton variancën, por rrit paragjykimet, mund të përdorësh rregullimin L1, L2 ose braktisjen.
Shto ndalimin e hershëm:ndalimin e të mësuarit herët bazuar në gabimin e caktimit të programit. Kjo teknikë ndihmon në reduktimin e variancës, por mund të rrisë paragjykimet, mund të përdoret si një teknikë rregullimi.
Kërkimi i arkitekturës së modelit:Siç u përmend më lart, ai mund të përdoret gjithashtu për të adresuar variancën. Ju do të duhet të kërkoni për arkitekturën e modelit optimal që mund të zvogëlojë problemet e paragjykimit dhe variancës.

Përmbledhje

Paragjykimi dhe varianca janë dy burimet kryesore të gabimit në mësimin e makinerive. Analizimi i gabimeve dhe sugjerimi i teknikave premtuese mund të ndihmojë në përshpejtimin e zhvillimit. Ekzistojnë teknika të ndryshme që mund të përdorni për të trajtuar paragjykimet dhe mospërputhjet. Në artikullin tjetër, unë do të diskutoj se si mund ta identifikoni dhe adresoni gabimin tuaj duke përdorur njohuritë nga kurba e të mësuarit.

Referencat

[1]. Ng, Andrew. “Dëshira për mësimin e makinës. 2018.” URL: htts://info.deeplearning.ai/machine-learning-yearning-book (2017).

[2]. Java Point. "Paragjykimi dhe varianca në mësimin e makinerisë" URL:https://www.javatpoint.com/bias-and-variance-in-machine-learning/10 shkurt 2023

Faleminderit që lexuat artikullin.

Rreth meje:

Unë jam student i Masterit në robotikë, dhe interesi im kërkimor është vizioni kompjuterik dhe mësimi i thellë. Unë kam 2 vjet përvojë pune si një zhvillues për mësimin e makinerive dhe python. Unë kam punuar në zbulimin e objekteve, gjurmimin e shumë objekteve me një kamerë të vetme, gjurmimin e shumë objekteve me shumë kamera, analitikën e shitjes me pakicë, imazhe mjekësore, riidentifikimin e personave dhe mësimin e makinerive grafik.

Lidhu me mua në LinkedIn

Ju lutemi mos ngurroni të komentoni më poshtë nëse keni ndonjë pyetje.

BËHET SHKRIMTAR në MLearning.ai

Sugjerime për paraqitjen e Mlearning.ai
Si të bëheni shkrimtar në Mlearning.aimedium.com

Shiko gjithashtu:

Materiale të reja

Masterclass Coroutines: Kapitulli-3: Anulimi i korutinave dhe trajtimi i përjashtimeve.

Mirë se vini në udhëzuesin gjithëpërfshirës mbi Kotlin Coroutines! Në këtë seri artikujsh, unë do t'ju çoj në një udhëtim magjepsës, duke filluar nga bazat dhe gradualisht duke u thelluar në..

Faketojeni derisa ta arrini me të dhënat false

A e gjeni ndonjëherë veten duke ndërtuar një aplikacion të ri dhe keni nevojë për të dhëna testimi që duken dhe duken më realiste ose një grup i madh të dhënash për performancën e ngarkesës...

Si të përdorni kërkesën API në Python

Kërkesë API në GitHub për të marrë depot e përdoruesve duke përdorur Python. Në këtë artikull, unë shpjegoj procesin hap pas hapi për të trajtuar një kërkesë API për të marrë të dhëna nga..

Një udhëzues hap pas hapi për të zotëruar React

Në këtë artikull, do të mësoni se si të krijoni aplikacionin React, do të mësoni se si funksionon React dhe konceptet thelbësore që duhet të dini për të ndërtuar aplikacione React. Learning..

AI dhe Psikologjia — Pjesa 2

Në pjesën 2 të serisë sonë të AI dhe Psikologji ne diskutojmë se si makineritë mbledhin dhe përpunojnë të dhëna për të mësuar emocione dhe ndjenja të ndryshme në mendjen e njeriut, duke ndihmuar..

Esencialet e punës ditore të kodit tim VS

Shtesat e mia të preferuara - Git Graph 💹 Kjo shtesë është vërtet e mahnitshme, e përdor përpara se të filloj të punoj për të kontrolluar dy herë ndryshimet dhe degët më të fundit, mund të..

Pse Python? Zbulimi i fuqisë së gjithanshme të një gjiganti programues

Në peizazhin gjithnjë në zhvillim të gjuhëve të programimit, Python është shfaqur si një forcë dominuese. Rritja e tij meteorike nuk është rastësi. Joshja e Python qëndron në thjeshtësinë,..

Etiketa

Machine Learning JavaScript Data Science Artificial Intelligence Python Web Development Software Development Coding Deep Learning AI React Programming Languages Software Engineering Java Nodejs Algorithms Front End Development Data Tech Computer Science Development AWS HTML CSS Neural Networks Angular ChatGPT Python Programming Learning To Code Developer Code Typescript Tutorial NLP Open Source Productivity Computer Vision Linear Regression