Kuptimi i pyjeve të rastësishëm për mësimin e makinerisë

Çfarë është një pyll i rastësishëm?

Ai ka një vend të rëndësishëm në mësimin e makinerive për të zgjidhur problemet e regresionit dhe klasifikimit. Është i dobishëm për prodhimin e rezultateve me një algoritëm të mësimit të makinës pa akordim hipermetrash.

Pra, çfarë do të thotë akordimi i hipermetrit?

Akordimi i hipermetrit në thelb do të thotë të kesh një çelës për algoritmet e mësimit të makinës. Sepse në këtë mënyrë, algoritmet e të mësuarit mund të zbatohen dhe mund të propozohet një model i lidhur për një zgjidhje më optimale të problemit. Kështu, sjellja e përgjithshme e një modeli të mësimit të makinës mund të kontrollohet.

Rezultatet e marra me çdo kombinim të modeleve vlerësohen dhe kështu vazhdojnë me më të mirët.

Pra, pse është i rëndësishëm pylli i rastësishëm?

Për ta kuptuar këtë, së pari duhet të kemi parasysh parimin e funksionimit të tij.

Pylli i rastësishëm përdor pragje të rastësishme për çdo veçori, ndryshe nga ajo që bën një pemë normale vendimi. Kjo shton rastësi shtesë në model kur ndahet një nyje. Kështu, shumë pemë vendimi do të krijohen në pyllin e rastësishëm.

Përveç strukturës nyja rrënjë — nyja e vendimit — nyja e gjetheve në pemët e vendimit, ajo siguron një strukturë me më shumë konsistencë për të zbuluar peshën parashikuese të çdo veçorie.

Për shembull, le të kemi një grup të dhënash trajnimi të përbërë nga fotografi të maceve dhe qenve. Pylli i rastësishëm do ta ndajë grupin e trajnimit në nënbashkësi. Nëngrupet formojnë pemë vendimi, të cilat variojnë me pyll të rastësishëm. Pemët e vendimit prodhojnë në vetvete një rezultat parashikimi. Dhe të gjitha këto janë në fakt të rëndësishme për rezultatin. Në pikën e fundit, pylli i rastësishëm jep rezultatin e parashikimit sipas rezultatit në shumicë.

Ne shohim se një pyll i rastësishëm performon dukshëm më mirë se një pemë e vetme vendimi.

Pyll i rastësishëm në anën e thjeshtësisë

Matja e ndikimit të çdo veçorie në parashikim është e lehtë me Sklearn. Treni Scikit-Learn ka nevojë për një pirg shumë të thjeshtë kodesh kur vlerëson grupin e të dhënave. Është e lehtë për të thirrur në aplikacion duke e importuar atë në klasifikues si më poshtë.

from sklearn.ensemble import RandomForestClassifier

# Create the model with 100 trees
model = RandomForestClassifier(n_estimators=100, 
                               random_state=RSEED, 
                               max_features = 'sqrt',
                               n_jobs=-1, verbose = 1)

# Fit on training data
model.fit(train, train_labels)

Në këtë mënyrë fillojnë të merren rezultatet me parametra të tillë si numri i nyjeve, numri i pemëve të vendimit dhe thellësia maksimale.

Ndërsa dhamë një shembull të strukturës së fuqishme të pyjeve të rastësishme, ne theksuam dy gjëra:

I zbatueshëm si për problemet e regresionit ashtu edhe për problemet e klasifikimit
Aftësia për të prodhuar rezultate të mira pa nevojën e kalibrimeve të hipermetrave

Në këtë pikë, do të doja të prekja shkurtimisht çështjen e rregullimit të hipermetrit për të marrë një rezultat më të mirë.

Kërkimi i rastësishëm shfaqet kur duam të optimizojmë pyllin e rastësishëm. Përdorimi i kësaj strukture sigurisht që nuk është aq i komplikuar. Kërkimi i rastësishëm së pari:

Zgjedh kombinimet e hipermetrave nga një rrjet
Më pas përdor këto zgjedhje për verifikim të kryqëzuar në të dhënat e trajnimit.
Më në fund kthen rezultatin më të mirë

Mund të bëhet e nevojshme rregullimi i hipermetrave kundër problemit të mbivendosjes.

Cila është zona më e zakonshme e përdorimit?

Shohim gjithnjë e më shumë pyje të rastësishme që po zbatohen në financa. Ai përdor algoritme të rastësishme pyjore për të analizuar aplikimet për kredi dhe për të zbuluar anomalitë në banka. Gjithashtu është e mundur të renditen karakteristikat e sjelljes së stoqeve. Shitësit e tregtisë elektronike mund të preferojnë algoritme pyjore të rastësishme për të kuptuar se çfarë sjelljeje shfaqin klientët e tyre më shumë në statistikat historike.

Dhe popullorisht, pylli i rastësishëm mund të shfaqet sërish në vlerësimin e një zhvillimi të ri në fushën e shëndetësisë bazuar në historitë e mëparshme të pacientëve. Ve aslinda esnek kullanimi sayesinde daha güclü bir model

Si duket në të ardhmen?

Ai do të vazhdojë të na ndihmojë të punojmë me periferitë dhe të bëjmë parashikime të forta me një variancë më të mesme, pasi ne marrim një vlerë mesatare të të gjitha pemëve të vendimeve me pyll të rastësishëm dhe mund të konsiderojmë faktorë që janë të rëndësishëm të veçorive.

Është gjithmonë e mundur të krijohen modele që performojnë më mirë. Këtu, përputhshmëria e strukturës me të dhëna të mëdha dhe rezultate të kënaqshme mund të merret parasysh kur bëhet vërtetimi më i mirë me pajisjet në dispozicion.

Duket se pylli i rastësishëm do të vazhdojë të jetë një nga modelet më të fuqishme dhe më të njohura të mësimit të makinerive në të ardhmen.

Faleminderit per leximin!

Shiko gjithashtu:

Materiale të reja

Masterclass Coroutines: Kapitulli-3: Anulimi i korutinave dhe trajtimi i përjashtimeve.

Mirë se vini në udhëzuesin gjithëpërfshirës mbi Kotlin Coroutines! Në këtë seri artikujsh, unë do t'ju çoj në një udhëtim magjepsës, duke filluar nga bazat dhe gradualisht duke u thelluar në..

Faketojeni derisa ta arrini me të dhënat false

A e gjeni ndonjëherë veten duke ndërtuar një aplikacion të ri dhe keni nevojë për të dhëna testimi që duken dhe duken më realiste ose një grup i madh të dhënash për performancën e ngarkesës...

Si të përdorni kërkesën API në Python

Kërkesë API në GitHub për të marrë depot e përdoruesve duke përdorur Python. Në këtë artikull, unë shpjegoj procesin hap pas hapi për të trajtuar një kërkesë API për të marrë të dhëna nga..

Një udhëzues hap pas hapi për të zotëruar React

Në këtë artikull, do të mësoni se si të krijoni aplikacionin React, do të mësoni se si funksionon React dhe konceptet thelbësore që duhet të dini për të ndërtuar aplikacione React. Learning..

AI dhe Psikologjia — Pjesa 2

Në pjesën 2 të serisë sonë të AI dhe Psikologji ne diskutojmë se si makineritë mbledhin dhe përpunojnë të dhëna për të mësuar emocione dhe ndjenja të ndryshme në mendjen e njeriut, duke ndihmuar..

Esencialet e punës ditore të kodit tim VS

Shtesat e mia të preferuara - Git Graph 💹 Kjo shtesë është vërtet e mahnitshme, e përdor përpara se të filloj të punoj për të kontrolluar dy herë ndryshimet dhe degët më të fundit, mund të..

Pse Python? Zbulimi i fuqisë së gjithanshme të një gjiganti programues

Në peizazhin gjithnjë në zhvillim të gjuhëve të programimit, Python është shfaqur si një forcë dominuese. Rritja e tij meteorike nuk është rastësi. Joshja e Python qëndron në thjeshtësinë,..

Etiketa

Machine Learning JavaScript Data Science Artificial Intelligence Python Web Development Software Development Coding Deep Learning AI React Software Engineering Programming Languages Front End Development Java Nodejs Algorithms Data Tech Computer Science Development HTML AWS CSS Neural Networks Angular ChatGPT Code Typescript Tutorial Python Programming Learning To Code Developer Computer Vision NLP Open Source Productivity Reactjs