Çfarë është një pyll i rastësishëm?

Ai ka një vend të rëndësishëm në mësimin e makinerive për të zgjidhur problemet e regresionit dhe klasifikimit. Është i dobishëm për prodhimin e rezultateve me një algoritëm të mësimit të makinës pa akordim hipermetrash.

Pra, çfarë do të thotë akordimi i hipermetrit?

Akordimi i hipermetrit në thelb do të thotë të kesh një çelës për algoritmet e mësimit të makinës. Sepse në këtë mënyrë, algoritmet e të mësuarit mund të zbatohen dhe mund të propozohet një model i lidhur për një zgjidhje më optimale të problemit. Kështu, sjellja e përgjithshme e një modeli të mësimit të makinës mund të kontrollohet.

Rezultatet e marra me çdo kombinim të modeleve vlerësohen dhe kështu vazhdojnë me më të mirët.

Pra, pse është i rëndësishëm pylli i rastësishëm?

Për ta kuptuar këtë, së pari duhet të kemi parasysh parimin e funksionimit të tij.

Pylli i rastësishëm përdor pragje të rastësishme për çdo veçori, ndryshe nga ajo që bën një pemë normale vendimi. Kjo shton rastësi shtesë në model kur ndahet një nyje. Kështu, shumë pemë vendimi do të krijohen në pyllin e rastësishëm.

Përveç strukturës nyja rrënjë — nyja e vendimit — nyja e gjetheve në pemët e vendimit, ajo siguron një strukturë me më shumë konsistencë për të zbuluar peshën parashikuese të çdo veçorie.

Për shembull, le të kemi një grup të dhënash trajnimi të përbërë nga fotografi të maceve dhe qenve. Pylli i rastësishëm do ta ndajë grupin e trajnimit në nënbashkësi. Nëngrupet formojnë pemë vendimi, të cilat variojnë me pyll të rastësishëm. Pemët e vendimit prodhojnë në vetvete një rezultat parashikimi. Dhe të gjitha këto janë në fakt të rëndësishme për rezultatin. Në pikën e fundit, pylli i rastësishëm jep rezultatin e parashikimit sipas rezultatit në shumicë.

Ne shohim se një pyll i rastësishëm performon dukshëm më mirë se një pemë e vetme vendimi.

Pyll i rastësishëm në anën e thjeshtësisë

Matja e ndikimit të çdo veçorie në parashikim është e lehtë me Sklearn. Treni Scikit-Learn ka nevojë për një pirg shumë të thjeshtë kodesh kur vlerëson grupin e të dhënave. Është e lehtë për të thirrur në aplikacion duke e importuar atë në klasifikues si më poshtë.

from sklearn.ensemble import RandomForestClassifier

# Create the model with 100 trees
model = RandomForestClassifier(n_estimators=100, 
                               random_state=RSEED, 
                               max_features = 'sqrt',
                               n_jobs=-1, verbose = 1)

# Fit on training data
model.fit(train, train_labels)

Në këtë mënyrë fillojnë të merren rezultatet me parametra të tillë si numri i nyjeve, numri i pemëve të vendimit dhe thellësia maksimale.

Ndërsa dhamë një shembull të strukturës së fuqishme të pyjeve të rastësishme, ne theksuam dy gjëra:

  1. I zbatueshëm si për problemet e regresionit ashtu edhe për problemet e klasifikimit
  2. Aftësia për të prodhuar rezultate të mira pa nevojën e kalibrimeve të hipermetrave

Në këtë pikë, do të doja të prekja shkurtimisht çështjen e rregullimit të hipermetrit për të marrë një rezultat më të mirë.

Kërkimi i rastësishëm shfaqet kur duam të optimizojmë pyllin e rastësishëm. Përdorimi i kësaj strukture sigurisht që nuk është aq i komplikuar. Kërkimi i rastësishëm së pari:

  • Zgjedh kombinimet e hipermetrave nga një rrjet
  • Më pas përdor këto zgjedhje për verifikim të kryqëzuar në të dhënat e trajnimit.
  • Më në fund kthen rezultatin më të mirë

Mund të bëhet e nevojshme rregullimi i hipermetrave kundër problemit të mbivendosjes.

Cila është zona më e zakonshme e përdorimit?

Shohim gjithnjë e më shumë pyje të rastësishme që po zbatohen në financa. Ai përdor algoritme të rastësishme pyjore për të analizuar aplikimet për kredi dhe për të zbuluar anomalitë në banka. Gjithashtu është e mundur të renditen karakteristikat e sjelljes së stoqeve. Shitësit e tregtisë elektronike mund të preferojnë algoritme pyjore të rastësishme për të kuptuar se çfarë sjelljeje shfaqin klientët e tyre më shumë në statistikat historike.

Dhe popullorisht, pylli i rastësishëm mund të shfaqet sërish në vlerësimin e një zhvillimi të ri në fushën e shëndetësisë bazuar në historitë e mëparshme të pacientëve. Ve aslinda esnek kullanimi sayesinde daha güclü bir model

Si duket në të ardhmen?

Ai do të vazhdojë të na ndihmojë të punojmë me periferitë dhe të bëjmë parashikime të forta me një variancë më të mesme, pasi ne marrim një vlerë mesatare të të gjitha pemëve të vendimeve me pyll të rastësishëm dhe mund të konsiderojmë faktorë që janë të rëndësishëm të veçorive.

Është gjithmonë e mundur të krijohen modele që performojnë më mirë. Këtu, përputhshmëria e strukturës me të dhëna të mëdha dhe rezultate të kënaqshme mund të merret parasysh kur bëhet vërtetimi më i mirë me pajisjet në dispozicion.

Duket se pylli i rastësishëm do të vazhdojë të jetë një nga modelet më të fuqishme dhe më të njohura të mësimit të makinerive në të ardhmen.

Faleminderit per leximin!