Të mësuarit e thellë dhe Mësimi me makinë, ne u mundësojmë makinave të mësojnë nga të dhënat, të kuptojnë modelin e tyre dhe të ofrojnë rezultate. Në vitet 1950-1960, studiuesit donin që makinat të mësonin në mënyrën se si njerëzit mësonin. Njerëzit mësojnë duke përdorur trurin i cili përbëhet nga blloqe ndërtimi të quajtur neurone. Kjo lindi rrjetet nervore. Rrjetet nervore imitojnë sjelljen biologjike të trurit të njeriut. Rrjeti i parë Neural (NN) ishte Perceptron dhe ishte shumë i thjeshtë dhe jo aq i mirë me performancën e tij. Në vitet 1980, Geoffrey Hinton shpiku konceptin e përhapjes së pasme, i cili mbështeti Rrjetet Neurale për të përmirësuar performancën.

Për të kuptuar më shumë rreth rrjeteve nervore, mendoni për fëmijërinë tuaj kur nuk dinim emra kafshësh. Kur e keni parë për herë të parë, familja juaj mund t'ju ketë thënë se ishte mace dhe gjithashtu t'ju ketë prezantuar disa veçori p.sh. macja ka veshë të mprehtë etj. Dhe truri juaj u trajnua me veçoritë e dhëna dhe herën tjetër macja juaj e identifikuar.

NN-të punojnë në të njëjtën mënyrë. Ne ofrojmë veçori, pas gëlltitjes së veçorive Rrjetet nervore mësojnë dhe kuptojnë modelet e pranishme në të dhëna dhe mësojnë nga ato modele për të ofruar rezultate.

Komponentët kryesorë të Arkitekturës së Rrjetit Neural

Të dhënat hyrëse përpunohen përmes shtresave të ndryshme të neuroneve artificiale të cilat janë të grumbulluara së bashku për të prodhuar daljen e dëshiruar. Ka kryesisht 3 shtresa në Rrjetet Neural.

Në diagram, x1, x2, x3 janë veçoritë me të cilat jemi futur në një shtresë. Kjo shtresë quhet shtresa hyrëse.

Rrjeti nervor me shumë shtresa

Shtresa hyrëse

Të dhënat që ne i ofrojmë modelit ngarkohen në shtresën hyrëse nga burime të jashtme si një skedar CSV ose ndonjë burim tjetër. Është e vetmja shtresë që është e dukshme në arkitekturën e Rrjetit Neural.

Shtresat e Fshehura

Shtresa e fshehur është përgjegjëse për të bërë të gjitha llogaritjet dhe nxjerrjen e veçorive nga të dhënat. Shtresa e fshehur mund të ketë gjithashtu shumë shtresa të fshehura të ndërlidhura. të cilat kërkojnë modele dhe veçori të fshehura. Për shembull, në përpunimin e imazhit, shtresat e para të fshehura ofrojnë veçori të nivelit më të lartë si skajet, format ose kufijtë. Nga ana tjetër, shtresa tjetër e fshehur kryen hapa komplekse si identifikimi i objekteve të plota (një makinë, një ndërtesë, një person).

Shtresa e daljes

Hyrja për shtresën dalëse vjen nga shtresa e fshehur dhe sjell parashikimin përfundimtar bazuar në të mësuarit e modelit. Është shtresa më e rëndësishme ku marrim rezultatin përfundimtar.

Siç e përmendëm më herët se arkitektura e Rrjetit Neural përbëhet nga njësi individuale të quajtura neuroneqë imitojnë sjelljen biologjike të trurit. Këtu janë përbërësit e ndryshëm të një neuroni.

Përbërësit e një neuroni

Input: Këto janë veçoritë që futen në modelin për të mësuar përmes shtresës hyrëse. Për shembull, hyrja në rastin e projektit që lidhet me identifikimin e objektit mund të jetë një grup që përmban vlera pikselësh të imazhit.

Pesha: Detyra e tij është të nxjerrë në pah veçoritë që janë të rëndësishme dhe që kontribuojnë më shumë në të mësuarit. Ai e bën këtë duke shumëzuar vlerën hyrëse dhe matricën e peshës. Për shembull, kur jemi duke punuar në analizën e ndjenjave, një fjalë negative do të ndikojë në modelin e vendimit në krahasim me fjalët e tjera neutrale.

Funksioni i transferimit: Roli i këtij funksioni është të integrojë hyrje të shumta në një vlerë të vetme dalëse në mënyrë që të mund të aplikohet funksioni i aktivizimit. Këtu bëjmë një përmbledhje të thjeshtë të të gjitha hyrjeve në funksionin e transferimit.

Funksioni i aktivizimit:Sjell jo-linearitet në punën e perceptroneve dhe transformon daljen midis 0 dhe 1. Nëse nuk prezantojmë funksionin e aktivizimit, dalja do të ishte thjesht një kombinim linear i vlerave hyrëse dhe do të nuk mund të sjellë jolinearitet. Në rast klasifikimi, le të jetë funksioni sigmoid që vepron si funksion aktivizimi. Ai do të aktivizojë neuronin në varësi të vlerës, nëse vlera e tij është ›0,5 , neuroni përkatës do të aktivizohet dhe nëse vlera ‹0,5 atëherë neuroni nuk do të aktivizohet.

Paragjykimi:Roli i paragjykimit është të zhvendosë vlerën e prodhuar nga funksioni i aktivizimit. Roli i tij është i ngjashëm me rolin e një konstante në një funksion linear.

Përmbledhje

Në këtë artikull, ne mësuam për bazat e një rrjeti nervor dhe eksploruam funksionimin dhe arkitekturën e një rrjeti nervor artificial.