Nga Lukasz Burzawa, Abhishek Chaurasia dhe Eugenio Culurciello

Ne donim të testonim idenë se rrjeti nervor parashikues si CortexNet do të përfitonte nga trajnimi i njëkohshëm për:

1- Parashikoni kornizat e ardhshme në një video

2- përdorni trajnime kundërshtare për të dalluar kornizat reale në një video dhe ato të krijuara nga rrjeti

Ne e quajmë këtë Trajnim parashikues kundërshtar. Ideja është të përmirësohet aftësia e CortexNet për të trajnuar paraprakisht në më shumë të dhëna të paetiketuara dhe më pas të përdorë vetëm sasi të vogla të të dhënave të etiketuara.

Ne modifikuam "llojin tonë të ri të rrjetit nervor" në këtë mënyrë:

ne shtuam një klasifikues C për të parashikuar kornizën e rreme kundrejt asaj reale të krijuar. Diskriminuesi i rrjetit ose koduesi ynë D është si një rrjet nervor standard me shumë shtresa, dhe kështu vendosim klasifikuesin C pas të gjitha shtresave jeshile. Në vend të kësaj, shtresa blu gjeneruese ose dekoder është e dobishme për të rindërtuar imazhet ose paraqitjet e ardhshme. Më shumë detaje janë "këtu".

Për të trajnuar ne përdorim hapat e mëposhtëm:

1- ne trajnojmë rrjetin për të parashikuar kornizat e ardhshme ashtu si në një "CortexNet" të rregullt

2- pasi rrjeti mund të gjenerojë korniza të mira të ardhshme, ne trajnojmë klasifikuesin C për të parashikuar nëse hyrja ishte një kornizë reale tjetër ose një kornizë tjetër e gjeneruar

Ne kryejmë hapat 1,2 me radhë në çdo hap trajnimi.

Këto janë blloqet G dhe D në detaje:

Ne përdorim normalizimin e grupit midis konvertimit dhe ReLU.

Rezultatet: duke përdorur "data e të dhënave KTH", ne e trajnojmë paraprakisht rrjetin me metodën parashikuese kundërshtare të përshkruar më sipër, dhe më pas përdorëm 10% të të dhënave për të trajnuar klasifikuesin C duke ngrirë rrjetin e gjeneratorit .

Rasti 1: ne trajnuam të gjithë rrjetin e mbikëqyrur në 10% të të dhënave. Ne marrim një saktësi maksimale të testimit prej 60.43%

Rasti 2: ne përdorëm trajnimin parashikues kundërshtar (të rreme/reale dhe gjithashtu parashikon kornizat e ardhshme) në 100% të të dhënave, më pas akorduam mirë rrjetin në 10% të të dhënave. Ne marrim një saktësi maksimale të testimit prej 53.33%

Rasti 3: kemi përdorur vetëm trajnim parashikues (parashikoni kornizat e ardhshme, si CortexNet origjinal) në 100% të të dhënave, më pas akorduam mirë rrjetin në 10% të të dhënave. Ne marrim një saktësi maksimale të testimit prej 71.98%

Përfundim: siç mund ta shihni, ne prisnim që Rasti 2 të ishte më i mirë se rasti 3. Por nuk ndodhi:(53 vs 71% — rasti 2 vs 3). Konkluzioni ynë është se trajnimi Adversarial Predictive prodhon një konflikt midis trajnimit të klasifikuesit për klasifikimin e fals/realit dhe aftësive parashikuese të të gjithë rrjetit.

Para-trajnimi për 33% (62 vs 79% — rasti 2 vs 3) dhe 50% (71% vs 81% — rasti 2 vs 3) të të dhënave, në vend të vetëm 10% nuk ​​e ndryshoi situatën, dhe përdorimi i më shumë gjithsesi të dhënat e mposhtin qëllimin e trajnimit paraprak për të dhënat e paetiketuara…

Rreth Autorit

Unë kam pothuajse 20 vjet përvojë në rrjetet nervore si në harduer ashtu edhe në softuer (një kombinim i rrallë). Shihni rreth meje këtu: Medium, faqe në internet, Scholar, LinkedIn dhe më shumë…

Donacionet

Nëse ju duk i dobishëm ky artikull, ju lutemi merrni parasysh një "dhurim" për të mbështetur më shumë mësime dhe blogje. Çdo kontribut mund të bëjë diferencën!