1. Një sondazh mbi sulmin fizik të kundërshtarit në vizionin kompjuterik(arXiv)

Autor: Donghua Wang, Wen Yao, Tingsong Jiang, Guijiang Tang, Xiaoqian Chen

Përmbledhje:Në dekadën e kaluar, mësimi i thellë ka ndryshuar në mënyrë dramatike mënyrën tradicionale të veçorive të artizanatit me aftësi të forta të të mësuarit të veçorive, duke rezultuar në përmirësime të jashtëzakonshme të detyrave konvencionale. Megjithatë, rrjetet e thella nervore kohët e fundit janë demonstruar të prekshme ndaj shembujve kundërshtarë, një lloj mostrash me qëllim të keq të krijuar nga zhurma e vogël e projektuar me hollësi, të cilat mashtrojnë DNN-të për të marrë vendime të gabuara duke mbetur të padukshme për njerëzit. Shembujt kundërshtarë mund të ndahen në sulme kundërshtare dixhitale dhe sulme kundërshtare fizike. Sulmi dixhital kundërshtar kryhet kryesisht në mjedise laboratorike, duke u fokusuar në përmirësimin e performancës së algoritmeve të sulmit kundërshtar. Në të kundërt, sulmi kundërshtar fizik fokusohet në sulmimin e sistemeve DNN të vendosura në botën fizike, e cila është një detyrë më sfiduese për shkak të mjedisit kompleks fizik (d.m.th., shkëlqimi, mbyllja, etj.). Megjithëse mospërputhja midis shembujve të kundërshtarëve dixhitalë dhe atyre fizikë është e vogël, shembujt e kundërshtarëve fizikë kanë një dizajn specifik për të kapërcyer efektin e mjedisit kompleks fizik. Në këtë punim, ne shqyrtojmë zhvillimin e sulmeve fizike kundërshtare në detyrat e vizionit kompjuterik të bazuara në DNN, duke përfshirë detyrat e njohjes së imazhit, detyrat e zbulimit të objekteve dhe segmentimin semantik. Për hir të plotësimit të evolucionit të algoritmit, ne do të prezantojmë shkurtimisht punimet që nuk përfshijnë sulmin fizik kundërshtar. Ne fillimisht paraqesim një skemë kategorizimi për të përmbledhur sulmet aktuale kundërshtare fizike. Më pas diskutoni avantazhet dhe disavantazhet e sulmeve kundërshtare fizike ekzistuese dhe fokusohuni në teknikën e përdorur për të ruajtur kundërshtarin kur aplikohet në mjedisin fizik. Së fundi, ne vëmë në dukje çështjet e sulmeve aktuale kundërshtare fizike që duhet të zgjidhen dhe ofrojmë drejtime kërkimore premtuese.

2. Një sondazh mbi rrjetet nervore grafike dhe transformatorët grafikë në vizionin kompjuterik: një perspektivë e orientuar nga detyra(arXiv)

Autor :Chaoqi Chen, Yushuang Wu, Qiyuan Dai, Hong-Yu Zhou, Mutian Xu, Sibei Yang, Xiaoguang Han, Yizhou Yu

Përmbledhje:Rrjetet nervore grafike (GNN) kanë fituar vrull në mësimin e paraqitjes së grafikëve dhe kanë përmirësuar gjendjen e artit në një sërë fushash, si p.sh., analiza e rrjeteve sociale dhe sistemet e rekomanduesve), vizioni kompjuterik (\emph{p.sh.,} zbulimi i objekteve dhe mësimi i resë pikash) dhe përpunimi i gjuhës natyrore (\emph{p.sh., nxjerrja e marrëdhënieve dhe mësimi i sekuencës), për të përmendur disa. Me shfaqjen e Transformers në përpunimin e gjuhës natyrore dhe vizionin kompjuterik, Transformers grafike ngulitën një strukturë grafiku në arkitekturën e Transformer për të kapërcyer kufizimet e grumbullimit lokal të lagjes duke shmangur paragjykimet strikte induktive strukturore. Në këtë punim, ne paraqesim një përmbledhje gjithëpërfshirëse të GNN-ve dhe transformatorëve grafikë në vizionin kompjuterik nga një perspektivë e orientuar drejt detyrës. Në mënyrë të veçantë, ne i ndajmë aplikimet e tyre në vizionin kompjuterik në pesë kategori sipas modalitetit të të dhënave hyrëse, \emph{d.m.th.} imazhe natyrore 2D, video, të dhëna 3D, vizion + gjuhë dhe imazhe mjekësore. Në secilën kategori, ne i ndajmë më tej aplikacionet sipas një grupi detyrash vizioni. Një taksonomi e tillë e orientuar nga detyra na lejon të shqyrtojmë se si çdo detyrë trajtohet nga qasje të ndryshme të bazuara në GNN dhe sa mirë funksionojnë këto qasje. Bazuar në paraprakisht të nevojshme, ne ofrojmë përkufizimet dhe sfidat e detyrave, mbulimin e thelluar të qasjeve përfaqësuese, si dhe diskutimet në lidhje me njohuritë, kufizimet dhe drejtimet e ardhshme.

3. Vizioni kompjuterik i aplikuar në rregullimin e orientimit të mostrës në vend për analizën sasiore të SEM(arXiv)

Autor:Clay Klein, Chunfei Li

Abstrakt: Metodat e analizës sasiore të bazuara në përdorimin e një mikroskopi elektronik skanues (SEM), të tilla si spektroskopia me rreze X me shpërndarje energjie, shpesh kërkojnë që ekzemplarët të kenë një sipërfaqe të sheshtë të orientuar normalisht me rrezen elektronike. Procedurat in-situ për vendosjen e sipërfaqeve të sheshta mikroskopike në këtë orientim zakonisht mbështeten në metodat stereoskopike që matin ndryshimin në projeksionet e vektorit të sipërfaqes kur sipërfaqja anohet nga një kënd i njohur. Edhe pse këto metoda janë përdorur në të kaluarën, nuk ka një analizë të detajuar statistikore të pasigurive të përfshira në metoda të tilla, gjë që lë një pasiguri se si mund të orientohet saktësisht një ekzemplar. Këtu, ne paraqesim një derivim të parimeve të para të një metode të orientimit të mostrës dhe aplikojmë metodën tonë në një mostër të sheshtë për ta demonstruar atë. Ndryshe nga punimet e mëparshme, ne zhvillojmë një program vizioni kompjuterik duke përdorur Scale Invariant Feature Transform për të automatizuar dhe përshpejtuar procesin e bërjes së matjeve në imazhet tona SEM, duke mundësuar kështu një analizë të detajuar statistikore të metodës me një madhësi të madhe kampioni. Ne zbulojmë se metoda jonë e orientimit të mostrës është në gjendje të orientojë sipërfaqet e sheshta me saktësi të lartë dhe mund të sigurojë më tej informacion mbi gabimet e përfshira në operacionet standarde të rrotullimit dhe animit të SEM