Hulumtim i ri interesant në lidhje me Computer Vision pjesa 4

Një sondazh mbi sulmin fizik të kundërshtarit në vizionin kompjuterik(arXiv)

Autor: Donghua Wang, Wen Yao, Tingsong Jiang, Guijiang Tang, Xiaoqian Chen

Përmbledhje:Në dekadën e kaluar, mësimi i thellë ka ndryshuar në mënyrë dramatike mënyrën tradicionale të veçorive të artizanatit me aftësi të forta të të mësuarit të veçorive, duke rezultuar në përmirësime të jashtëzakonshme të detyrave konvencionale. Megjithatë, rrjetet e thella nervore kohët e fundit janë demonstruar të prekshme ndaj shembujve kundërshtarë, një lloj mostrash me qëllim të keq të krijuar nga zhurma e vogël e projektuar me hollësi, të cilat mashtrojnë DNN-të për të marrë vendime të gabuara duke mbetur të padukshme për njerëzit. Shembujt kundërshtarë mund të ndahen në sulme kundërshtare dixhitale dhe sulme kundërshtare fizike. Sulmi dixhital kundërshtar kryhet kryesisht në mjedise laboratorike, duke u fokusuar në përmirësimin e performancës së algoritmeve të sulmit kundërshtar. Në të kundërt, sulmi kundërshtar fizik fokusohet në sulmimin e sistemeve DNN të vendosura në botën fizike, e cila është një detyrë më sfiduese për shkak të mjedisit kompleks fizik (d.m.th., shkëlqimi, mbyllja, etj.). Megjithëse mospërputhja midis shembujve të kundërshtarëve dixhitalë dhe atyre fizikë është e vogël, shembujt e kundërshtarëve fizikë kanë një dizajn specifik për të kapërcyer efektin e mjedisit kompleks fizik. Në këtë punim, ne shqyrtojmë zhvillimin e sulmeve fizike kundërshtare në detyrat e vizionit kompjuterik të bazuara në DNN, duke përfshirë detyrat e njohjes së imazhit, detyrat e zbulimit të objekteve dhe segmentimin semantik. Për hir të plotësimit të evolucionit të algoritmit, ne do të prezantojmë shkurtimisht punimet që nuk përfshijnë sulmin fizik kundërshtar. Ne fillimisht paraqesim një skemë kategorizimi për të përmbledhur sulmet aktuale kundërshtare fizike. Më pas diskutoni avantazhet dhe disavantazhet e sulmeve kundërshtare fizike ekzistuese dhe fokusohuni në teknikën e përdorur për të ruajtur kundërshtarin kur aplikohet në mjedisin fizik. Së fundi, ne vëmë në dukje çështjet e sulmeve aktuale kundërshtare fizike që duhet të zgjidhen dhe ofrojmë drejtime kërkimore premtuese.

2. Një sondazh mbi rrjetet nervore grafike dhe transformatorët grafikë në vizionin kompjuterik: një perspektivë e orientuar nga detyra(arXiv)

Autor :Chaoqi Chen, Yushuang Wu, Qiyuan Dai, Hong-Yu Zhou, Mutian Xu, Sibei Yang, Xiaoguang Han, Yizhou Yu

Përmbledhje:Rrjetet nervore grafike (GNN) kanë fituar vrull në mësimin e paraqitjes së grafikëve dhe kanë përmirësuar gjendjen e artit në një sërë fushash, si p.sh., analiza e rrjeteve sociale dhe sistemet e rekomanduesve), vizioni kompjuterik (\emph{p.sh.,} zbulimi i objekteve dhe mësimi i resë pikash) dhe përpunimi i gjuhës natyrore (\emph{p.sh., nxjerrja e marrëdhënieve dhe mësimi i sekuencës), për të përmendur disa. Me shfaqjen e Transformers në përpunimin e gjuhës natyrore dhe vizionin kompjuterik, Transformers grafike ngulitën një strukturë grafiku në arkitekturën e Transformer për të kapërcyer kufizimet e grumbullimit lokal të lagjes duke shmangur paragjykimet strikte induktive strukturore. Në këtë punim, ne paraqesim një përmbledhje gjithëpërfshirëse të GNN-ve dhe transformatorëve grafikë në vizionin kompjuterik nga një perspektivë e orientuar drejt detyrës. Në mënyrë të veçantë, ne i ndajmë aplikimet e tyre në vizionin kompjuterik në pesë kategori sipas modalitetit të të dhënave hyrëse, \emph{d.m.th.} imazhe natyrore 2D, video, të dhëna 3D, vizion + gjuhë dhe imazhe mjekësore. Në secilën kategori, ne i ndajmë më tej aplikacionet sipas një grupi detyrash vizioni. Një taksonomi e tillë e orientuar nga detyra na lejon të shqyrtojmë se si çdo detyrë trajtohet nga qasje të ndryshme të bazuara në GNN dhe sa mirë funksionojnë këto qasje. Bazuar në paraprakisht të nevojshme, ne ofrojmë përkufizimet dhe sfidat e detyrave, mbulimin e thelluar të qasjeve përfaqësuese, si dhe diskutimet në lidhje me njohuritë, kufizimet dhe drejtimet e ardhshme.

3. Vizioni kompjuterik i aplikuar në rregullimin e orientimit të mostrës në vend për analizën sasiore të SEM(arXiv)

Autor:Clay Klein, Chunfei Li

Abstrakt: Metodat e analizës sasiore të bazuara në përdorimin e një mikroskopi elektronik skanues (SEM), të tilla si spektroskopia me rreze X me shpërndarje energjie, shpesh kërkojnë që ekzemplarët të kenë një sipërfaqe të sheshtë të orientuar normalisht me rrezen elektronike. Procedurat in-situ për vendosjen e sipërfaqeve të sheshta mikroskopike në këtë orientim zakonisht mbështeten në metodat stereoskopike që matin ndryshimin në projeksionet e vektorit të sipërfaqes kur sipërfaqja anohet nga një kënd i njohur. Edhe pse këto metoda janë përdorur në të kaluarën, nuk ka një analizë të detajuar statistikore të pasigurive të përfshira në metoda të tilla, gjë që lë një pasiguri se si mund të orientohet saktësisht një ekzemplar. Këtu, ne paraqesim një derivim të parimeve të para të një metode të orientimit të mostrës dhe aplikojmë metodën tonë në një mostër të sheshtë për ta demonstruar atë. Ndryshe nga punimet e mëparshme, ne zhvillojmë një program vizioni kompjuterik duke përdorur Scale Invariant Feature Transform për të automatizuar dhe përshpejtuar procesin e bërjes së matjeve në imazhet tona SEM, duke mundësuar kështu një analizë të detajuar statistikore të metodës me një madhësi të madhe kampioni. Ne zbulojmë se metoda jonë e orientimit të mostrës është në gjendje të orientojë sipërfaqet e sheshta me saktësi të lartë dhe mund të sigurojë më tej informacion mbi gabimet e përfshira në operacionet standarde të rrotullimit dhe animit të SEM

Shiko gjithashtu:

Materiale të reja

Masterclass Coroutines: Kapitulli-3: Anulimi i korutinave dhe trajtimi i përjashtimeve.

Mirë se vini në udhëzuesin gjithëpërfshirës mbi Kotlin Coroutines! Në këtë seri artikujsh, unë do t'ju çoj në një udhëtim magjepsës, duke filluar nga bazat dhe gradualisht duke u thelluar në..

Faketojeni derisa ta arrini me të dhënat false

A e gjeni ndonjëherë veten duke ndërtuar një aplikacion të ri dhe keni nevojë për të dhëna testimi që duken dhe duken më realiste ose një grup i madh të dhënash për performancën e ngarkesës...

Si të përdorni kërkesën API në Python

Kërkesë API në GitHub për të marrë depot e përdoruesve duke përdorur Python. Në këtë artikull, unë shpjegoj procesin hap pas hapi për të trajtuar një kërkesë API për të marrë të dhëna nga..

Një udhëzues hap pas hapi për të zotëruar React

Në këtë artikull, do të mësoni se si të krijoni aplikacionin React, do të mësoni se si funksionon React dhe konceptet thelbësore që duhet të dini për të ndërtuar aplikacione React. Learning..

AI dhe Psikologjia — Pjesa 2

Në pjesën 2 të serisë sonë të AI dhe Psikologji ne diskutojmë se si makineritë mbledhin dhe përpunojnë të dhëna për të mësuar emocione dhe ndjenja të ndryshme në mendjen e njeriut, duke ndihmuar..

Esencialet e punës ditore të kodit tim VS

Shtesat e mia të preferuara - Git Graph 💹 Kjo shtesë është vërtet e mahnitshme, e përdor përpara se të filloj të punoj për të kontrolluar dy herë ndryshimet dhe degët më të fundit, mund të..

Pse Python? Zbulimi i fuqisë së gjithanshme të një gjiganti programues

Në peizazhin gjithnjë në zhvillim të gjuhëve të programimit, Python është shfaqur si një forcë dominuese. Rritja e tij meteorike nuk është rastësi. Joshja e Python qëndron në thjeshtësinë,..

Etiketa

Machine Learning JavaScript Data Science Artificial Intelligence Python Web Development Software Development Coding Deep Learning AI React Software Engineering Programming Languages Front End Development Java Nodejs Algorithms Data Tech Computer Science Development HTML AWS CSS Neural Networks Angular ChatGPT Code Typescript Tutorial Python Programming Learning To Code Developer Computer Vision NLP Open Source Productivity Reactjs