Çfarë është word2vec dhe si ta ndërtoni atë nga e para?

Pjesa 4: Zbatimi i Skip-Gram - Naive Softmax

Kjo është pjesa 4 e një serie me 5 pjesë. Për të lundruar në pjesët e tjera, ju lutemi ndiqni lidhjet e mëposhtme:

Pjesa 1: Matrica e bashkë-ndodhjes
Pjesa 2: Qasjet e bazuara në mësim (CBOW dhe Skip-Gram)
Pjesa 3: Kampionimi negativ
Pjesa 4: Kapërce- Implementimi i Gramit — Naive Softmax
Pjesa 5: Zbatimi Skip-Gram — Mostrimi Negativ

Kjo pjesë e postimit e cila fokusohet në zbatimin e një modeli Skip-Gram word2vec. Këtu, ne llogarisim gradientët e funksionit objektiv në lidhje me parametra të ndryshëm, dhe më pas kalojmë duke bërë të njëjtën gjë për metodën kampionimi negativ.

Gradientët e funksionit objektiv: rasti naiv softmax

Këtu do të punojmë me funksionin objektiv të modelit Skip-Gram dhe do të llogarisim gradientët e tij në lidhje me vektorët e fjalëve qendër dhe jashtë në mënyrë që të mund të ecim në drejtim negativ të gradientëve gjatë procesin tonë të optimizimit. Siç u përkufizua më parë, probabiliteti i fjalës jashtë i dhënë një fjalë qendër, [d.m.th. P(O=0 | C=c) ] jepet si:

Më pas, ne mund të përcaktojmë një funksion objektiv të bazuar në naiv softmax për ta minimizuar gjatë procesit të optimizimit, i cili thjeshtohet më tej në një funksion probabiliteti log-negativ.

U në ekuacionin e mësipërm është një matricë, kolona k-të e së cilës (uk) përfaqëson vektorin e fjalës së fjalës jashtë të indeksuar nga k. Shënim: Kjo është referuar si W më parë.

Gradientet në lidhje me vektorin e fjalës qendrore, vc

Gradientët në lidhje me secilin nga vektorët e jashtëm, uw

Gradientët në lidhje me të gjithë vektorët e fjalëve të jashtme, U

Zbatimi i funksionit të humbjes me bazë naive-softmax dhe llogaritjes së gradientit

Tani që kemi nxjerrë gradientët e funksionit të humbjes në lidhje me parametrat e tij, ne mund ta zbatojmë atë shumë lehtë në python.

"Shko te Pjesa 5: Zbatimi i Skip-Gram - Kampionimi negativ"

"Eksploroni depon e GitHub"

Referencat

Mikolov, Tomas, Kai Chen, Greg Corrado dhe Jeffrey Dean. "Vlerësimi efikas i paraqitjeve të fjalëve në hapësirën vektoriale." arXiv paraprintimi arXiv:1301.3781 (2013).
Mikolov, Tomas, Ilya Sutskever, Kai Chen, Greg S. Corrado dhe Jeff Dean. "Përfaqësime të shpërndara të fjalëve dhe frazave dhe përbërjes së tyre." Përparimet në sistemet e përpunimit të informacionit nervor 26 (2013).
Rong, Xin. "Shpjegohet mësimi i parametrave word2vec." arXiv paraprintimi arXiv:1411.2738 (2014).
https://web.stanford.edu/class/cs224n/index.html

Shiko gjithashtu:

Materiale të reja

Masterclass Coroutines: Kapitulli-3: Anulimi i korutinave dhe trajtimi i përjashtimeve.

Mirë se vini në udhëzuesin gjithëpërfshirës mbi Kotlin Coroutines! Në këtë seri artikujsh, unë do t'ju çoj në një udhëtim magjepsës, duke filluar nga bazat dhe gradualisht duke u thelluar në..

Faketojeni derisa ta arrini me të dhënat false

A e gjeni ndonjëherë veten duke ndërtuar një aplikacion të ri dhe keni nevojë për të dhëna testimi që duken dhe duken më realiste ose një grup i madh të dhënash për performancën e ngarkesës...

Si të përdorni kërkesën API në Python

Kërkesë API në GitHub për të marrë depot e përdoruesve duke përdorur Python. Në këtë artikull, unë shpjegoj procesin hap pas hapi për të trajtuar një kërkesë API për të marrë të dhëna nga..

Një udhëzues hap pas hapi për të zotëruar React

Në këtë artikull, do të mësoni se si të krijoni aplikacionin React, do të mësoni se si funksionon React dhe konceptet thelbësore që duhet të dini për të ndërtuar aplikacione React. Learning..

AI dhe Psikologjia — Pjesa 2

Në pjesën 2 të serisë sonë të AI dhe Psikologji ne diskutojmë se si makineritë mbledhin dhe përpunojnë të dhëna për të mësuar emocione dhe ndjenja të ndryshme në mendjen e njeriut, duke ndihmuar..

Esencialet e punës ditore të kodit tim VS

Shtesat e mia të preferuara - Git Graph 💹 Kjo shtesë është vërtet e mahnitshme, e përdor përpara se të filloj të punoj për të kontrolluar dy herë ndryshimet dhe degët më të fundit, mund të..

Pse Python? Zbulimi i fuqisë së gjithanshme të një gjiganti programues

Në peizazhin gjithnjë në zhvillim të gjuhëve të programimit, Python është shfaqur si një forcë dominuese. Rritja e tij meteorike nuk është rastësi. Joshja e Python qëndron në thjeshtësinë,..

Etiketa

Machine Learning JavaScript Data Science Artificial Intelligence Python Web Development Software Development Coding Deep Learning AI React Programming Languages Software Engineering Java Nodejs Algorithms Front End Development Data Tech Computer Science Development AWS HTML CSS Neural Networks Angular ChatGPT Python Programming Learning To Code Developer Code Typescript Tutorial NLP Open Source Productivity Computer Vision Linear Regression