Programim dhe zhvillim, javascript, python, php, html

Si të përcaktohet gjatësia e sekuencës së vëzhgimit për HMM në njohjen e të folurit

Po mësoj përsëri se si të përdor Modelet e Fshehura Markov për njohjen e të folurit dhe kam një pyetje. Duket se shumica/të gjitha diskutimet e përdorimit të HMM-ve marrin në konsideratë rastin e një sekuence të njohur vëzhgimi: [O1, O2, O3,...,OT] ku T është një numër i njohur. Megjithatë, nëse do të përpiqeshim të përdornim një HMM të trajnuar në të folur në kohë reale, ose në një skedar WAV ku dikush po fliste një fjali pas tjetrës, si e zgjedh saktësisht vlerën e T? Me fjalë të tjera, si mund të dihet kur folësi ka përfunduar një fjali dhe ka filluar një tjetër? A përdor një HMM praktike për njohjen e të folurit vetëm një vlerë fikse për T dhe rillogarit periodikisht sekuencën e gjendjes optimale deri në vëzhgimin aktual duke përdorur një dritare me madhësi fikse me gjatësi T në të kaluarën? Apo ka ndonjë mënyrë më të mirë për të zgjedhur në mënyrë dinamike T në çdo rast kohe?


Përgjigjet:


1

A përdor një HMM praktike për njohjen e të folurit vetëm një vlerë fikse për T dhe rillogarit periodikisht sekuencën e gjendjes optimale deri në vëzhgimin aktual duke përdorur një dritare me madhësi fikse me gjatësi T në të kaluarën?

Algoritmi i deshifrimit Viterbi funksionon kornizë për kornizë, kështu që ju thjesht përsërisni mbi korniza, mund të përsërisni pafundësisht derisa matrica e prapambetur të mbushë të gjithë kujtesën.

Algoritmi i trajnimit merr parasysh audiot që përgatiten para stërvitjes, zakonisht 1-30 sekonda. Për trajnim, gjatësia e audios është e njohur tashmë.

si e di njeriu kur folësi ka përfunduar një fjali dhe ka filluar një tjetër?

Këtu ka strategji të ndryshme. Dekoduesit kërkojnë për heshtjen për t'u mbështjellë rreth dekodimit. Heshtja nuk do të thotë ndërprerje midis fjalive, nuk mund të ketë fare ndërprerje midis fjalive. Mund të ketë edhe pushim në mes të një fjalie.

Pra, për të gjetur dekoderin e heshtjes, mund të përdorni algoritmin e pavarur të zbulimit të aktivitetit të zërit dhe të prishet kur VAD zbulon heshtjen ose dekoderi mund të analizojë informacionin e prapavijës për të vendosur nëse është shfaqur heshtja. Metoda e dytë është pak më e besueshme.

17.09.2019
Materiale të reja

Masterclass Coroutines: Kapitulli-3: Anulimi i korutinave dhe trajtimi i përjashtimeve.
Mirë se vini në udhëzuesin gjithëpërfshirës mbi Kotlin Coroutines! Në këtë seri artikujsh, unë do t'ju çoj në një udhëtim magjepsës, duke filluar nga bazat dhe gradualisht duke u thelluar në..

Faketojeni derisa ta arrini me të dhënat false
A e gjeni ndonjëherë veten duke ndërtuar një aplikacion të ri dhe keni nevojë për të dhëna testimi që duken dhe duken më realiste ose një grup i madh të dhënash për performancën e ngarkesës...

Si të përdorni kërkesën API në Python
Kërkesë API në GitHub për të marrë depot e përdoruesve duke përdorur Python. Në këtë artikull, unë shpjegoj procesin hap pas hapi për të trajtuar një kërkesë API për të marrë të dhëna nga..

Një udhëzues hap pas hapi për të zotëruar React
Në këtë artikull, do të mësoni se si të krijoni aplikacionin React, do të mësoni se si funksionon React dhe konceptet thelbësore që duhet të dini për të ndërtuar aplikacione React. Learning..

AI dhe Psikologjia — Pjesa 2
Në pjesën 2 të serisë sonë të AI dhe Psikologji ne diskutojmë se si makineritë mbledhin dhe përpunojnë të dhëna për të mësuar emocione dhe ndjenja të ndryshme në mendjen e njeriut, duke ndihmuar..

Esencialet e punës ditore të kodit tim VS
Shtesat e mia të preferuara - Git Graph 💹 Kjo shtesë është vërtet e mahnitshme, e përdor përpara se të filloj të punoj për të kontrolluar dy herë ndryshimet dhe degët më të fundit, mund të..

Pse Python? Zbulimi i fuqisë së gjithanshme të një gjiganti programues
Në peizazhin gjithnjë në zhvillim të gjuhëve të programimit, Python është shfaqur si një forcë dominuese. Rritja e tij meteorike nuk është rastësi. Joshja e Python qëndron në thjeshtësinë,..