Modele gjuhësore dhe miq: Gorilla, HuggingGPT, TaskMatrix dhe më shumë

Çfarë ndodh kur u japim LLM-ve akses në mijëra modele të të mësuarit të thellë?

Kohët e fundit, ne kemi qenë dëshmitarë të një rritjeje të popullaritetit të modeleve të themelimit brenda kërkimit të të mësuarit të thellë. Modelet e mëdha të gjuhëve të trajnuara paraprakisht (LLM) kanë çuar në një paradigmë të re, në të cilën një model i vetëm mund të përdoret - me sukses të habitshëm - për të zgjidhur shumë probleme të ndryshme. Pavarësisht nga popullariteti i LLM-ve të përgjithshme, megjithatë, rregullimi i modeleve në një mënyrë specifike për detyrën tenton të tejkalojë qasjet që përdorin modelet e themelit. E thënë thjesht, modelet e specializuara janë ende shumë të vështira për t'u mposhtur! Duke u thënë këtë, ne mund të fillojmë të pyesim veten nëse fuqitë e modeleve të themelimit dhe modeleve të specializuara të të mësuarit të thellë mund të kombinohen. Brenda kësaj pasqyre, ne do të studiojmë kërkimet e fundit që integrojnë LLM-të me modele të tjera të specializuara të të mësuarit të thellë duke mësuar të thërrasin API-të e tyre të lidhura. Korniza që rezulton përdor modelin e gjuhës si një kontrollues të centralizuar që formon një plan për zgjidhjen e një detyrash komplekse, të lidhura me AI dhe delegon pjesë të specializuara të procesit të zgjidhjes tek modelet më të përshtatshme.

“Duke ofruar vetëm përshkrimet e modeleve, HuggingGPT mund të integrojë vazhdimisht dhe me lehtësi modele të ndryshme ekspertësh nga komunitetet e AI, pa ndryshuar asnjë strukturë ose cilësime të menjëhershme. Kjo mënyrë e hapur dhe e vazhdueshme na sjell një hap më afër realizimit të inteligjencës së përgjithshme artificiale.”— nga [2]

Sfondi

Përpara se të eksplorojmë se si modelet e gjuhës mund të integrohen me modele të tjera të të mësuarit të thellë, ne duhet të mbulojmë disa ide të sfondit, të tilla si mjetet LLM, rikthimi i informacionit dhe vetë-udhëzimi [11]. Për më shumë informacione të përgjithshme mbi modelet gjuhësore, shikoni burimet e mëposhtme.

Bazat e modelimit të gjuhës (GPT dhe GPT-2) [link]
Rëndësia e shkallës për modelet gjuhësore (GPT-3) [link]
LLM moderne [link] dhe të specializuara [link]
Inxhinieri e shpejtë [link] dhe e avancuar [link]

Përdorimi i mjeteve me…

Shiko gjithashtu:

Materiale të reja

Masterclass Coroutines: Kapitulli-3: Anulimi i korutinave dhe trajtimi i përjashtimeve.

Mirë se vini në udhëzuesin gjithëpërfshirës mbi Kotlin Coroutines! Në këtë seri artikujsh, unë do t'ju çoj në një udhëtim magjepsës, duke filluar nga bazat dhe gradualisht duke u thelluar në..

Faketojeni derisa ta arrini me të dhënat false

A e gjeni ndonjëherë veten duke ndërtuar një aplikacion të ri dhe keni nevojë për të dhëna testimi që duken dhe duken më realiste ose një grup i madh të dhënash për performancën e ngarkesës...

Si të përdorni kërkesën API në Python

Kërkesë API në GitHub për të marrë depot e përdoruesve duke përdorur Python. Në këtë artikull, unë shpjegoj procesin hap pas hapi për të trajtuar një kërkesë API për të marrë të dhëna nga..

Një udhëzues hap pas hapi për të zotëruar React

Në këtë artikull, do të mësoni se si të krijoni aplikacionin React, do të mësoni se si funksionon React dhe konceptet thelbësore që duhet të dini për të ndërtuar aplikacione React. Learning..

AI dhe Psikologjia — Pjesa 2

Në pjesën 2 të serisë sonë të AI dhe Psikologji ne diskutojmë se si makineritë mbledhin dhe përpunojnë të dhëna për të mësuar emocione dhe ndjenja të ndryshme në mendjen e njeriut, duke ndihmuar..

Esencialet e punës ditore të kodit tim VS

Shtesat e mia të preferuara - Git Graph 💹 Kjo shtesë është vërtet e mahnitshme, e përdor përpara se të filloj të punoj për të kontrolluar dy herë ndryshimet dhe degët më të fundit, mund të..

Pse Python? Zbulimi i fuqisë së gjithanshme të një gjiganti programues

Në peizazhin gjithnjë në zhvillim të gjuhëve të programimit, Python është shfaqur si një forcë dominuese. Rritja e tij meteorike nuk është rastësi. Joshja e Python qëndron në thjeshtësinë,..

Etiketa

Machine Learning JavaScript Data Science Artificial Intelligence Python Web Development Software Development Coding Deep Learning AI React Software Engineering Programming Languages Nodejs Algorithms Front End Development Java Data Computer Science Tech Development AWS HTML Angular CSS Neural Networks ChatGPT Python Programming Learning To Code Developer Code Typescript Tutorial NLP Open Source Productivity Computer Vision Learning