ChatGPT, dhe rastet e përdorimit të tij për ndërmarrje

A do ta prishë ChatGTP AI i ndërmarrjes?

Sfondi

ChatGPT ka pushtuar internetin ditët e fundit. Shumica e njerëzve janë habitur nga përgjigjet e tij. Nëse ende nuk e keni provuar ChatGPT, ai është i disponueshëm me një regjistrim falas në faqen e internetit të OpenAI: https://chat.openai.com/

Nëse nuk vini nga një sfond i Përpunimit të Gjuhës Natyrore (NLP), përgjigjet e ChatGPT mund të duken të mahnitshme. Pra, le të thellohemi pak më thellë në detajet teknike.

Arkitekturat e transformatorëve

NLP është ndërprerë në vitet e fundit nga dy modele masive të të mësuarit të thellë bazuar në arkitekturën e transformatorit: BERT e Google (Përfaqësimet e koduesit dydrejtues nga transformatorët) dhe GPT (Trajnimi paraprak gjenerues) nga Open AI.

Avantazhi kryesor i modeleve GPT është vëllimi i madh i të dhënave mbi të cilat janë trajnuar. Për shembull, GPT-3: modeli i gjeneratës së tretë GPT, u trajnua me 175 miliardë parametra. Kështu, GPT-3 vepron një model i para-trajnuar i gjuhës së madhe (LLM) që mund të rregullohet mirë me shumë pak të dhëna për të përmbushur detyra të reja NLP, si p.sh.

Pyetje-Përgjigje (QA)/Chatbots
Nxjerrja dhe përmbledhja e tekstit
Korrigjim automatik
Përkthimi
Klasifikimi
Gjenerimi i gjuhëve natyrore (NLG)

ChatGPT është kështu aplikacioni Chatbot [1] i GPT-3 LLM. Ai bazohet në InstructGPT të lëshuar nga OpenAI në janar.

Përmirësimi kryesor është se ChatGPT është në gjendje të kryejë bisedë të vazhdueshme, domethënë, kujton bisedat e mëparshme dhe mund t'i riprodhojë ato te përdoruesi. Kjo është ende shumë e kufizuar në krahasim me kërkimet e lidhura ku biseda historike merret parasysh nga një Chatbot për ta çuar bisedën drejt një qëllimi, p.sh., duke bërë një shitje [2, 3].

Pra, ChatGPT ndjek një histori të pasur të Kërkimit NLP dhe nuk është një teknikë e re revolucionare që u bë e njohur papritur një ditë të bukur.

Aftësitë dhe Kufizimet

Me këtë sfond teknik, le të përpiqemi të analizojmë aftësitë dhe kufizimet e ChatGPT.

AI gjeneruese

Çdo Chatbot [1], në një nivel shumë të lartë, përbëhet nga hapat e mëposhtëm:

Kuptimi i gjuhës natyrore (NLU): Duke pasur parasysh një pyetje të përdoruesit, fillimisht kuptoni qëllimin e përdoruesit;
Merr përmbajtjen përkatëse nga baza themelore e njohurive (KB);
Gjenerimi i gjuhës natyrore (NLG): Sintetizoni përgjigjen dhe përgjigjuni përdoruesit;
Mbani kontekstin e bisedës për t'iu përgjigjur/personalizuar çdo bisedë vijuese.

Arsyeja pse ChatGPT u bë virale është për shkak të aftësive të tij gjeneruese.

Ngjashëm me zhurmën e modelit të mësimit të thellë tekst-për-imazh të Stable Diffusion, të cilin njerëzit e përdorin (ose po e përdorin ende) për të gjeneruar art të ri të ‘ndikuar’ nga stilet e artistëve të famshëm; shumica e njerëzve ende përdorin ChatGPT për të gjeneruar përgjigje në stilin e personazheve të tyre të preferuar teatrale.

Aspekti gjenerues, qoftë për tekst, imazhe apo video; bazohet në Rrjetet kundërshtare gjeneruese (GAN)[4]. Në mënyrë intuitive, një GAN mund të konsiderohet si një lojë midis dy rrjeteve: Një rrjet gjenerator dhe një rrjet të dytë Klasifikues. Një Klasifikues mund të jetë, p.sh., një rrjet i klasifikimit të imazheve të bazuara në Rrjetin Neural Konvolutional (CNN); duke dalluar mostrat si të ardhura nga shpërndarja aktuale ose nga Gjeneruesi. Sa herë që Klasifikuesi është në gjendje të tregojë një imazh të rremë, domethënë vëren një ndryshim midis dy shpërndarjeve; Gjeneratori rregullon parametrat e tij në përputhje me rrethanat. Në fund (në teori), Klasifikuesi nuk do të jetë në gjendje të dallojë, duke nënkuptuar që Gjeneruesi është më pas në gjendje të riprodhojë grupin origjinal të të dhënave.

Rastet e përdorimit të NLG nga ndërmarrjet:
Siç u përmend më parë, aplikacionet ChatGPT si një mjet i pastër për gjenerimin e përmbajtjes së lojës për marketing, në përgjithësi çdo komunikim i brendshëm ose i jashtëm i organeve, është i qartë dhe përçarës.

Sidoqoftë, përveç kësaj, i vetmi vend ku kemi parë një aplikim të NLG në ndërmarrje është gjenerimi i përmbledhjeve tekstuale të figurave dhe raporteve.

ChatGPT, në të ardhmen, mund të interpretojë të dhënat e kompanisë (p.sh., shifrat e shitjeve, përgjigjet e marketingut) dhe të gjenerojë tekst të shkurtër narrativ për audiencat e synuara - duke mundësuar raporte të shpejta dhe të lehta për t'u lexuar.

Sfida kryesore e modeleve Image-to-Text sot nuk është aftësia për të gjeneruar përshkrime tekstuale të figurave; por që ato duhet të jenë shumë të personalizuara për të nxjerrë në pah njohuritë specifike që kërkon një përdorues biznesi, duke marrë në kontekst domenin org/njësi biznesi.

Një rast përdorimi i lidhur këtu është kërkimi i bazave të të dhënave në gjuhën natyrore.

Me tekst-në-SQL, qëllimi kryesor ka qenë rikrijimi i paradigmës së kërkimit SQL në bazën e të dhënave, në atë që përdor pyetjet e gjuhës natyrore (NLQ). Fusha quhet Ndërfaqja e Gjuhëve Natyrore për Bazat e të Dhënave (NLIDB), dhe unë e kam trajtuar tashmë në detaje në një artikull të mëparshëm [5], duke përfshirë ndikimin e LLM-ve.

Kuptimi dhe mirëdashja e përdoruesit

Mirëdashësia për përdoruesit e ChatGPT është një tjetër arsye e rëndësishme që qëndron në themel të popullaritetit të tij.

Enterprise Chatbots sot janë shumë të fokusuar në detyra / domen. Krijuesit me eksperiencë të Chatbot do të dinë se si ne gjithmonë kemi frikë nga "e panjohura" - pyetjet e përgjithshme / të papritura që përdoruesi mund të përfundojë duke bërë. Pra, ne shpenzojmë përpjekje të konsiderueshme në dizajnimin e rrjedhës / udhëzimin e përdoruesit për të bërë pyetje përkatëse.

Për përdoruesin mesatar, kjo funksionon si një pengesë në lidhje me adoptimin e chatbot, ku ata duhet të mendojnë dy herë (ose shumë herë) për të siguruar që po bëjnë pyetjet e duhura. Në thelb, shpenzoni kohë dhe përpjekje për t'i inkuadruar siç duhet pyetjet.

ChatGPT e ndryshoi lojën këtu duke e lejuar përdoruesin të pyesë çdo gjë - duke ulur pengesën e hyrjes. Kjo u plotësua nga ChatGPT duke u përgjigjur me rojet e duhura të sigurisë në vend.

OpenAI e përshkruan këtë pasi ChatGPT mund të "përgjigjet në pyetjet vijuese, të pranojë gabimet e tij, të sfidojë premisat e pasakta dhe të refuzojë kërkesat e papërshtatshme". Sado e vështirë të kuptosh qëllimin e përdoruesit, është po aq sfiduese të diferencosh kur përdoruesi po përpiqet të manipulojë/sulmojë chatbot-in – p.sh., për robotët e jashtëm (përballë konsumatorit). Dhe, ChatGPT e kryen shumë mirë këtë 'detyrë klasifikimi'.

Më lejoni gjithashtu të përfitoj nga ky rast për të thënë se ChatGPT nuk do t'i bëjë të tepërta chatbot-et e ndërmarrjeve që ne kemi ndërtuar në AWS Lex, Microsoft LUIS, Google Dialogflow në çdo kohë. Ato janë projektuar me kujdes (të kuruar me dorë) për raste përdorimi të fokusuar në domen të ngushtë / dhe do të jetë e vështirë të rregullohet një LLM e përgjithshme për të arritur atë nivel saktësie për ato grupe specifike pyetjesh - pa ndërhyrje manuale.

Kërkimi i ndërmarrjes
Duke u fokusuar në aspektin e nxjerrjes së informacionit, shumë njerëz e kanë përdorur atë për të kërkuar informacion. Këtu gjithashtu, ChatGPT shkëlqen ku është në gjendje të marrë jo vetëm përgjigje tekstuale nga dokumentet / faqet e internetit, por edhe t'u përgjigjet pyetjeve komplekse që lidhen me programimin, ekuacionet matematikore, etj.

Kjo ka çuar në shumë diskutime nëse ChatGPT do të prishë kërkimin / zëvendësojë Google? A do ta kalojë Bing Search më në fund Google Search, duke pasur parasysh se OpenAI është në pronësi të Microsoft.

Përgjigja është: Jo! , dhe kjo është kryesisht sepse nuk është një krahasim mollë me mollë (apo edhe, portokall me portokall).

Kërkimi ka të bëjë me marrjen e informacionit ekzistues, me lidhje me burimin. Pra, pjesa më e mahnitshme e ChatGPT, d.m.th. e., pjesa gjeneruese nuk është e rëndësishme këtu. Dhe, kur bëhet fjalë për pjesën e rikthimit, shumica e motorëve të kërkimit, p.sh. g., Google, tashmë përdor BERT [6] ose Arkitektura të ngjashme të bazuara në Transformer.

Mendoj se ajo që i zhgënjen më shumë njerëzit janë rezultatet e 'reklamave' që Google i shtyn në krye, sesa rezultatet më të rëndësishme.Me pak fjalë, asgjë nuk do të ndryshojë në mënyrë dramatike, përveç madhësisë së LLM-ve themelore .

Pjesa gjeneruese (edhe nëse disi e paparashikueshme) mund të jetë ende e rëndësishme nga këndvështrimi i kërkimit, për sa kohë që ChatGPT mund të lidhë përgjigjet e tij me artikujt burimor. Fatkeqësisht, kjo është më e lehtë të thuhet sesa të bëhet dhe është pjesë e një problemi më të madh të AI Etike / AI e shpjegueshme [7] (e referuar si 'përfshirje tekstuale' në kontekstin e NLP), ku është e paqartë se cila pjesë/artikull i trajnimit themelor grupi i të dhënave kontribuoi në një përgjigje.

Së fundi, aspekti "freski" i "Kërkimit". Një pjesë e madhe e kërkimit tonë lidhet me ngjarjet e reja/të fundit dhe artikujt e tyre përkatës. Kjo është e zbatueshme si për motorët e përgjithshëm të kërkimit si Google, ashtu edhe për skenarët e Kërkimit të Ndërmarrjeve [8]. Pra, LLM-të themelore do të duhet të ritrajnohen vazhdimisht me informacione të reja për të kthyer përgjigjet e përditësuara. Këtu, është e rëndësishme të kuptohet se ndërsa LLM-të shpesh mendohen për Modele Vetë-Mësuese,

një sasi e konsiderueshme përpjekjesh manuale është përfshirë në formën e reagimeve të përdoruesve, për të përmirësuar saktësinë e ChatGPT duke përdorur Mësimi i Përforcimit [9].

Përmirësim i vazhdueshëm (por manual).

Mësimi përforcues (RL) është në gjendje të arrijë qëllime komplekse duke maksimizuar një funksion shpërblimi në kohë reale. Funksioni i shpërblimit funksionon ngjashëm me nxitjen e një fëmije me karamele dhe goditje me goditje, në mënyrë që algoritmi penalizohet kur merr një vendim të gabuar dhe shpërblehet kur merr një vendim të duhur - ky është përforcim. Aspekti i përforcimit gjithashtu e lejon atë të përshtatet më shpejt me ndryshimet në kohë reale në ndjenjën e përdoruesit.

Në thelb të kësaj qasjeje [10] është një model pikësh, i cili është trajnuar për të shënuar tuples pyetje-përgjigje chatbot bazuar në reagimet (manuale) të përdoruesve. Rezultatet e parashikuara nga ky model përdoren si shpërblime për agjentin RL. Optimizimi i politikave proksimale përdoret më pas si hapi i fundit për të akorduar më tej ChatGPT.

Me pak fjalë, ritrajnimi ose shtimi i informacionit të ri në LLM nuk është plotësisht i automatizuar. RL ndihmon në kryerjen e kësaj në një mënyrë të synuar; megjithatë ndërhyrja manuale nevojitet ende për të arritur këtë nivel saktësie dhe për t'i mbrojtur ata nga paragjykimet/manipulimet.

Përfundim

ChatGPT është një moment historik i rëndësishëm në udhëtimin e evolucionit të AI. Aftësitë e tij gjeneruese janë të mahnitshme, ku është në gjendje të gjenerojë tekst "si njeriu" në një mënyrë shumë bindëse. Pra, aftësitë e tij për të gjeneruar përmbajtje për skenarët e marketingut dhe komunikimit janë shkatërruese. Sidoqoftë, kjo është gjithashtu pjesa më e frikshme dhe një makth absolut nga pikëpamja e Pronësisë Intelektuale (IP) - si për artistët ashtu edhe për krijuesit e përmbajtjes. Pra, ne mund të shpresojmë vetëm që rregullatorët do të veprojnë menjëherë dhe mjetet/rregulloret do të ndjekin me të njëjtën shpejtësi si teknologjia bazë për të kufizuar abuzimin e saj.

Është gjithashtu e rëndësishme të kuptohet se ChatGPT është një hap në rritje në Kërkimin NLP. Fuqia e tij vjen nga kombinimi i një numri teknikash themelore, p.sh., Transformers, GANs, Reinforcement Learning. Pra, nuk do të çojë në ndonjë ndërprerje të papritur të NLP në ndërmarrje. Përfitimet do të pasojnë për sa i përket përmirësimeve të detyrave themelore të NLP, p.sh., pyetje dhe përgjigje, përkthim, përmbledhje; e cila ngadalë do të përhapet në rastet e përdorimit të ndërmarrjes.

Shumica e ndërmarrjeve sot nuk kanë aftësitë dhe aftësitë e infrastrukturës për të shfrytëzuar blloqet kryesore të teknologjisë së vetë ChatGPT. Kështu që do të nevojitet punë e mëtejshme në formën e mjeteve të pjekura, API-ve, etj., që do të lehtësojnë procesin e rregullimit të LLM-ve të trajnuara paraprakisht për të dhënat dhe domenet specifike të ndërmarrjes.

Artikuj të ngjashëm në serinë ChatGPT:

Kontekstualizimi i modeleve të mëdha gjuhësore (LLM) me të dhënat e ndërmarrjes, https://medium.datadriveninvestor.com/contextualizing-large-language-models-llms-with-enterprise-data-419e252fcbb7
Rreziqet e privatësisë së ChatGPT, https://medium.datadriveninvestor.com/privacy-risks-of-chatgpt-3f838320954a

Referencat

D. Biswas. Chatbots dhe kërkimi i gjuhës natyrore. në Drejt Shkencës së të Dhënave, 2020, https://towardsdatascience.com/chatbots-natural-language-search-cc097f671b2b
Jianfeng Liu, Feiyang Pan, Ling Luo. GoChat: Chatbots të orientuar drejt qëllimit me mësim të përforcimit hierarkik. (2020) https://arxiv.org/abs/2005.11729
Janarthanan Rajendran, Jonathan K. Kummerfeld, Satinder Singh. Të mësosh të mësosh Dialog i orientuar nga qëllimi nga fundi në fund nga detyrat përkatëse të dialogut(2021). https://arxiv.org/abs/2110.15724
C. Pak. Rrjetet kundërshtare gjeneruese për gjenerimin e të dhënave sintetike: Një studim krahasues. https://unece.org/sites/default/files/2021-12/SDC2021_Day2_Little_AD.pdf
D. Biswas. BI bisede: Teksti në SQL. në Drejt Shkencës së të Dhënave, 2022, https://towardsdatascience.com/conversational-bi-text-to-sql-c9f52a89acc5
Google sjell BERT për të përmirësuar rezultatet e kërkimit, 2019, https://techcrunch.com/2019/10/25/google-brings-in-bert-to-improve-its-search-results/
D. Biswas. Inteligjenca artificiale etike: implikimet e saj për rastet e përdorimit dhe qeverisjen e inteligjencës artificiale në ndërmarrje. në Towards Data Science, 2021, https://towardsdatascience.com/ethical-ai-its-implications-for-enterprise-ai-use-cases-and-governance-81602078f5db
L. Baligand, D. Biswas. Ndërtimi i një motori kërkimi të gjuhës natyrore të ndërmarrjes me ElasticSearch dhe DrQA të Facebook-ut. Konferenca e 10-të "Berlin Buzzwords", 2019.
A. Barto, R.S. Sutton. Të mësuarit përforcues: një hyrje. MIT Press, Kembrixh, MA, 2018, http://incompleteideas.net/book/RLbook2018.pdf
E. Ricciardelli, D. Biswas. Chatbot vetë-përmirësues bazuar në të mësuarit përforcues. në: Konferenca e 4-të Multidisiplinare për të mësuarit përforcues dhe vendimmarrje, 2019. https://towardsdatascience.com/self-improving-chatbots-based-on-reinforcement-learning-75cca62debce

Abonohu në DDIntel Këtu.

Vizitoni faqen tonë të internetit këtu: https://www.datadriveninvestor.com

Bashkohuni me rrjetin tonë këtu: https://datadriveninvestor.com/collaborate

Shiko gjithashtu:

Materiale të reja

Masterclass Coroutines: Kapitulli-3: Anulimi i korutinave dhe trajtimi i përjashtimeve.

Mirë se vini në udhëzuesin gjithëpërfshirës mbi Kotlin Coroutines! Në këtë seri artikujsh, unë do t'ju çoj në një udhëtim magjepsës, duke filluar nga bazat dhe gradualisht duke u thelluar në..

Faketojeni derisa ta arrini me të dhënat false

A e gjeni ndonjëherë veten duke ndërtuar një aplikacion të ri dhe keni nevojë për të dhëna testimi që duken dhe duken më realiste ose një grup i madh të dhënash për performancën e ngarkesës...

Si të përdorni kërkesën API në Python

Kërkesë API në GitHub për të marrë depot e përdoruesve duke përdorur Python. Në këtë artikull, unë shpjegoj procesin hap pas hapi për të trajtuar një kërkesë API për të marrë të dhëna nga..

Një udhëzues hap pas hapi për të zotëruar React

Në këtë artikull, do të mësoni se si të krijoni aplikacionin React, do të mësoni se si funksionon React dhe konceptet thelbësore që duhet të dini për të ndërtuar aplikacione React. Learning..

AI dhe Psikologjia — Pjesa 2

Në pjesën 2 të serisë sonë të AI dhe Psikologji ne diskutojmë se si makineritë mbledhin dhe përpunojnë të dhëna për të mësuar emocione dhe ndjenja të ndryshme në mendjen e njeriut, duke ndihmuar..

Esencialet e punës ditore të kodit tim VS

Shtesat e mia të preferuara - Git Graph 💹 Kjo shtesë është vërtet e mahnitshme, e përdor përpara se të filloj të punoj për të kontrolluar dy herë ndryshimet dhe degët më të fundit, mund të..

Pse Python? Zbulimi i fuqisë së gjithanshme të një gjiganti programues

Në peizazhin gjithnjë në zhvillim të gjuhëve të programimit, Python është shfaqur si një forcë dominuese. Rritja e tij meteorike nuk është rastësi. Joshja e Python qëndron në thjeshtësinë,..

Etiketa

Machine Learning JavaScript Data Science Artificial Intelligence Python Web Development Software Development Coding Deep Learning AI React Programming Languages Software Engineering Java Nodejs Algorithms Front End Development Data Tech Computer Science Development AWS HTML CSS Neural Networks Angular ChatGPT Python Programming Learning To Code Developer Code Typescript Tutorial NLP Open Source Productivity Computer Vision Linear Regression