A do ta prishë ChatGTP AI i ndërmarrjes?

Sfondi

ChatGPT ka pushtuar internetin ditët e fundit. Shumica e njerëzve janë habitur nga përgjigjet e tij. Nëse ende nuk e keni provuar ChatGPT, ai është i disponueshëm me një regjistrim falas në faqen e internetit të OpenAI: https://chat.openai.com/

Nëse nuk vini nga një sfond i Përpunimit të Gjuhës Natyrore (NLP), përgjigjet e ChatGPT mund të duken të mahnitshme. Pra, le të thellohemi pak më thellë në detajet teknike.

Arkitekturat e transformatorëve

NLP është ndërprerë në vitet e fundit nga dy modele masive të të mësuarit të thellë bazuar në arkitekturën e transformatorit: BERT e Google (Përfaqësimet e koduesit dydrejtues nga transformatorët) dhe GPT (Trajnimi paraprak gjenerues) nga Open AI.

Avantazhi kryesor i modeleve GPT është vëllimi i madh i të dhënave mbi të cilat janë trajnuar. Për shembull, GPT-3: modeli i gjeneratës së tretë GPT, u trajnua me 175 miliardë parametra. Kështu, GPT-3 vepron një model i para-trajnuar i gjuhës së madhe (LLM) që mund të rregullohet mirë me shumë pak të dhëna për të përmbushur detyra të reja NLP, si p.sh.

  • Pyetje-Përgjigje (QA)/Chatbots
  • Nxjerrja dhe përmbledhja e tekstit
  • Korrigjim automatik
  • Përkthimi
  • Klasifikimi
  • Gjenerimi i gjuhëve natyrore (NLG)

ChatGPT është kështu aplikacioni Chatbot [1] i GPT-3 LLM. Ai bazohet në InstructGPT të lëshuar nga OpenAI në janar.

Përmirësimi kryesor është se ChatGPT është në gjendje të kryejë bisedë të vazhdueshme, domethënë, kujton bisedat e mëparshme dhe mund t'i riprodhojë ato te përdoruesi. Kjo është ende shumë e kufizuar në krahasim me kërkimet e lidhura ku biseda historike merret parasysh nga një Chatbot për ta çuar bisedën drejt një qëllimi, p.sh., duke bërë një shitje [2, 3].

Pra, ChatGPT ndjek një histori të pasur të Kërkimit NLP dhe nuk është një teknikë e re revolucionare që u bë e njohur papritur një ditë të bukur.

Aftësitë dhe Kufizimet

Me këtë sfond teknik, le të përpiqemi të analizojmë aftësitë dhe kufizimet e ChatGPT.

AI gjeneruese

Çdo Chatbot [1], në një nivel shumë të lartë, përbëhet nga hapat e mëposhtëm:

  1. Kuptimi i gjuhës natyrore (NLU): Duke pasur parasysh një pyetje të përdoruesit, fillimisht kuptoni qëllimin e përdoruesit;
  2. Merr përmbajtjen përkatëse nga baza themelore e njohurive (KB);
  3. Gjenerimi i gjuhës natyrore (NLG): Sintetizoni përgjigjen dhe përgjigjuni përdoruesit;
  4. Mbani kontekstin e bisedës për t'iu përgjigjur/personalizuar çdo bisedë vijuese.

Arsyeja pse ChatGPT u bë virale është për shkak të aftësive të tij gjeneruese.

Ngjashëm me zhurmën e modelit të mësimit të thellë tekst-për-imazh të Stable Diffusion, të cilin njerëzit e përdorin (ose po e përdorin ende) për të gjeneruar art të ri të ‘ndikuar’ nga stilet e artistëve të famshëm; shumica e njerëzve ende përdorin ChatGPT për të gjeneruar përgjigje në stilin e personazheve të tyre të preferuar teatrale.

Aspekti gjenerues, qoftë për tekst, imazhe apo video; bazohet në Rrjetet kundërshtare gjeneruese (GAN)[4]. Në mënyrë intuitive, një GAN mund të konsiderohet si një lojë midis dy rrjeteve: Një rrjet gjenerator dhe një rrjet të dytë Klasifikues. Një Klasifikues mund të jetë, p.sh., një rrjet i klasifikimit të imazheve të bazuara në Rrjetin Neural Konvolutional (CNN); duke dalluar mostrat si të ardhura nga shpërndarja aktuale ose nga Gjeneruesi. Sa herë që Klasifikuesi është në gjendje të tregojë një imazh të rremë, domethënë vëren një ndryshim midis dy shpërndarjeve; Gjeneratori rregullon parametrat e tij në përputhje me rrethanat. Në fund (në teori), Klasifikuesi nuk do të jetë në gjendje të dallojë, duke nënkuptuar që Gjeneruesi është më pas në gjendje të riprodhojë grupin origjinal të të dhënave.

Rastet e përdorimit të NLG nga ndërmarrjet:
Siç u përmend më parë, aplikacionet ChatGPT si një mjet i pastër për gjenerimin e përmbajtjes së lojës për marketing, në përgjithësi çdo komunikim i brendshëm ose i jashtëm i organeve, është i qartë dhe përçarës.

Sidoqoftë, përveç kësaj, i vetmi vend ku kemi parë një aplikim të NLG në ndërmarrje është gjenerimi i përmbledhjeve tekstuale të figurave dhe raporteve.

ChatGPT, në të ardhmen, mund të interpretojë të dhënat e kompanisë (p.sh., shifrat e shitjeve, përgjigjet e marketingut) dhe të gjenerojë tekst të shkurtër narrativ për audiencat e synuara - duke mundësuar raporte të shpejta dhe të lehta për t'u lexuar.

Sfida kryesore e modeleve Image-to-Text sot nuk është aftësia për të gjeneruar përshkrime tekstuale të figurave; por që ato duhet të jenë shumë të personalizuara për të nxjerrë në pah njohuritë specifike që kërkon një përdorues biznesi, duke marrë në kontekst domenin org/njësi biznesi.

Një rast përdorimi i lidhur këtu është kërkimi i bazave të të dhënave në gjuhën natyrore.

Me tekst-në-SQL, qëllimi kryesor ka qenë rikrijimi i paradigmës së kërkimit SQL në bazën e të dhënave, në atë që përdor pyetjet e gjuhës natyrore (NLQ). Fusha quhet Ndërfaqja e Gjuhëve Natyrore për Bazat e të Dhënave (NLIDB), dhe unë e kam trajtuar tashmë në detaje në një artikull të mëparshëm [5], duke përfshirë ndikimin e LLM-ve.

Kuptimi dhe mirëdashja e përdoruesit

Mirëdashësia për përdoruesit e ChatGPT është një tjetër arsye e rëndësishme që qëndron në themel të popullaritetit të tij.

Enterprise Chatbots sot janë shumë të fokusuar në detyra / domen. Krijuesit me eksperiencë të Chatbot do të dinë se si ne gjithmonë kemi frikë nga "e panjohura" - pyetjet e përgjithshme / të papritura që përdoruesi mund të përfundojë duke bërë. Pra, ne shpenzojmë përpjekje të konsiderueshme në dizajnimin e rrjedhës / udhëzimin e përdoruesit për të bërë pyetje përkatëse.

Për përdoruesin mesatar, kjo funksionon si një pengesë në lidhje me adoptimin e chatbot, ku ata duhet të mendojnë dy herë (ose shumë herë) për të siguruar që po bëjnë pyetjet e duhura. Në thelb, shpenzoni kohë dhe përpjekje për t'i inkuadruar siç duhet pyetjet.

ChatGPT e ndryshoi lojën këtu duke e lejuar përdoruesin të pyesë çdo gjë - duke ulur pengesën e hyrjes. Kjo u plotësua nga ChatGPT duke u përgjigjur me rojet e duhura të sigurisë në vend.

OpenAI e përshkruan këtë pasi ChatGPT mund të "përgjigjet në pyetjet vijuese, të pranojë gabimet e tij, të sfidojë premisat e pasakta dhe të refuzojë kërkesat e papërshtatshme". Sado e vështirë të kuptosh qëllimin e përdoruesit, është po aq sfiduese të diferencosh kur përdoruesi po përpiqet të manipulojë/sulmojë chatbot-in – p.sh., për robotët e jashtëm (përballë konsumatorit). Dhe, ChatGPT e kryen shumë mirë këtë 'detyrë klasifikimi'.

Më lejoni gjithashtu të përfitoj nga ky rast për të thënë se ChatGPT nuk do t'i bëjë të tepërta chatbot-et e ndërmarrjeve që ne kemi ndërtuar në AWS Lex, Microsoft LUIS, Google Dialogflow në çdo kohë. Ato janë projektuar me kujdes (të kuruar me dorë) për raste përdorimi të fokusuar në domen të ngushtë / dhe do të jetë e vështirë të rregullohet një LLM e përgjithshme për të arritur atë nivel saktësie për ato grupe specifike pyetjesh - pa ndërhyrje manuale.

Kërkimi i ndërmarrjes
Duke u fokusuar në aspektin e nxjerrjes së informacionit, shumë njerëz e kanë përdorur atë për të kërkuar informacion. Këtu gjithashtu, ChatGPT shkëlqen ku është në gjendje të marrë jo vetëm përgjigje tekstuale nga dokumentet / faqet e internetit, por edhe t'u përgjigjet pyetjeve komplekse që lidhen me programimin, ekuacionet matematikore, etj.

Kjo ka çuar në shumë diskutime nëse ChatGPT do të prishë kërkimin / zëvendësojë Google? A do ta kalojë Bing Search më në fund Google Search, duke pasur parasysh se OpenAI është në pronësi të Microsoft.

Përgjigja është: Jo! , dhe kjo është kryesisht sepse nuk është një krahasim mollë me mollë (apo edhe, portokall me portokall).

Kërkimi ka të bëjë me marrjen e informacionit ekzistues, me lidhje me burimin. Pra, pjesa më e mahnitshme e ChatGPT, d.m.th. e., pjesa gjeneruese nuk është e rëndësishme këtu. Dhe, kur bëhet fjalë për pjesën e rikthimit, shumica e motorëve të kërkimit, p.sh. g., Google, tashmë përdor BERT [6] ose Arkitektura të ngjashme të bazuara në Transformer.

Mendoj se ajo që i zhgënjen më shumë njerëzit janë rezultatet e 'reklamave' që Google i shtyn në krye, sesa rezultatet më të rëndësishme.Me pak fjalë, asgjë nuk do të ndryshojë në mënyrë dramatike, përveç madhësisë së LLM-ve themelore .

Pjesa gjeneruese (edhe nëse disi e paparashikueshme) mund të jetë ende e rëndësishme nga këndvështrimi i kërkimit, për sa kohë që ChatGPT mund të lidhë përgjigjet e tij me artikujt burimor. Fatkeqësisht, kjo është më e lehtë të thuhet sesa të bëhet dhe është pjesë e një problemi më të madh të AI Etike / AI e shpjegueshme [7] (e referuar si 'përfshirje tekstuale' në kontekstin e NLP), ku është e paqartë se cila pjesë/artikull i trajnimit themelor grupi i të dhënave kontribuoi në një përgjigje.

Së fundi, aspekti "freski" i "Kërkimit". Një pjesë e madhe e kërkimit tonë lidhet me ngjarjet e reja/të fundit dhe artikujt e tyre përkatës. Kjo është e zbatueshme si për motorët e përgjithshëm të kërkimit si Google, ashtu edhe për skenarët e Kërkimit të Ndërmarrjeve [8]. Pra, LLM-të themelore do të duhet të ritrajnohen vazhdimisht me informacione të reja për të kthyer përgjigjet e përditësuara. Këtu, është e rëndësishme të kuptohet se ndërsa LLM-të shpesh mendohen për Modele Vetë-Mësuese,

një sasi e konsiderueshme përpjekjesh manuale është përfshirë në formën e reagimeve të përdoruesve, për të përmirësuar saktësinë e ChatGPT duke përdorur Mësimi i Përforcimit [9].

Përmirësim i vazhdueshëm (por manual).

Mësimi përforcues (RL) është në gjendje të arrijë qëllime komplekse duke maksimizuar një funksion shpërblimi në kohë reale. Funksioni i shpërblimit funksionon ngjashëm me nxitjen e një fëmije me karamele dhe goditje me goditje, në mënyrë që algoritmi penalizohet kur merr një vendim të gabuar dhe shpërblehet kur merr një vendim të duhur - ky është përforcim. Aspekti i përforcimit gjithashtu e lejon atë të përshtatet më shpejt me ndryshimet në kohë reale në ndjenjën e përdoruesit.

Në thelb të kësaj qasjeje [10] është një model pikësh, i cili është trajnuar për të shënuar tuples pyetje-përgjigje chatbot bazuar në reagimet (manuale) të përdoruesve. Rezultatet e parashikuara nga ky model përdoren si shpërblime për agjentin RL. Optimizimi i politikave proksimale përdoret më pas si hapi i fundit për të akorduar më tej ChatGPT.

Me pak fjalë, ritrajnimi ose shtimi i informacionit të ri në LLM nuk është plotësisht i automatizuar. RL ndihmon në kryerjen e kësaj në një mënyrë të synuar; megjithatë ndërhyrja manuale nevojitet ende për të arritur këtë nivel saktësie dhe për t'i mbrojtur ata nga paragjykimet/manipulimet.

Përfundim

ChatGPT është një moment historik i rëndësishëm në udhëtimin e evolucionit të AI. Aftësitë e tij gjeneruese janë të mahnitshme, ku është në gjendje të gjenerojë tekst "si njeriu" në një mënyrë shumë bindëse. Pra, aftësitë e tij për të gjeneruar përmbajtje për skenarët e marketingut dhe komunikimit janë shkatërruese. Sidoqoftë, kjo është gjithashtu pjesa më e frikshme dhe një makth absolut nga pikëpamja e Pronësisë Intelektuale (IP) - si për artistët ashtu edhe për krijuesit e përmbajtjes. Pra, ne mund të shpresojmë vetëm që rregullatorët do të veprojnë menjëherë dhe mjetet/rregulloret do të ndjekin me të njëjtën shpejtësi si teknologjia bazë për të kufizuar abuzimin e saj.

Është gjithashtu e rëndësishme të kuptohet se ChatGPT është një hap në rritje në Kërkimin NLP. Fuqia e tij vjen nga kombinimi i një numri teknikash themelore, p.sh., Transformers, GANs, Reinforcement Learning. Pra, nuk do të çojë në ndonjë ndërprerje të papritur të NLP në ndërmarrje. Përfitimet do të pasojnë për sa i përket përmirësimeve të detyrave themelore të NLP, p.sh., pyetje dhe përgjigje, përkthim, përmbledhje; e cila ngadalë do të përhapet në rastet e përdorimit të ndërmarrjes.

Shumica e ndërmarrjeve sot nuk kanë aftësitë dhe aftësitë e infrastrukturës për të shfrytëzuar blloqet kryesore të teknologjisë së vetë ChatGPT. Kështu që do të nevojitet punë e mëtejshme në formën e mjeteve të pjekura, API-ve, etj., që do të lehtësojnë procesin e rregullimit të LLM-ve të trajnuara paraprakisht për të dhënat dhe domenet specifike të ndërmarrjes.

Artikuj të ngjashëm në serinë ChatGPT:

Referencat

  1. D. Biswas. Chatbots dhe kërkimi i gjuhës natyrore. në Drejt Shkencës së të Dhënave, 2020, https://towardsdatascience.com/chatbots-natural-language-search-cc097f671b2b
  2. Jianfeng Liu, Feiyang Pan, Ling Luo. GoChat: Chatbots të orientuar drejt qëllimit me mësim të përforcimit hierarkik. (2020) https://arxiv.org/abs/2005.11729
  3. Janarthanan Rajendran, Jonathan K. Kummerfeld, Satinder Singh. Të mësosh të mësosh Dialog i orientuar nga qëllimi nga fundi në fund nga detyrat përkatëse të dialogut(2021). https://arxiv.org/abs/2110.15724
  4. C. Pak. Rrjetet kundërshtare gjeneruese për gjenerimin e të dhënave sintetike: Një studim krahasues. https://unece.org/sites/default/files/2021-12/SDC2021_Day2_Little_AD.pdf
  5. D. Biswas. BI bisede: Teksti në SQL. në Drejt Shkencës së të Dhënave, 2022, https://towardsdatascience.com/conversational-bi-text-to-sql-c9f52a89acc5
  6. Google sjell BERT për të përmirësuar rezultatet e kërkimit, 2019, https://techcrunch.com/2019/10/25/google-brings-in-bert-to-improve-its-search-results/
  7. D. Biswas. Inteligjenca artificiale etike: implikimet e saj për rastet e përdorimit dhe qeverisjen e inteligjencës artificiale në ndërmarrje. në Towards Data Science, 2021, https://towardsdatascience.com/ethical-ai-its-implications-for-enterprise-ai-use-cases-and-governance-81602078f5db
  8. L. Baligand, D. Biswas. Ndërtimi i një motori kërkimi të gjuhës natyrore të ndërmarrjes me ElasticSearch dhe DrQA të Facebook-ut. Konferenca e 10-të "Berlin Buzzwords", 2019.
  9. A. Barto, R.S. Sutton. Të mësuarit përforcues: një hyrje. MIT Press, Kembrixh, MA, 2018, http://incompleteideas.net/book/RLbook2018.pdf
  10. E. Ricciardelli, D. Biswas. Chatbot vetë-përmirësues bazuar në të mësuarit përforcues. në: Konferenca e 4-të Multidisiplinare për të mësuarit përforcues dhe vendimmarrje, 2019. https://towardsdatascience.com/self-improving-chatbots-based-on-reinforcement-learning-75cca62debce

Abonohu ​​në DDIntel Këtu.

Vizitoni faqen tonë të internetit këtu: https://www.datadriveninvestor.com

Bashkohuni me rrjetin tonë këtu: https://datadriveninvestor.com/collaborate