Regresioni linear në ML për fillestarët

Ka shumë postime në blog atje rreth regresionit linear që japin një kuptim më të mirë të disa koncepteve. Ekzistojnë gjithashtu disa tekste të avancuara që mbulojnë modelin me detaje të thella (nganjëherë, të paqarta). Qëllimi këtu është të arrihet një ekuilibër midis të dyjave, duke përfshirë intuitat jo-teknike. Kushdo që është i interesuar të marrë një pasqyrë më të mirë se mesatarja e çfarë është regresioni linear? atëherë ja ku është!!! Do të ishte gjithashtu e dobishme për këdo që është i interesuar të futet në Mësimin e Makinerisë/Shkencën e të Dhënave. Pra, pa asnjë vonesë le të fillojmë.

Regresioni linear, po e keni dëgjuar mirë!!! Jo "ekuacioni". E di që është gjëja e parë që na vjen në mendje, por në ML (Mësimi i Makinerisë) lidhet edhe me matematikën.

Pra, le të shohimçfarë është Mësimi i Makinerisë dhe Regresioni Linear?

Mësimi i makinerisë (ML)

Mësimi i makinerisë është një nënfushë e inteligjencës artificiale e cila u mundëson sistemeve të TI-së të njohin modele në bazë të algoritmeve dhe grupeve të të dhënave ekzistuese dhe të zhvillojnë koncepte të përshtatshme zgjidhjesh. Prandaj, në Learning Machine, njohuritë artificiale krijohen në bazë të përvojës. Mësimi i Makinerisë funksionon në mënyrë të ngjashme me të mësuarit njerëzor. Për shembull, nëse një fëmije i shfaqen imazhe me objekte specifike mbi to, ai mund të mësojë t'i identifikojë dhe t'i dallojë ato. Mësimi i makinerisë funksionon në të njëjtën mënyrë: Nëpërmjet futjes së të dhënave dhe komandave të caktuara, kompjuterit i mundësohet "të mësojë" të identifikojë objekte të caktuara (persona, objekte etj.) dhe të dallojë ndërmjet tyre. Për këtë qëllim, softueri furnizohet me të dhëna dhe trajnohet. Për shembull, programuesi mund t'i tregojë sistemit se një objekt i veçantë është një mace (="mace") dhe një objekt tjetër nuk është një mace (="jo mace"). Softueri merr reagime të vazhdueshme nga programuesi. Me çdo grup të ri të dhënash të futur në sistem, modeli optimizohet më tej, në mënyrë që të mund të dallojë qartë midis "mace" dhe "jo mace" në fund.

Regresioni linear

Regresioni linear është një nga algoritmet më të lehta dhe më të njohura të mësimit të makinerisë. Është një metodë statistikore që përdoret për analiza parashikuese. Regresioni linear bën parashikime për variabla të vazhdueshme/reale ose numerike si shitjet, paga, mosha, çmimi i produktit, etj.

Algoritmi i regresionit linear tregon një marrëdhënie lineare midis një ndryshoreje të varur (boshti Y) dhe ndryshores së pavarur (boshti X), prandaj quhet regresion linear. Meqenëse regresioni linear tregon marrëdhënien lineare, që do të thotë se gjen se si ndryshon vlera e ndryshores së varur sipas vlerës së ndryshores së pavarur.

Modeli i regresionit linear siguron një vijë të drejtë të pjerrët që përfaqëson marrëdhënien midis variablave. Merrni parasysh imazhin e mëposhtëm:

Matematikisht, ne mund të paraqesim një regresion linear si:

y= a0+a1x+ ε

Këtu,

Y= Variabla e varur (variabla e synuar)

X= Variabla e pavarur (ndryshore parashikuese)

a0= ndërprerja e vijës (Jep një shkallë lirie shtesë)

a1 = Koeficienti i regresionit linear (faktori i shkallës për secilën vlerë hyrëse)

ε = gabim i rastësishëm

Vlerat për ndryshoret x dhe y janë grupe të dhënash trajnimi për paraqitjen e modelit të Regresionit Linear.

Një linjë lineare që tregon marrëdhënien midis variablave të varur dhe të pavarur quhet Vija e regresionit. Një linjë regresioni mund të tregojë 2 lloje marrëdhëniesh:

Marrëdhënia lineare pozitive: Nëse ndryshorja e varur rritet në boshtin Y dhe ndryshorja e pavarur rritet në boshtin X, atëherë një marrëdhënie e tillë cilësohet si një marrëdhënie lineare pozitive.
Marrëdhënia lineare negative: Nëse ndryshorja e varur zvogëlohet në boshtin Y dhe ndryshorja e pavarur rritet në boshtin X, atëherë një marrëdhënie e tillë quhet një marrëdhënie lineare negative.

Kur punojmë me regresionin linear, qëllimi ynë kryesor është të gjejmë vijën e përshtatjes më të mirë që do të thotë se gabimi midis vlerave të parashikuara dhe vlerave aktuale duhet të minimizohet. Linja e përshtatjes më të mirë do të ketë gabimin më të vogël.

Pra, le t'i hedhim një sy shembullit të mëposhtëm për ta kuptuar më mirë:

Ne duhet të shqyrtojmë lidhjen midis moshës dhe çmimit për celularët e përdorur të shitur.

Këtu është tabela e të dhënave:

Kur telefoni eshte perdorur per 0.6 vite cmimi i shitjes ka qene 9500
Kur telefoni eshte perdorur per 1 vit cmimi i shitjes ka qene 6800
Kur telefoni eshte perdorur per 2 vite cmimi i shitjes ka qene 4700
Kur telefoni eshte perdorur per 4 vite cmimi i shitjes ka qene 3500
Kur telefoni eshte perdorur per 6 vite cmimi i shitjes ka qene 2500

Tani, ne shohim se kemi një marrëdhënie negative midis çmimit (boshti Y) dhe moshës së celularit (boshti X) ndërsa mosha e celularit rritet, çmimi ulet.

Le të përdorim të dhënat nga tabela dhe të krijojmë grafikun tonë Scatter dhe linjën e regresionit linear duke përdorur http://endmemo.com/statistics/lr.php:

Në grafikun e sipërpërmendur, boshti X (horizontal) ka variabla të pavarur që është mosha e lëvizshme. Boshti Y (vertikal) ka variabla të varur që është çmimi.

Pra, më herët telefoni shitet më mirë se çmimi i shitjes që merrni dhe të dyja janë të ndërlidhura. Ky korrelacion shfaqet nga një vijë blu në grafik, e cila quhet vija e përshtatjes më të mirë, sepse tregon marrëdhënien më të mirë midis parcelave të shpërndara.

Përgjimi që kemi është 8410.054988 dhe pjerrësia është -1106.637863. Mund të konkludojmë se çmimi mesatar i celularit zvogëlohet 1106.63 ₹ për çdo vit telefoni rritet në moshë. Pra, linja e përshtatjes më të mirë mund të përcaktohet si y = -1106.637863x + 8410.054988.

Përdorimi i këtij Regresioni Linear është bërë jashtëzakonisht i dobishëm për fushat e biznesit, fushat e përvojës dixhitale të klientëve dhe shumë fusha të tjera në përcaktimin e shitjeve, prodhimit dhe furnizimit.

Shpresoj se kjo do t'ju ndihmojë të merrni një kuptim të qartë të asaj që është mësimi i makinerive dhe regresioni linear nga një këndvështrim fillestar.

Botuar fillimisht në https://www.numpyninja.com më 20 tetor 2020.

Shiko gjithashtu:

Materiale të reja

Masterclass Coroutines: Kapitulli-3: Anulimi i korutinave dhe trajtimi i përjashtimeve.

Mirë se vini në udhëzuesin gjithëpërfshirës mbi Kotlin Coroutines! Në këtë seri artikujsh, unë do t'ju çoj në një udhëtim magjepsës, duke filluar nga bazat dhe gradualisht duke u thelluar në..

Faketojeni derisa ta arrini me të dhënat false

A e gjeni ndonjëherë veten duke ndërtuar një aplikacion të ri dhe keni nevojë për të dhëna testimi që duken dhe duken më realiste ose një grup i madh të dhënash për performancën e ngarkesës...

Si të përdorni kërkesën API në Python

Kërkesë API në GitHub për të marrë depot e përdoruesve duke përdorur Python. Në këtë artikull, unë shpjegoj procesin hap pas hapi për të trajtuar një kërkesë API për të marrë të dhëna nga..

Një udhëzues hap pas hapi për të zotëruar React

Në këtë artikull, do të mësoni se si të krijoni aplikacionin React, do të mësoni se si funksionon React dhe konceptet thelbësore që duhet të dini për të ndërtuar aplikacione React. Learning..

AI dhe Psikologjia — Pjesa 2

Në pjesën 2 të serisë sonë të AI dhe Psikologji ne diskutojmë se si makineritë mbledhin dhe përpunojnë të dhëna për të mësuar emocione dhe ndjenja të ndryshme në mendjen e njeriut, duke ndihmuar..

Esencialet e punës ditore të kodit tim VS

Shtesat e mia të preferuara - Git Graph 💹 Kjo shtesë është vërtet e mahnitshme, e përdor përpara se të filloj të punoj për të kontrolluar dy herë ndryshimet dhe degët më të fundit, mund të..

Pse Python? Zbulimi i fuqisë së gjithanshme të një gjiganti programues

Në peizazhin gjithnjë në zhvillim të gjuhëve të programimit, Python është shfaqur si një forcë dominuese. Rritja e tij meteorike nuk është rastësi. Joshja e Python qëndron në thjeshtësinë,..

Etiketa

Machine Learning JavaScript Data Science Artificial Intelligence Python Web Development Software Development Coding Deep Learning AI React Programming Languages Software Engineering Java Nodejs Algorithms Front End Development Data Tech Computer Science Development AWS HTML CSS Neural Networks Angular ChatGPT Python Programming Learning To Code Developer Code Typescript Tutorial NLP Open Source Productivity Computer Vision Linear Regression