Regex zëvendëson karakteret në të dhëna

Unë jam duke u përpjekur të pastroj disa të dhëna të prishura të karaktereve speciale (duke lejuar disa), por disa ende i kalojnë. Kam gjetur një fragment regex më herët, por nuk heq disa karaktere, si yjet.

  $clean_body = $raw_text;

  $clean_title = preg_replace("/[^!&\/A-Za-z0-9_ ]/","", $clean_body);
  $clean_title = substr($clean_title, 0, 64);

  $clean_body = nl2br($clean_body);  

  if ($nid) {
    $node = node_load($nid);
    unset($node->field_category);
  } else {
    $node = new stdClass();
    $node->type = 'article';
    node_object_prepare($node); 
  }

  $split_title = str_split($clean_title);

  foreach ($split_title as $key => $character) {
    if ($key > 15) {
      if ($character == ' ' && !preg_match("/[^!&\/,.-]/", $split_title[$key - 1])) {
        $node->title = html_entity_decode(substr(strip_tags($clean_title), 0, $key - 1)) . '...';
      }
    }
  }

Pjesa e parë përpiqet të pastrojë çdo gjë në tekstin e papërpunuar që nuk është shenja pikësimi ose alfa numerike normale. Pastaj, e ndaj titullin në një grup dhe kërkoj një hapësirë. Ajo që dua të bëj është të krijoj një titull që të jetë së paku 15 karaktere dhe të shkurtohet në një hapësirë (duke lënë fjalë të tëra të paprekura) pa u ndalur në një karakter pikësimi. Kjo është pjesa me të cilën kam probleme.

Disa tituj ende dalin si ***************** ose ** HOW TO MAKE $$$$$$ BLOGGING **, kur titulli i parë nuk duhet të ketë as *, dhe seksioni duhet të jetë HOW TO MAKE..., për shembull.

php regex data-cleaning

13.09.2011

Po në lidhje me përdorimin e wordwrap për shkurtimin e vargjeve? 13.09.2011
Nuk dua t'i shtoj një thyerje rreshti titullit, thjesht shkurtoj atë. Duket sikur ai funksion do ta prishte atë? 13.09.2011
Regeksi juaj më duket mirë. A keni provuar të ekzaminoni $clean_title menjëherë pas telefonatës në preg_replace? Unë mendoj se problemi është në PHP-në tuaj, por unë nuk e kam përdorur PHP për shumë kohë, kështu që nuk jam ekspert. 13.09.2011

Përgjigjet:

Po në lidhje me "/[^!&\/\w\s]/ui"? Punon mirë në makinën time

13.09.2011

Problemi juaj (ose, një prej tyre gjithsesi) është kjo logjikë:

if ($key > 15) {
  if ($character == ' ' && !preg_match("/[^!&\/,.-]/", $split_title[$key - 1])) {
    $node->title = html_entity_decode(substr(strip_tags($clean_title), 0, $key - 1)) . '...';
  }
}

Ju po vendosni $node->title vetëm nëse këto kushte përputhen kur përsëritni karakteret në grupin $split_title.

Çfarë ndodh kur ato nuk përputhen? $node->title nuk vendoset (ose mbishkruhet? Nuk ke dhënë shumë kontekst, kështu që nuk mund ta them).

Duke përdorur këtë si një provë:

$clean_body = '** HOW TO MAKE $$$$$$ BLOGGING **';

Mund të shihni që këto kushte nuk përputhen, kështu që $node->title nuk vendoset (ose mbishkruhet).

13.09.2011

Materiale të reja

Masterclass Coroutines: Kapitulli-3: Anulimi i korutinave dhe trajtimi i përjashtimeve.

Mirë se vini në udhëzuesin gjithëpërfshirës mbi Kotlin Coroutines! Në këtë seri artikujsh, unë do t'ju çoj në një udhëtim magjepsës, duke filluar nga bazat dhe gradualisht duke u thelluar në..

Faketojeni derisa ta arrini me të dhënat false

A e gjeni ndonjëherë veten duke ndërtuar një aplikacion të ri dhe keni nevojë për të dhëna testimi që duken dhe duken më realiste ose një grup i madh të dhënash për performancën e ngarkesës...

Si të përdorni kërkesën API në Python

Kërkesë API në GitHub për të marrë depot e përdoruesve duke përdorur Python. Në këtë artikull, unë shpjegoj procesin hap pas hapi për të trajtuar një kërkesë API për të marrë të dhëna nga..

Një udhëzues hap pas hapi për të zotëruar React

Në këtë artikull, do të mësoni se si të krijoni aplikacionin React, do të mësoni se si funksionon React dhe konceptet thelbësore që duhet të dini për të ndërtuar aplikacione React. Learning..

AI dhe Psikologjia — Pjesa 2

Në pjesën 2 të serisë sonë të AI dhe Psikologji ne diskutojmë se si makineritë mbledhin dhe përpunojnë të dhëna për të mësuar emocione dhe ndjenja të ndryshme në mendjen e njeriut, duke ndihmuar..

Esencialet e punës ditore të kodit tim VS

Shtesat e mia të preferuara - Git Graph 💹 Kjo shtesë është vërtet e mahnitshme, e përdor përpara se të filloj të punoj për të kontrolluar dy herë ndryshimet dhe degët më të fundit, mund të..

Pse Python? Zbulimi i fuqisë së gjithanshme të një gjiganti programues

Në peizazhin gjithnjë në zhvillim të gjuhëve të programimit, Python është shfaqur si një forcë dominuese. Rritja e tij meteorike nuk është rastësi. Joshja e Python qëndron në thjeshtësinë,..

Etiketa

Machine Learning JavaScript Data Science Artificial Intelligence Python Web Development Software Development Coding Deep Learning AI React Software Engineering Programming Languages Front End Development Java Nodejs Algorithms Data Tech Computer Science Development HTML AWS CSS Neural Networks Angular ChatGPT Code Typescript Tutorial Python Programming Learning To Code Developer Computer Vision NLP Open Source Productivity Reactjs