PHP. Поиск слов в строке

Поиск слов в строке(тексте) с помощью регулярного выражения

PHP. Поиск слов в строке


В мануале приведен пример того, как с помощью регулярного выражения найти все слова в тексте - строке (включая utf-8 кодировку) и поместить их в массив.

Словом будет считаться строка разделенная пробелами, специальными символами или знаками препинания.
Т.е строка "содер3zhahee", будет засчитана как слово.
Спец символы (перенос строки, табуляция и тд) будут являться разделителями строки на разные слова.

<?php
$text = 'Lorem Ipsum - это текст-"рыба", часто используемый в печати и вэб-дизайне. Lorem Ipsum является стандартной "рыбой" для текстов на латинице с начала XVI века. В то время некий безымянный печатник создал большую коллекцию размеров и форм шрифтов, используя Lorem Ipsum для распечатки образцов. Lorem Ipsum не только успешно пережил без заметных изменений пять веков, но и перешагнул в электронный дизайн. Его популяризации в новое время послужили публикация листов Letraset с образцами Lorem Ipsum в 60-х годах и, в более недавнее время, программы электронной вёрстки типа Aldus PageMaker, в шаблонах которых используется Lorem Ipsum. 
А теперь когда мы покончили с обычным текстом lorem ipsum, попробуем добавить слово содер3zhahee русский, английский текст и цифры.';
 
preg_match_all('/[^\W\d][\w]*/u', $text, $result);
 
var_dump($result);


Результат:
array(1) {
[0]=>
array(113) {
[0]=>
string(5) "Lorem"
[1]=>
string(5) "Ipsum"
[2]=>
string(6) "это"
[3]=>
string(10) "текст"
[4]=>
string(8) "рыба"
[5]=>
string(10) "часто"
[6]=>
string(24) "используемый"
[7]=>
string(2) "в"
[8]=>
string(12) "печати"
[9]=>
string(2) "и"
[10]=>
string(6) "вэб"
[11]=>
string(14) "дизайне"
[12]=>
string(5) "Lorem"
[13]=>
string(5) "Ipsum"
[14]=>
string(16) "является"
[15]=>
string(22) "стандартной"
[16]=>
string(10) "рыбой"
[17]=>
string(6) "для"
[18]=>
string(14) "текстов"
[19]=>
string(4) "на"
[20]=>
string(16) "латинице"
[21]=>
string(2) "с"
[22]=>
string(12) "начала"
[23]=>
string(3) "XVI"
[24]=>
string(8) "века"
[25]=>
string(2) "В"
[26]=>
string(4) "то"
[27]=>
string(10) "время"
[28]=>
string(10) "некий"
[29]=>
string(20) "безымянный"
[30]=>
string(16) "печатник"
[31]=>
string(12) "создал"
[32]=>
string(14) "большую"
[33]=>
string(18) "коллекцию"
[34]=>
string(16) "размеров"
[35]=>
string(2) "и"
[36]=>
string(8) "форм"
[37]=>
string(14) "шрифтов"
[38]=>
string(18) "используя"
[39]=>
string(5) "Lorem"
[40]=>
string(5) "Ipsum"
[41]=>
string(6) "для"
[42]=>
string(20) "распечатки"
[43]=>
string(16) "образцов"
[44]=>
string(5) "Lorem"
[45]=>
string(5) "Ipsum"
[46]=>
string(4) "не"
[47]=>
string(12) "только"
[48]=>
string(14) "успешно"
[49]=>
string(14) "пережил"
[50]=>
string(6) "без"
[51]=>
string(16) "заметных"
[52]=>
string(18) "изменений"
[53]=>
string(8) "пять"
[54]=>
string(10) "веков"
[55]=>
string(4) "но"
[56]=>
string(2) "и"
[57]=>
string(20) "перешагнул"
[58]=>
string(2) "в"
[59]=>
string(22) "электронный"
[60]=>
string(12) "дизайн"
[61]=>
string(6) "Его"
[62]=>
string(26) "популяризации"
[63]=>
string(2) "в"
[64]=>
string(10) "новое"
[65]=>
string(10) "время"
[66]=>
string(18) "послужили"
[67]=>
string(20) "публикация"
[68]=>
string(12) "листов"
[69]=>
string(8) "Letraset"
[70]=>
string(2) "с"
[71]=>
string(18) "образцами"
[72]=>
string(5) "Lorem"
[73]=>
string(5) "Ipsum"
[74]=>
string(2) "в"
[75]=>
string(2) "х"
[76]=>
string(10) "годах"
[77]=>
string(2) "и"
[78]=>
string(2) "в"
[79]=>
string(10) "более"
[80]=>
string(16) "недавнее"
[81]=>
string(10) "время"
[82]=>
string(18) "программы"
[83]=>
string(22) "электронной"
[84]=>
string(14) "вёрстки"
[85]=>
string(8) "типа"
[86]=>
string(5) "Aldus"
[87]=>
string(9) "PageMaker"
[88]=>
string(2) "в"
[89]=>
string(16) "шаблонах"
[90]=>
string(14) "которых"
[91]=>
string(24) "используется"
[92]=>
string(5) "Lorem"
[93]=>
string(5) "Ipsum"
[94]=>
string(2) "А"
[95]=>
string(12) "теперь"
[96]=>
string(10) "когда"
[97]=>
string(4) "мы"
[98]=>
string(18) "покончили"
[99]=>
string(2) "с"
[100]=>
string(14) "обычным"
[101]=>
string(14) "текстом"
[102]=>
string(5) "lorem"
[103]=>
string(5) "ipsum"
[104]=>
string(18) "попробуем"
[105]=>
string(16) "добавить"
[106]=>
string(10) "слово"
[107]=>
string(17) "содер3zhahee"
[108]=>
string(14) "русский"
[109]=>
string(20) "английский"
[110]=>
string(10) "текст"
[111]=>
string(2) "и"
[112]=>
string(10) "цифры"
}
}
Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.
  • Яндекс.Метрика
  • Счетчик PR-CY.Rank
  • Рейтинг@Mail.ru