PHP. Получить длину строки



Для подсчета количества символов в строке существует две функции: strlen и mb_strlen.
Для подсчета символом латинского алфавита в строке подойдут обе функции независимо от кодировки текста.
Для кириллицы необходимо использовать функцию mb_strlen, так как вторым параметром можно задать тип кодировки.
Кириллические символы с использованием функции mb_strlen будут подсчитаны корректнее с заданной кодировкой utf-8.

Примеры кода продемонстрированы в полной новости.

htmlentities - Преобразует символы в соответствующие HTML сущности

htmlentities - Преобразует символы в соответствующие HTML сущности.

Функция имеет два аргумента. Второй аргумент позволяет указать способ обработки одиночных и двойных кавычек. Второй аргумент не является обязательным.
string htmlentities ( string string [, int quote_style [, string charset]] )

Значением аргумента может быть одна из следующих констант:
  • ENT_QUOTES - Преобразует оба типа кавычек.
  • ENT_COMPAT - Преобразуются только двойные кавычки, одиночные не затрагиваются.
  • ENT_NOQUOTES - Оба типа кавычек остаются без изменений.


Так же функция поддерживает работу с кодировками.
Список возможных поддерживаемых кодировок:
  • ISO-8859-1 - Западно-европейская Latin-1
  • ISO-8859-15 - Западно-европейская Latin-9. Добавляет знак евро, французские и финские буквы к кодировке Latin-1(ISO-8859-1).
  • UTF-8 - 8-битная Unicode, совместимая с ASCII.
  • cp866 - Кириллическая кодировка, применяемая в DOS. Поддерживается в версии 4.3.2.
  • cp1251 - Кириллическая кодировка, применяемая в Windows. Поддерживается в версии 4.3.2.
  • cp1252 - Западно-европейская кодировка, применяемая в Windows.
  • KOI8-R - Русская кодировка. Поддерживается в версии 4.3.2.
  • BIG5 - Традиционный китайский, применяется в основном на Тайване.
  • GB2312 - Упрощенный китайский, стандартная национальная кодировка.
  • BIG5-HKSCS - Расширенная Big5, применяемая в Гонг-Конге.
  • Shift_JIS - Японская кодировка.
  • EUC-JP - Японская кодировка.


Пример:

<?php
$str = "Проверка 'данной' <b>строки</b>";

echo htmlentities($str);
echo '<br />';
echo htmlentities($str, ENT_QUOTES, "UTF-8");
?>


Результат:

Проверка 'данной' &lt;b&gt;строки&lt;/b&gt;<br />Проверка &#039;данной&#039; &lt;b&gt;строки&lt;/b&gt;gt;

trim -- Удаляет пробелы из начала и конца строки

trim -- Удаляет пробелы из начала и конца строки
Функция trim удаляет следующие символы:

  • " " - символ пробела
  • "\t" - символ табуляции
  • "\n" - символ перевода строки
  • "\r" - символ возврата каретки
  • "\0" - NULL байт
  • "\x0B" - вертикальная табуляция
.

Пример:

$text = "   Три пробела вначале строки и знак табуляции в конце строки.\t"

echo trim($text);

Результат:

Три пробела вначале строки и знак табуляции в конце строки.