В настоящее время я использую тег strip_tags($content, '<a>') для очистки html-тегов, кроме тега <a>.
Пример 1: Example "lorem ipsum dolor <sit amet....." вырезает все после "<"
Пример 2: Если содержимое начинается с "<test lorem ipsum", я получаю только пустую строку.
Я попытался проверить это с помощью регулярного выражения, но результат тот же.
preg_replace('/<[^>]*>/', '', $content) возвращает тот же результат для проверки.
Мне нужно как-то очистить html и сохранить правильное использование скобки "<" внутри содержимого.
@deceze правильно, если вы хотите, чтобы больше или меньше не воспринималось как тег, вы должны использовать > или < чтобы указать тогда соответственно.
@yunzen Я использую именно strip_tags()
@MarcoTesini Эй, не могли бы вы отреагировать на мой код? Я снова протестировал его (второй), и он работает, поскольку удаляет все теги html, кроме <a …> и </a>. Если это вам не поможет, вы можете сказать, почему или что не так с моим кодом…






Если вы хотите очистить все теги, кроме простых <a> и </a>, вы можете просто отфильтровать их, заменить, затем очистить HTML и заменить обратно, например:
<?php
$text = "<a> ahahahasjusjhcbzdeu <div>JEY ssjisuj</div>jn<p> here somehing else </p></a>";
$EndText = str_replace("<a>", "&ATL", $text);
$EndText = str_replace("</a>", "&ATR", $EndText);
$EndText = strip_tags($EndText);
$EndText = str_replace("&ATL", "<a>", $EndText);
$EndText = str_replace("&ATR", "</a>", $EndText);
echo htmlspecialchars($EndText);
?>
Но если вы хотите получить что-то вроде <a href = "mywebsite.com"> here </a>, ссылка тоже будет удалена.
Поэтому вам нужно отфильтровать текст между <a и > (это можно сделать с помощью explode, sub_str и str_replace), затем сделать то же самое, что и в решении выше, а затем снова вставить его.
Код, который сделает это:
<?php
$text = "<a>Here something</a><div>Again<a href='website.com'>That's a better link</a> Here</div>";
$Texts = explode("<a", $text);
$Begin = strip_tags(array_shift($Texts));
$Middles = [];
foreach ($Texts as &$value) {
$Middle = explode(">", $value)[0];
array_push($Middles, $Middle);
$Position = strpos($value, ">");
$value = substr($value, $Position+1);
$value = str_replace("</a>", "&htlENDA&", $value);
$value = strip_tags($value);
}
$EndText = $Begin;
for ($i = 0; $i < count($Texts); $i++) {
$EndText = $EndText."<a".$Middles[$i].">".$Texts[$i];
}
$EndText = str_replace("&htlENDA&", "</a>", $EndText);
echo "<br><br>Ende: ".htmlspecialchars($EndText);
?>
Это решит вашу проблему, поскольку удаляет все теги html, кроме <a ... > и </a>.
Ну…
<разграничивает тег.strip_htmlудаляет любые теги. Если вам нужен «<» в HTML, вам нужно закодировать его как<.