Как получить часть большого текста без потери HTML-тегов с помощью php?

Я получаю большой контент из API, примерно так:

Lorem <div class = "highlighted">ipsum dolor</div> 
sed do eiusmod tempor incididunt ut labore et dolore magna
aliqua. Ut enim ad minim veniam, quis nostrud exercitation
ullamco laboris nisi ut aliquip ex ea commodo consequat.
Duis aute irure dolor in reprehenderit in voluptate velit 
esse cillum dolore eu fugiat nulla pariatur

Я хочу показать около 10 слов из этого контента. И также я не хочу пропустить часть <div class = "highlighted">ipsum dolor</div>. Я имею в виду, что div и class = "highlighted" не следует удалять.

Я пробовал эту функцию:

 function getPartialContent($content, $words_number)
    {
        $no_tags_content = preg_replace("/\r|\n/", "", html_entity_decode(filter_var($content, FILTER_SANITIZE_STRING)));

        $words = explode(" ", $no_tags_content);
        $result = implode(" ", array_splice($words, 0, $words_number));
        return $result;
    }

Единственная проблема в том, что эта функция сначала удаляет все теги html. Если я не использую preg_replace для удаления тегов html, результат будет примерно таким (div не закрыт):

Lorem sed do eiusmod tempor incididunt is that this <div class = "highlighted">ipsum

чего я не хочу.

Я ожидаю, что результат будет с закрытыми тегами или вообще без тегов. Обычно в div есть одно или два слова. Количество слов в результате не так важно. Я просто хочу, чтобы он был коротким, от 10 до 15 слов.

какой результат вы ожидаете?

— 30.12.2018 17:20

@lagripe см. мой обновленный вопрос. последний абзац

— 30.12.2018 17:25

Либо вы работаете с DomDocumentили, вы сначала подсчитываете «слова» в элементах html и добавляете это число к $ words_number, чтобы гарантировать, что они никогда не будут усечены.

— 30.12.2018 17:35

или сначала разбивается по тегам html

— 30.12.2018 17:39

см. regex101.com/r/3dEqDC/1

— 30.12.2018 18:11

php html regex

30.12.2018 17:16

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Symfony Station Communiqué - 7 июля 2023 г

Это коммюнике первоначально появилось на Symfony Station .

Оживление вашего приложения Laravel: Понимание режима обслуживания

Здравствуйте, разработчики! В сегодняшней статье мы рассмотрим важный аспект управления приложениями, который часто упускается из виду в суете...

Установка и настройка Nginx и PHP на Ubuntu-сервере

В этот раз я сделаю руководство по установке и настройке nginx и php на Ubuntu OS.

Коллекции в Laravel более простым способом

Привет, читатели, сегодня мы узнаем о коллекциях. В Laravel коллекции - это способ манипулировать массивами и играть с массивами данных. Благодаря...

Как установить PHP на Mac

PHP - это популярный язык программирования, который используется для разработки веб-приложений. Если вы используете Mac и хотите разрабатывать...

Ответы 1

Вы можете попробовать что-то вроде этого:

$rgxp = '/^(\W*(<[^>]+>\W*)?\w+(\W*<[^>]+>)?\W*){10,15}/';
preg_match($rgxp, $text, $mtch);
echo "\n",$mtch[0], "\n";

Расширенный:

$rgxp = '/
^             # start of line
(             # group to quantify
\W*           # ignore space & punctuation
(<[^>]+>\W*)? # optional opening tag group
\w+           # the words to count
(\W*<[^>]+>)? # optional closing tag group
\W*           # ignore space & punctuation
) {10,15}     # quantifier
/x';

31.12.2018 11:50

Другие вопросы по теме

Javascript для цикла сравнения текста элемента dom с массивом

Как создать Border на входе тд в таблице?

HTML / HP: Emogrifier превращает {} в% 7B и% 7D

Событие нажатия аккордеона bootstrap не работает должным образом с динамическими данными

Изменение размера средней части страницы с сохранением ограничений для дочерних элементов

Значения CSS не могут быть получены с помощью Javascript

Blogger - код iframe не работает, после рекомендованных исправлений он не отображается в моем блоге

Как сгенерировать случайное число, которое без остатка делится на другое случайно сгенерированное число

Аккордеон не останавливается при наведении курсора мыши

Vue.js - изменить неопределенный источник img, который я создал динамически

Как получить часть большого текста без потери HTML-тегов с помощью php?

Ответы 1

Другие вопросы по теме

Похожие вопросы