Инструменты для уменьшения размера сгенерированного HTML

Я использую документы Google, и некоторые используемые нами шаблоны были созданы с помощью MS-Office.
В результате HTML получился жирным и уродливым, а ограничение в 500 КБ на документ в Google делает некоторую очистку обязательной. Мне удалось найти избыточные атрибуты «стиля» и переместить их в какой-либо класс CSS, а также переименовать наиболее избыточные имена классов в более короткие, что позволило мне сэкономить около 50% от исходного размера. Знаете ли вы о некоторых существующих инструментах / скриптах / lib, которые могли бы сделать для меня эту болезненную работу или, по крайней мере, помочь мне написать этот волшебный инструмент?

Заранее спасибо !

Обновлено: Я попробовал и приборку, и деморонайзер, и "ручную перезапись":
- Ввод: 140 КБ
- Tidy'ed: 110Kb
. - Деморонизировано: 135 Кб

Так что мой любимый ответ будет «перепиши это!»

Спасибо !

Улучшение производительности загрузки с помощью Google Tag Manager и атрибута Defer
Улучшение производительности загрузки с помощью Google Tag Manager и атрибута Defer
В настоящее время производительность загрузки веб-сайта имеет решающее значение не только для удобства пользователей, но и для ранжирования в...
Введение в CSS
Введение в CSS
CSS является неотъемлемой частью трех основных составляющих front-end веб-разработки.
Как выровнять Div по центру?
Как выровнять Div по центру?
Чтобы выровнять элемент <div>по горизонтали и вертикали с помощью CSS, можно использовать комбинацию свойств и значений CSS. Вот несколько методов,...
Навигация по приложениям React: Исчерпывающее руководство по React Router
Навигация по приложениям React: Исчерпывающее руководство по React Router
React Router стала незаменимой библиотекой для создания одностраничных приложений с навигацией в React. В этой статье блога мы подробно рассмотрим...
Система управления парковками с использованием HTML, CSS и JavaScript
Система управления парковками с использованием HTML, CSS и JavaScript
Веб-сайт по управлению парковками был создан с использованием HTML, CSS и JavaScript. Это простой сайт, ничего вычурного. Основная цель -...
Toor - Ангулярный шаблон для бронирования путешествий
Toor - Ангулярный шаблон для бронирования путешествий
Toor - Travel Booking Angular Template один из лучших Travel & Tour booking template in the world. 30+ валидированных HTML5 страниц, которые помогут...
0
0
1 079
4
Перейти к ответу Данный вопрос помечен как решенный

Ответы 4

Вы можете попробовать аккуратный, он многое уберет.

Ответ принят как подходящий

MS-Office делает дрянной HTML, и точка. Лучше потратить время на восстановление HTML из исходного текста, чем пытаться пройти через это минное поле.

Я сделал несколько макросов, которые выполняют некоторые функции поиска / замены в Word, чтобы делать базовые вещи, такие как обертывание тегов <p> вокруг абзацев и тому подобное, а затем повторная разметка всего этого с нуля.

Не комментируя его название, я мог бы упомянуть деморонизатор, который автор описывает как:

...a Perl program available for downloading from this site which corrects numerous errors and incompatibilities in HTML generated by, or edited with, Microsoft applications.

YMMV.

Одна из моих любимых утилит сейчас на самом деле Windows Live Writer - она ​​отлично справляется с удалением мусора из файлов Word. Кто-то может не согласиться, но я использую его довольно часто!

Другие вопросы по теме