Ищу Linux application(или расширение Firefox), который позволит мне очистить макет HTML и сохранить целостность страницы.
Firefox делает почти идеальную работу, но не захватывает изображения, на которые есть ссылки в CSS.
Расширение Scrapbook для Firefox получает все, но сглаживает структуру каталогов.
Я бы не стал особо возражать, если бы все папки стали дочерними для страницы index.






Вы пробовали wget?
Телепорт Pro отлично подходит для такого рода вещей. Вы можете указать его на целые веб-сайты, и он будет загружать копию локально, сохраняя структуру каталогов и заменяя абсолютные ссылки относительными по мере необходимости. Вы также можете указать, хотите ли вы, чтобы контент с других сторонних веб-сайтов был связан с исходным сайтом.
См. Зеркальное отображение веб-сайтов с помощью wget
wget --mirror –w 2 –p --HTML-extension –-convert-links http://www.yourdomain.com
wget -r делает то, что вы хотите, а если нет, есть множество флагов для его настройки. См. man wget.
Другой вариант - curl, еще более мощный. См. http://curl.haxx.se/.