Я искал в меру своих возможностей, не нашел ответа.
Я пытаюсь сохранить такие страницы: http://www.folkbibeln.it/?book=1joh&chapter=1&verse=1
Для разделения html-страниц и сохранения формата. Я мог бы взять каждую страницу, скопировать, вставить в программу для обработки текстов и сохранить в формате html, но на это уходили бы часы за часами. Я думаю, может быть какой-то код, который я мог бы использовать для его автоматизации? Я просто не могу понять это, так как это не похоже на обычный html-сайт.
Python — это язык, который я обычно использую.



![Безумие обратных вызовов в javascript [JS]](https://i.imgur.com/WsjO6zJb.png)


Весь текст находится в JS файлах. Вы загружаете URL-адрес, который вы нам дали. Нажмите ctrl-s и выберите «Веб-страница завершена». Тогда у вас будет ВЕСЬ текст в папке 1 Joh 1 – Svenska Folkbibeln_files Вы не можете сохранить как форматированный текст, если вы не визуализируете JS в файлах js
В качестве подхода грубой силы вы можете использовать Безголовый браузер для загрузки каждой страницы и сохранения ее в файл.
Но как уже упоминал mplungjan, все тексты находятся в js-файлах.
Вы можете сохранить эти файлы на свой диск, затем взять скрипт, который создает html-страницу, и написать небольшой скрипт nodejs, который создает все html-файлы для вас. (Возьмите исходный сценарий в качестве шаблона.)
Но nodejs не python
В зависимости от того, что вы пытаетесь сделать с текстами, нетрудно преобразовать эти js-файлы в JSON и разобрать их или напрямую в структуру данных python, которую вы можете импортировать и обрабатывать в любом скрипте по вашему выбору.
Редактировать:
При втором просмотре я только что увидел это: http://www.folkbibeln.it/chapters/1joh1.html
Кажется, есть нужные файлы в виде простого html, вам просто нужно их скачать.
Вау, эта редакция потрясающая! Как ты их нашел!? Спасибо!
@AndréNordin Инструменты для разработки браузера (F12)
Спасибо. Вы пишете: (Возьмите исходный сценарий в качестве шаблона.) Есть идеи, где я могу это найти? Что касается вашего последнего абзаца, это то, что я пытался сделать и сделал. Дело в том, что файлы js состоят из массивов: `"function get1joh() { verse = new Array(); verse[0] = new Array('1joh-1-1', 'Det som var frÃ¥n begynnelsen, det vi har hört, det vi med egna ögon har sett, det vi har skädat och rört med vÃ¥ra händer, om detta vittnar vi: Livets Ord.'); в исходный текст вставлены и другие слова: «Kapitel 1 Livets Ord Det» и т. д. Это форматирование, которое я хочу сохранить.