Я пытаюсь работать с некоторыми шаблонами Django, используя Beautiful Soup. В некоторых случаях, когда я помещаю html, содержащий код Django, через экземпляр BeautifulSoup
, суп выводит недопустимый код Django:
from bs4 import BeautifulSoup
django_string = '<a href = "{% url "some_url" %}">'
soup = BeautifulSoup(django_string, 'html.parser')
print(soup)
<a %}" = "" href = "{% url " some_url" = "">
# expected <a href = "{% url "some_url" %}">
Я также пробовал использовать парсеры html5lib
и lxml
. Вывод синтаксического анализатора lxml
немного отличается от приведенного выше, но все еще недействителен.
Есть ли способ использовать Beautiful Soup для вывода действительного кода шаблона Django, или я достиг пределов того, для чего он предназначен?
У вас есть два набора двойных кавычек, поэтому BeautifulSoup считает, что ваша строка должна быть разделена на несколько атрибутов. Попробуйте использовать одинарные кавычки внутри части Django:
django_string = '<a href = "{% url \'some_url\' %}">'