Сохранение пробелов в атрибутах

Отказ от ответственности: следующее является грехом против XML. Вот почему я пытаюсь изменить это с помощью XSLT :)

Мой XML в настоящее время выглядит так:

<root>
    <object name = "blarg" property1 = "shablarg" property2 = "werg".../>
    <object name = "yetanotherobject" .../>
</root>

Да, я помещаю все текстовые данные в атрибуты. Я надеюсь, что XSLT может меня спасти; Я хочу двигаться к чему-то вроде этого:

<root>
    <object>
        <name>blarg</name>
        <property1>shablarg</name>
        ...
    </object>
    <object>
        ...
    </object>
</root>

У меня на самом деле все это работает до сих пор, за исключением того, что мои грехи против XML были более ... исключительными. Некоторые теги выглядят так:

<object description = "This is the first line

This is the third line.  That second line full of whitespace is meaningful"/>

Я использую xsltproc под Linux, но, похоже, у него нет никаких вариантов для сохранения пробелов. Я безуспешно пытался использовать xsl: preserve-space и xml: space = "preserve". Кажется, что каждый вариант, который я нашел, применим к сохранению пробелов внутри самих элементов, но не атрибутов. Каждый раз приведенное выше изменяется на:

This is the first line This is the third line.  That second line full of whitespace is meaningful

Итак, вопрос в том, могу ли я сохранить пробел атрибута?

Вы должны заменить ваши пробелы ссылками на сущности внутри значения атрибута, например, заменить <object description = "first line \ n next line"/> на <object description = "first line&#xA;next line"/>. Нормализация значения атрибута (3.3.3) затем зависит от типа атрибута, который я считаю CDATA по умолчанию. Однако я думаю, что вы можете заставить это сделать это с помощью <!DOCTYPE root [ <!ATTLIST object description CDATA #IMPLIED>'> - может быть, верным, а может и нет. Затем, если у вас есть XSL, вам нужно убедиться, что вы обрабатываете пустое пространство вручную, я сделал то же, что и string-join() и tokenize().

n611x007 21.04.2015 21:11
Это может быть сделано. Вы можете получить полный пример (SSCCE) из моего ответа на другой вопрос: stackoverflow.com/a/29780972/611007 (Как я объяснил выше, это не тот способ, которым вы пытаетесь это сделать, но, в конце концов, он будет работать так, как вы хотите.)
n611x007 21.04.2015 23:05

related: stackoverflow.com/questions/449627 - связанный: stackoverflow.com/questions/2004386 - связанный: stackoverflow.com/questions/1289524

n611x007 22.04.2015 13:58
Стоит ли изучать PHP в 2026-2027 годах?
Стоит ли изучать PHP в 2026-2027 годах?
Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Приемы CSS-макетирования - floats и Flexbox
Приемы CSS-макетирования - floats и Flexbox
Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...
Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest
В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
11
3
10 215
4
Перейти к ответу Данный вопрос помечен как решенный

Ответы 4

Согласно Аннотированная спецификация XML, пробелы в значениях атрибутов нормализуются процессором XML (см. Аннотацию (T) к 3.3.3). Так что, похоже, ответ - нет.

если вы не можете управлять своим xml-процессором.

n611x007 21.04.2015 23:13
Ответ принят как подходящий

На самом деле это проблема необработанного синтаксического анализа XML, а не то, с чем XSLT может вам помочь. Синтаксический анализ XML должен преобразовывать символы новой строки в этом значении атрибута в пробелы в соответствии с «3.3.3 Нормализация значения атрибута» в стандарте XML. Таким образом, все, что в настоящее время читает ваши атрибуты описания и сохраняет символы новой строки, делает это неправильно.

Вы можете восстановить символы новой строки, предварительно обработав XML, чтобы экранировать символы новой строки на & # 10; ссылки на символы, если у вас также нет новых строк, в которых запрещены charref, например, внутри тела тега. Charref должны сохраняться как управляющие символы до значения атрибута, где вы затем можете превратить их в текстовые узлы.

Я не уверен, что это сработает. Charref заменяются байтами, которые они представляют, процессором XML, и поэтому charref, относящийся к пробельному символу (например, LINE FEED), будет нормализован как пробел.

ChuckB 04.11.2008 20:03

Стандартный и DOM Test Suite говорят, что он работает; Ваша реализация может отличаться, но те, которые я тестировал, могут.

bobince 08.01.2009 05:21

@ChuckB Я думаю, это зависит от можете ли вы управлять своим xml-процессором. Я могу создать хороший результат с .xsl, который работает как в saxon, так и в firefox.

n611x007 21.04.2015 23:11

Тот же самый раздел спецификации XML особо отмечает, что символьные ссылки, такие как &#xA;Выполнять работу: «если ненормализованное значение атрибута содержит символьную ссылку на символ пробела, отличный от пробела (# x20), нормализованное значение содержит сам ссылочный символ». Конечно, на практике это будет работать только в совместимых реализациях ...

MvanGeest 26.06.2016 02:10

Как указывали другие, спецификация XML не позволяет сохранять пробелы в атрибутах. Фактически, это одно из немногих различий между тем, что вы можете делать с атрибутами и элементами (другой основной фактор заключается в том, что элементы могут содержать другие теги, а атрибуты - нет).

Вам придется сначала обработать файл вне XML, чтобы сохранить пробелы.

Я думаю, это заблуждение. Если вы можете управлять своим xml-процессором, само по себе кажется допустимым и возможным сохранить это пустое пространство. Я смог добиться результата.

n611x007 21.04.2015 23:13

Если вы можете управлять своим XML-процессором, вы можете это сделать.

Из моего другой ответ (с которым связано много ссылок):

если у вас есть XML, например

<?xml version = "1.0" encoding = "UTF-8" standalone = "no"?>
<!DOCTYPE elemke [
<!ATTLIST brush wood CDATA #REQUIRED>
]>

<elemke>
<brush wood = "guy&#xA;threep"/>
</elemke>

и XSL вроде

<?xml version = "1.0" encoding = "UTF-8"?>
<xsl:stylesheet  version = "1.0" xmlns:xsl = "http://www.w3.org/1999/XSL/Transform">

<xsl:template name = "split">
  <xsl:param name = "list"      select = "''" />
  <xsl:param name = "separator" select = "'&#xA;'" />
  <xsl:if test = "not($list = '' or $separator = '')">
    <xsl:variable name = "head" select = "substring-before(concat($list, $separator), $separator)" />
    <xsl:variable name = "tail" select = "substring-after($list, $separator)" />

    <xsl:value-of select = "$head"/>
    <br/><xsl:text>&#xA;</xsl:text>
    <xsl:call-template name = "split">
        <xsl:with-param name = "list"      select = "$tail" />
        <xsl:with-param name = "separator" select = "$separator" />
    </xsl:call-template>
  </xsl:if>
</xsl:template>


<xsl:template match = "brush">
  <html>
  <xsl:call-template name = "split">
    <xsl:with-param name = "list" select = "@wood"/>
  </xsl:call-template>
  </html>
</xsl:template>

</xsl:stylesheet>

вы можете получить html, например:

<html>guy<br>
   threep<br>

</html>  

как проверено / произведено с процессором, подобным этой командной строке саксонский:

java -jar saxon9he.jar -s:in.xml -xsl:in.xsl -o:out.html

ATTLIST и DOCTYPE здесь фактически не нужны, CDATA будет здесь "типом атрибута" по умолчанию для этого AttValue.

n611x007 21.04.2015 23:20

К вашему сведению, случайный пост о процессоре против парсера: xygenxml.com/archives/xsl-list/200009/msg00750.html

n611x007 21.04.2015 23:23

Кредит Томалак для шаблона 'string', потому что в моем целевом xml-процессоре tokenize был недоступен.

n611x007 21.04.2015 23:24

Другие вопросы по теме