Преобразование XSLT: перемещение значений тегов в родительские

не могли бы вы поддержать меня со следующим преобразованием XSLT:

Исходный XML-файл:

<root>
    <Invoice>
        <ID>
            <_>INV12345</_>
        </ID>
        <InvoiceTypeCode>
            <_>01</_>
            <listVersionID>1.0</listVersionID>
        </InvoiceTypeCode>
        <InvoicePeriod>
            <StartDate>
                <_>2017-11-26</_>
            </StartDate>
            <EndDate>
                <_>2017-11-30</_>
            </EndDate>
        </InvoicePeriod>
        <AccountingSupplierParty>
            <AdditionalAccountID>
                <_>id-1234</_>
                <schemeAgencyName>name1</schemeAgencyName>
            </AdditionalAccountID>
        </AccountingSupplierParty>
    </Invoice>
</root>

Итоговый XML-файл:

<Invoice>
    <ID>NV12345</ID>
    <InvoiceTypeCode listVersionID = "1.0">01</InvoiceTypeCode>
    <InvoicePeriod>
        <StartDate>2017-11-26</StartDate>
        <EndDate>2017-11-30</EndDate>
    </InvoicePeriod>
    <AccountingSupplierParty schemeAgencyName = "name1">
        <AdditionalAccountID>id-1234</AdditionalAccountID>
    </AccountingSupplierParty>
</Invoice>

Необходимо сделать:

  • удалить корневой тег;
  • удалить все теги <_>, но их значения переместятся в родительские теги;
  • все остальные теги, кроме тегов <_>, перемещаются как атрибуты своих родительских тегов.

Такая задача возникла при преобразовании Джексоном UBL (Universal Business Language) из JSON в XML.

Я только что нашел, как удалить корневой тег:

<xsl:stylesheet version = "1.0" xmlns:xsl = "http://www.w3.org/1999/XSL/Transform">
    <!-- identity template --> 
    <xsl:template match = "node() | @*">   
        <xsl:copy>
            <xsl:apply-templates select = "node() | @*" />
        </xsl:copy>
    </xsl:template>

    <!-- remove root tag --> 
    <xsl:template match = "/*">   
        <xsl:apply-templates select = "node()" /> 
    </xsl:template>   
</xsl:stylesheet>

Результат, который вы показываете, не соответствует вашим собственным правилам: элемент schemeAgencyName является дочерним элементом AdditionalAccountID, но вы превратили его в атрибут его прародителя AccountingSupplierParty.

michael.hor257k 18.06.2024 17:21

Да, это моя ошибка, спасибо, @michael.hor257k

Volodymyr Patriiuk 19.06.2024 15:46
Стоит ли изучать PHP в 2026-2027 годах?
Стоит ли изучать PHP в 2026-2027 годах?
Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Приемы CSS-макетирования - floats и Flexbox
Приемы CSS-макетирования - floats и Flexbox
Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...
Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest
В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
0
2
52
2
Перейти к ответу Данный вопрос помечен как решенный

Ответы 2

Вы сформулировали три правила, и все они могут быть выражены в виде шаблонных правил.

Начните с шаблона удостоверения, в версии 3.0 это `<xsl:mode on-no-match="shallow-copy"/>; в более ранних версиях это нужно было указывать явно, но я вижу, что вы это сделали.

Вы также выполнили первое правило для удаления корневого элемента.

Следующий:

  • удалить все теги <_>, но их значения переместятся в родительские теги;

Это точно так же, как удаление корневого элемента:

<xsl:template match = "_"><xsl:apply-templates/></xsl:template>

(вам не нужно явно перемещать значения в родительский элемент, это произойдет автоматически).

Окончательно:

  • все остальные теги, кроме тегов <_>, перемещаются как атрибуты своих родительских тегов.

Я предполагаю (из вашего примера), что под «всеми остальными» вы подразумеваете все элементы, имеющие только текстовый контент. Это требует некоторого изменения порядка, поэтому правило необходимо применить на следующем уровне. Удобный трюк здесь — сортировка дочерних элементов по логическому условию (сортировка false перед истиной):

<xsl:template match = "*">
  <xsl:copy>
    <xsl:apply-templates>
      <xsl:sort select = "boolean(child::*)"/>
    </xsl:apply-templates>
  </xsl:copy>
</xsl:template>

<xsl:template match = "*[not(child::*)]">
  <xsl:attribute name = "{name()}" select = "."/>
</xsl:template>

или если вы все еще используете версию 1.0,

<xsl:template match = "*[not(child::*)]">
  <xsl:attribute name = "{name()}">
    <xsl:value-of select = "."/>
  </xsl:attribute>
</xsl:template>

Спасибо @MichaelKay за ответ. Первое преобразование работает отлично. Второй не компилируется: «Неожиданный атрибут 'select' со значением'». Третий выдает ошибку: «Невозможно добавить атрибут ''='INV12345' к элементу 'ID'»_

Volodymyr Patriiuk 18.06.2024 14:48
Ответ принят как подходящий

Я считаю, что получаю ожидаемый результат, используя эту таблицу стилей XSLT 1.0:

<xsl:stylesheet version = "1.0" xmlns:xsl = "http://www.w3.org/1999/XSL/Transform">
<xsl:output method = "xml" indent = "yes"/>
<xsl:strip-space elements = "*"/>

<xsl:template match = "*">
    <xsl:copy>
        <xsl:copy-of select = "@*"/>
        <!-- convert leaf child elements (except _) to attributes -->
        <xsl:for-each select = "*[not(* or self::_)]">
            <xsl:attribute name = "{name()}">
                <xsl:value-of select = "."/>
            </xsl:attribute>  
        </xsl:for-each>
        <!-- process other child elements and text nodes -->
        <xsl:apply-templates select = "*[*] | _ | text() "/>
    </xsl:copy>
</xsl:template>

<!-- remove root and _ elements --> 
<xsl:template match = "/* | _">   
    <xsl:apply-templates/> 
</xsl:template>

</xsl:stylesheet>

Но при этом не обрабатываются комментарии и инструкции по обработке.

Имейте в виду, что удаление корневого элемента может привести к тому, что результат станет фрагментом XML, а не корректным XML-документом.

Я вижу разницу между вашим результатом и тем, который ожидал ОП. Но, похоже, это потому, что вы следовали установленным правилам ФП - см. Мой комментарий к вопросу.

michael.hor257k 18.06.2024 17:24

Спасибо, @y.arazim, кажется, все работает отлично. И за замечания спасибо: мне не нужно обрабатывать комментарии и инструкции. И я уверен, что после удаления корневого тега я получу правильно сформированный XML-файл.

Volodymyr Patriiuk 18.06.2024 22:04

Только если вы можете быть уверены, что корневой элемент имеет только один дочерний узел.

y.arazim 18.06.2024 23:48

Другие вопросы по теме