Лучший метод для анализа различных настраиваемых XML-документов в Java

Каков наилучший метод синтаксического анализа нескольких отдельных пользовательских XML-документов с помощью Java?

Покажите нам, как далеко вы продвинулись - мы не будем писать это за вас. Вы хотите сделать это с помощью DOM, SAX или другого? Что вы пробовали до сих пор? Какие руководства / документацию вы просмотрели?

— 14.03.2011 16:19

Используйте java dom api или sax для синтаксического анализа xml. Придайте более конкретную структуру xml.

— 14.03.2011 16:20

Попробуйте сопоставление касторка.

— 14.03.2011 16:20

Что ты уже сделал? У вас есть код, который вы хотите нам показать?

— 14.03.2011 16:20

если есть эффективность, я бы использовал SAX или по личным предпочтениям - StAX

— 14.03.2011 16:21

Голосуя за закрытие, в вопросе, на который я ответил, должно быть все, что вам нужно.

— 14.03.2011 16:21

java xml

22.08.2008 22:22

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Как вычислять биты и понимать побитовые операторы в Java - объяснение с примерами

В компьютерном программировании биты играют важнейшую роль в представлении и манипулировании данными на двоичном уровне. Побитовые операции...

Поднятие тревоги для долго выполняющихся методов в Spring Boot

Приходилось ли вам сталкиваться с требованиями, в которых вас могли попросить поднять тревогу или выдать ошибку, когда метод Java занимает больше...

Принятие принципов SOLID в Spring Boot: Создание обслуживаемых и масштабируемых приложений

Коллекции (ArrayList , HashSet , HashMap)

Полный курс Java для разработчиков веб-сайтов и приложений

Получите сертификат Java Web и Application Developer, используя наш курс.

7 333

Перейти к ответу Данный вопрос помечен как решенный

Ответы 6

Вы захотите использовать org.xml.sax.XMLReader (http://docs.oracle.com/javase/7/docs/api/org/xml/sax/XMLReader.html).

22.08.2008 22:27

Ответ принят как подходящий

Я бы использовал Stax для синтаксического анализа XML, он быстрый и простой в использовании. Я использовал его в своем последнем проекте для анализа файлов XML размером до 24 МБ. На java.net есть хорошее введение, в котором рассказывается все, что вам нужно знать, чтобы начать работу.

22.08.2008 23:45

По сути, у вас есть два основных метода синтаксического анализа XML в Java:

SAX, где вы используете обработчик, чтобы получить только то, что вы хотите в своем XML, и отбросить остальное
ДОМ, который постоянно анализирует ваш файл и позволяет вам захватывать все элементы в более древовидной форме.

Еще один очень полезный метод синтаксического анализа XML, хотя и немного более новый, чем эти, и включенный в JRE только с Java6, - это StAX. StAX был задуман как промежуточный метод между DOM, основанным на дереве, и подходом SAX, основанным на событиях. Он очень похож на SAX в том, что анализировать очень большие документы легко, но в этом случае приложение «извлекает» информацию из парсера, а не анализирует, «подталкивая» события к приложению. Вы можете найти больше объяснений по этому поводу здесь.

Итак, в зависимости от того, чего вы хотите достичь, вы можете использовать один из этих подходов.

скопировано из моего ответа в повторяющейся ветке, чтобы предоставить больше информации о различных методах

— 07.12.2010 16:58

07.12.2010 16:58

Если вам нужно только разобрать, я бы рекомендовал использовать библиотеку XPath. Вот хорошая ссылка: http://www.ibm.com/developerworks/library/x-javaxpathapi.html

Но вы можете подумать о том, чтобы превратить XML в объекты, и тогда пределом будет небо. Для этого вы можете использовать XStream, это отличная библиотека, которую я использую много.

14.03.2011 16:22

Используйте библиотеку dom4j

Сначала прочтите документ

import java.net.URL;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.io.SAXReader;

public class Foo {

    public Document parse(URL url) throws DocumentException {
        SAXReader reader = new SAXReader();
        Document document = reader.read(url);
        return document;
    }
}

Затем используйте XPATH, чтобы получить нужные значения.

public void get_author(Document document) {
    Node node = document.selectSingleNode( "//AppealRequestProcessRequest/author" );
    String author = node.getText();
    return author;
}

14.03.2011 16:34

Ниже приведен код извлечения некоторого значения значения с помощью vtd-xml.

import com.ximpleware.*;

public class extractValue{
    public static void  main(String s[]) throws VTDException, IOException{
        VTDGen vg = new VTDGen();
        if (!vg.parseFile("input.xml", false));
        VTDNav vn = vg.getNav();
        AutoPilot ap = new AutoPilot(vn);
        ap.selectXPath("/aa/bb[name='k1']/value");
        int i=0;
        while ((i=ap.evalXPath())!=-1){
            System.out.println(" value ===>"+vn.toString(i));
        }   
    }
}

24.03.2016 02:11

Другие вопросы по теме

Рекомендации по сборке XML

Как удалить недопустимые шестнадцатеричные символы из источника данных на основе XML до создания XmlReader или XPathDocument, использующего эти данные?

Удаление узлов из XmlDocument

Сериализация XML и унаследованные типы

Как встраивать двоичные данные в XML?

Загрузка раздела конфигурации System.ServiceModel с помощью ConfigurationManager

Принудительное оформление атрибутов классов / методов

CURL добавляет пробел для публикации контента?

Mac iWork / Автоматизация страниц

Лучший метод для анализа различных настраиваемых XML-документов в Java

Ответы 6

Другие вопросы по теме

Похожие вопросы