Раньше я использовал XML Parser, и хотя он работал нормально, в целом он меня не устраивал, мне казалось, что я использую обходные пути для вещей, которые должны быть базовой функциональностью.
Недавно я видел SimpleXML, но еще не пробовал. Это проще? Какие преимущества и недостатки есть у обоих? Какие еще парсеры вы использовали?
См. Следующий общий справочный вопрос по тегу PHP: Как анализировать и обрабатывать HTML / XML с помощью PHP?






Я бы сказал, что SimpleXML занимает первое место, потому что это, во-первых, расширение, написанное на C, и оно очень быстрое. Но во-вторых, проанализированный документ принимает форму объекта PHP. Таким образом, вы можете «запросить» как $root->myElement.
simplexml - лучший вариант. Но работать с пространствами имен не так хорошо, иногда это может быть сложно
Да, я тоже думаю, что это лучше. И я использую с ним xpath. $ xml-> xpath ("// block"); // ЭТО СУПЕР :)
Я не думаю, что это лучший вариант. Он не поддерживает xml version = "1.1" и выдает предупреждение об этом факте (моя версия PHP - 5.3.6). Я знаю, что вы можете отключить предупреждения, и все работает нормально, но я не думаю, что это хорошее решение. Итак, представьте, что произойдет, если ваш провайдер API изменит версию xml-документа с 1.0 на 1.1? Вторая мысль - это то, что указал @Gordon. SimpleXML загружает весь документ в память. Это хорошее решение, но, конечно, не лучшее.
Работа с XML с пространством имен с помощью SimpleXML - отстой.
SimpleXML создает другую структуру, когда у некоторого узла один дочерний элемент, и другую, когда у него больше дочерних узлов. Меня тошнит от этого!
Не используйте SimpleXml, если в будущем вам может потребоваться изменить XML. Я видел полученный код ... зрелище не очень красивое.
@BetLamed В настоящее время я согласен, но если вы пытались написать парсер с DOMDocument, вам придется в 10 раз больше кода и много сложностей.
@ jake-wilson Это SimpleXML - ключ к разгадке в названии
Альтернативы @BetLamed?
@agoldev Извините, я не помню, я написал это 4 года назад. В проекте, над которым я работал, я думаю, что в конечном итоге я использовал SimpleXML и кодировал проблемы, потому что его изменение было бы слишком большим трудом ...
Это зависит от того, что вы пытаетесь сделать с файлами XML. Если вы просто пытаетесь прочитать файл XML (например, файл конфигурации), Wicked Flea правильно предлагает SimpleXML, поскольку он создает то, что составляет вложенные объекты ArrayObject. например значение будет доступно $ xml-> root-> child.
Если вы хотите манипулировать файлами XML, вам, вероятно, лучше всего использовать DOM XML
Взгляните на PHP доступные расширения XML.
Основное различие между XML Parser и SimpleXML заключается в том, что последний не является анализатором pull. SimpleXML построен на основе расширений DOM и загружает в память весь XML-файл. XML Parser, такой как XMLReader, загружает в память только текущий узел. Вы определяете обработчики для определенных узлов, которые будут срабатывать, когда синтаксический анализатор обнаруживает их. Это быстрее и экономит память. Вы платите за это тем, что не можете использовать XPath.
Лично я считаю SimpleXml довольно ограничивающим (а значит, простым) в том, что он предлагает поверх DOM. Вы можете легко переключаться между DOM и SimpleXml, но я обычно не беспокоюсь и иду по маршруту DOM напрямую. DOM - это реализация W3C DOM API, поэтому вы, возможно, знакомы с ним по другим языкам, например по JavaScript.
так что ты используешь в основном?
Извините - просто искал информацию о различиях в API и пришел сюда. Обе ссылки devzone мертвы и не уверены, нужно ли их удалять или обновлять.
Это полезная функция для быстрого и простого разбора xml, когда расширение недоступно:
<?php
/**
* Convert XML to an Array
*
* @param string $XML
* @return array
*/
function XMLtoArray($XML)
{
$xml_parser = xml_parser_create();
xml_parse_into_struct($xml_parser, $XML, $vals);
xml_parser_free($xml_parser);
// wyznaczamy tablice z powtarzajacymi sie tagami na tym samym poziomie
$_tmp='';
foreach ($vals as $xml_elem) {
$x_tag=$xml_elem['tag'];
$x_level=$xml_elem['level'];
$x_type=$xml_elem['type'];
if ($x_level!=1 && $x_type == 'close') {
if (isset($multi_key[$x_tag][$x_level]))
$multi_key[$x_tag][$x_level]=1;
else
$multi_key[$x_tag][$x_level]=0;
}
if ($x_level!=1 && $x_type == 'complete') {
if ($_tmp==$x_tag)
$multi_key[$x_tag][$x_level]=1;
$_tmp=$x_tag;
}
}
// jedziemy po tablicy
foreach ($vals as $xml_elem) {
$x_tag=$xml_elem['tag'];
$x_level=$xml_elem['level'];
$x_type=$xml_elem['type'];
if ($x_type == 'open')
$level[$x_level] = $x_tag;
$start_level = 1;
$php_stmt = '$xml_array';
if ($x_type=='close' && $x_level!=1)
$multi_key[$x_tag][$x_level]++;
while ($start_level < $x_level) {
$php_stmt .= '[$level['.$start_level.']]';
if (isset($multi_key[$level[$start_level]][$start_level]) && $multi_key[$level[$start_level]][$start_level])
$php_stmt .= '['.($multi_key[$level[$start_level]][$start_level]-1).']';
$start_level++;
}
$add='';
if (isset($multi_key[$x_tag][$x_level]) && $multi_key[$x_tag][$x_level] && ($x_type=='open' || $x_type=='complete')) {
if (!isset($multi_key2[$x_tag][$x_level]))
$multi_key2[$x_tag][$x_level]=0;
else
$multi_key2[$x_tag][$x_level]++;
$add='['.$multi_key2[$x_tag][$x_level].']';
}
if (isset($xml_elem['value']) && trim($xml_elem['value'])!='' && !array_key_exists('attributes', $xml_elem)) {
if ($x_type == 'open')
$php_stmt_main=$php_stmt.'[$x_type]'.$add.'[\'content\'] = $xml_elem[\'value\'];';
else
$php_stmt_main=$php_stmt.'[$x_tag]'.$add.' = $xml_elem[\'value\'];';
eval($php_stmt_main);
}
if (array_key_exists('attributes', $xml_elem)) {
if (isset($xml_elem['value'])) {
$php_stmt_main=$php_stmt.'[$x_tag]'.$add.'[\'content\'] = $xml_elem[\'value\'];';
eval($php_stmt_main);
}
foreach ($xml_elem['attributes'] as $key=>$value) {
$php_stmt_att=$php_stmt.'[$x_tag]'.$add.'[$key] = $value;';
eval($php_stmt_att);
}
}
}
return $xml_array;
}
?>
работал как шарм, где simpleXml не удался в паре скриптов, над которыми я работаю, спасибо
получение ошибки - Примечание: неопределенная переменная: xml_array?
спасибо, это решит мою проблему с simpleXml!
синтаксический анализатор crxml действительно прост в синтаксическом анализе.
В этом классе есть функция поиска, которая принимает в качестве аргумента имя узла с любым пространством имен. Он ищет узел в xml и распечатывает инструкцию доступа для доступа к этому узлу с помощью этого класса. Этот класс также упрощает создание xml.
вы можете скачать этот класс на
http://freshmeat.net/projects/crxml
или с phpclasses.org
http://www.phpclasses.org/package/6769-PHP-Manipulate-XML-documents-as-array.html
Возможно, вы захотите сообщить, что являетесь автором этого класса.
PHPClasses.org все еще актуален? Обновлено: О, я думаю, это было еще в 11-м году.
Привет, я думаю, что SimpleXml очень полезен. И с ним я использую xpath;
$xml = simplexml_load_file("som_xml.xml");
$blocks = $xml->xpath('//block'); //gets all <block/> tags
$blocks2 = $xml->xpath('//layout/block'); //gets all <block/> which parent are <layout/> tags
Я использую много конфигураций xml, и это помогает мне очень быстро их разбирать.
SimpleXml написан на C, поэтому он очень быстрый.
Предложение для всех, кто это читает: задайте вопрос, описывающий, что вам нужно для делать с XML (помимо простого его анализа), и вы, вероятно, получите гораздо лучший ответ.