Моя строка xml:
String neMsg= "<root>"
+" <CONTENT>"
+" <![CDATA[00000:<ResponseClass Name=\"Response\"><ITEM>HAHA</ITEM></ResponseClass>]]>"
+" </CONTENT>"
+"</root>";
Я пытался написать код четырьмя способами, но до сих пор не могу получить содержимое. Как решить эту проблему?
//java.util.regex.Pattern pP0=java.util.regex.Pattern.compile("<!\\[CDATA\\[00000:(\\s|\\S)*?\\]\\]>");
// java.util.regex.Pattern pP0=java.util.regex.Pattern.compile("<!\\[CDATA\\[00000:(.*)\\]\\]>");
// java.util.regex.Pattern pP0=java.util.regex.Pattern.compile("<CONTENT>(.*)<!\\[CDATA\\[(.*)\\]\\]>(.*)</CONTENT>");
Pattern pP0 = Pattern.compile(".*<!\\[CDATA\\[00000:(.*)\\]\\]>.*");
java.util.regex.Matcher mP0= pP0.matcher(neMsg);
System.out.println(mP0.group(1));




Вы никогда не должны анализировать HTML с помощью регулярных выражений, вместо этого вы можете использовать парсер HTML, такой как JSoup.
И проблема здесь в том, что вам нужно сначала вызвать метод matcherObject.find() (используйте его для поиска шаблона в любом месте строки) или matcherObject.matches() (используйте его для сопоставления всей строки с шаблоном), прежде чем вы сможете получить доступ к совпадению, а также вы должны сначала всегда проверьте, является ли значение, возвращенное find или matches, истинным, используя цикл if или while. Также вам нужно вызвать group(1) вместо group(0) (это вернет полное совпадение), чтобы получить доступ к содержимому из группы1.
Измените свой код на этот,
String neMsg = "<root>" + " <CONTENT>"
+ " <![CDATA[00000:<ResponseClass Name=\"Response\"><ITEM>HAHA</ITEM></ResponseClass>]]>"
+ " </CONTENT>" + "</root>";
Pattern pP0 = Pattern.compile(".*<!\\[CDATA\\[00000:(.*)\\]\\]>.*");
java.util.regex.Matcher mP0 = pP0.matcher(neMsg);
if (mP0.find()) { // matches method will also work because your pattern is wrapped with `.*` from both sides
System.out.println(mP0.group(1));
}
Печатает весь матч,
<ResponseClass Name = "Response"><ITEM>HAHA</ITEM></ResponseClass>
Не используйте регулярные выражения для разбора XML (или HTML и т.п.)!