DOM4J 와 xpath 를 사용 하여 XML 분석(1)

3966 단어 springxmlLucene
books.xml:

<?xml version="1.0" encoding="UTF-8"?>
<books>
    <!--This is a test for dom4j, jakoes, 2007.7.19-->
    <book show="yes" url="lucene.net">
        <title id="456">Lucene Studing</title>
    </book>
    <book show="yes" url="dom4j.com">
        <title id="123">Dom4j Tutorials</title>
    </book>
    <book show="no" url="spring.org">
        <title id="789">Spring in Action</title>
    </book>
    <owner>O'Reilly</owner>
</books>

다음은 dom4j 의 xPath 를 사용 하여 해석 합 니 다.

public void parseBooks(){   
          
        SAXReader reader = new SAXReader();   
        try {   
            Document doc = reader.read("books.xml");   
            Node root = doc.selectSingleNode("/books");   
            List list = root.selectNodes("book[@url='dom4j.com']");   
              
            for(Object o:list){   
                  
                Element e = (Element) o;   
                String show=e.attributeValue("show");   
                System.out.println("show = " + show);   
            }   
             
        } catch (Exception e) {   
            e.printStackTrace();   
        }   
    }  

public void parseBooks(){
       
        SAXReader reader = new SAXReader();
        try {
            Document doc = reader.read("books.xml");
            Node root = doc.selectSingleNode("/books");
            List list = root.selectNodes("book[@url='dom4j.com']");
           
            for(Object o:list){
               
                Element e = (Element) o;
                String show=e.attributeValue("show");
                System.out.println("show = " + show);
            }
          
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
 

Document doc = reader.read("books.xml");XML 문 서 를 불 러 올 수 있다 는 뜻 입 니 다.
doc.asXML()을 보면 xml 문 서 를 인쇄 합 니 다.
  Node root = doc.selectSingleNode("/books");방금 불 러 온 xml 문서 의 books 노드 에 있 는 모든 내용 을 읽 는 것 입 니 다.이 예 에 대해 서도 전체 xml 문서 입 니 다.
  물론 우 리 는 책 노드 와 같은/books 의 특정한 노드 를 불 러 올 수 있 습 니 다.
Node root = doc.selectSingleNode("/books/book");
또는:Node root=doc.selectSingleNode("/books/*");
메모:책 노드 가 여러 개 있 으 면 첫 번 째 만 읽 습 니 다.
root.asXML()인쇄:

        Lucene Studing

  이렇게 많이 불 러 왔 으 니 내 가 원 하 는 노드 를 어떻게 정확하게 얻 을 수 있 을 까?서 두 르 지 말고 아래 를 보 세 요.
List list = root.selectNodes("book[@url='dom4j.com']");
books 노드 의 북 노드 를 읽 고 북 의 노드 의 url 속성 은 dom4j.com 이라는 뜻 입 니 다.
왜 list 를 사용 하여 받 습 니까?만약 에 두 개의 북 노드 가 있 고 그들의 url 속성 이 모두 dom4j.com 이 라면 이때 list 에 닫 혔 습 니 다.
  books 의 모든 북 노드 를 읽 으 려 면 다음 과 같이 할 수 있 습 니 다.
List list = root.selectNodes("book");
  books 노드 의 북 노드 에 있 는 title 노드 를 읽 으 려 면 다음 과 같이 할 수 있 습 니 다.
List list2 = root.selectNodes("book[@url='dom4j.com']/title[@id='123']");
  메모:selectNodes()매개 변수의 형식:
  노드 이름[@속성 명='속성 값'],예 를 들 어 북[@url='dom4j.com']
  만약 여러 노드 가 있다 면,"/"로 나 누 어 라.예 를 들 어 책[@url='dom4j.com']/title[@id='123']
  최근 에는 List 에 닫 힌 내용 을 읽 었 습 니 다.Node 로 읽 을 수도 있 고 Element 으로 변환 할 수도 있 습 니 다.
attributeValue("속성")는 이 노드 의 속성 값 을 읽 는 것 입 니 다.
getText()는 노드 의 내용 을 읽 는 것 입 니 다.

좋은 웹페이지 즐겨찾기