DOM解析器 (三)
扫描二维码
随时随地手机看文章
Document节点
Document节点的两个直接子节点的类型分别是DocumentType类型和Element类型,其中的DocumentType节点对应着XML文件所关联的DTD文件,通过进一步获取该节点子孙节点来分析DTDL文件中的数据;而其中的Element类型节点对应着XML文件的根节点,通过进一步获取该Element类型节点子孙节点来分析XML文件中的数据。
Document 节点经常使用下列方法获取和该节点相关的信息。
Element getDocumentElement()
返回当前节点的Element子节点。
DocumentType getDoctype()
返回当前节点的DocumentType子节点。
NodeList getElementsByTagName(String name)
返回一个NodeList对象,该对象由当前节点的Element类型子孙节点组成,这些子孙节点的名字由参数name指定。
NodeList getElementsByTagNameNS(String namespaceURI,String localName)
返回一个NodeList对象,该对象由当前节点的Element类型子孙节点组成, 这些子孙节点的名字由参数localName指定,名称空间由参数namespaceURI 指定。
String getXmlEncoding()
返回XML文件使用的编码,即XML声明中encoding属性的值。
boolean getXmlStandalone()
返回XML声明中的standalone属性的值。未指定时返回NULL
standalone 用来表示该文件是否呼叫其它外部的文件。 这里所指的外部文件其实就是查检XML是不是有效的约束文件,或是DTD或是Schema
String getXmlVersion()
返回XML声明中的version属性的值
其中getXmlEncoding getXmlVersion getXmlStandalong在Android2.1中是没有的。
要解析的XML文件:
灵渠在广西壮族自治区兴安县境内,是世界上最古老的运河之一,有着“世界古代水利建筑明珠”的美誉。灵渠古称秦凿渠、零渠、陡河、兴安运河,于公元前214年凿成通航,距今已2217年,仍然发挥着功用。http://img.21ic.com/21ic_pic/CSDN/20120228094142711.jpg胶莱运河南起黄海灵山海口,北抵渤海三山岛,流经现胶南、胶州、平度、高密、昌邑和莱州等,全长200公里,流域面积达5400平方公里,南北贯穿山东半岛,沟通黄渤两海。胶莱运河自平度姚家村东的分水岭南北分流。南流由麻湾口入胶州湾,为南胶莱河,长30公里。北流由海仓口入莱州湾,为北胶莱河,长100余公里。http://img.21ic.com/21ic_pic/CSDN/20120228094142711.jpg位于淮河下游江苏省北部,西起洪泽湖边的高良涧,流经洪泽,青浦、淮安,阜宁、射阳,滨海等六县(区),东至扁担港口入海的大型人工河道。全长168km。http://img.21ic.com/21ic_pic/CSDN/20120228094142711.jpg
private Document parseXML(InputStream is) { if(is == null) return null; DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance(); // dbf.setValidating(true);//设置检查XML文件的有效性 // dbf.setIgnoringElementContentWhitespace(true);//设置忽略空白 // dbf.setNamespaceAware(false);//设置为true时,由DocumentBuilderFactory产生的DOM解析器支持名称空间 DocumentBuilder db = null; //DOM解析器 Document doc = null; try { db = dbf.newDocumentBuilder(); } catch (ParserConfigurationException e) { // TODO Auto-generated catch block e.printStackTrace(); } try { doc = db.parse(is);//可以通过解析XML得到一个Document // db.newDocument();//可以创建一个Document,然后修改它 } catch (SAXException e) { // TODO Auto-generated catch block e.printStackTrace(); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } DocumentType docType = doc.getDoctype(); String xmlEncoding = doc.getXmlEncoding();//android2.1不支持 String xmlVersion = doc.getXmlVersion(); boolean isAlone = doc.getXmlStandalone();//android2.1不支持 NodeList list = doc.getElementsByTagName("river"); int length = list.getLength(); for(int k = 0;k<length;k++) { Node node = list.item(k); String nodeName = node.getNodeName(); String textContent = node.getTextContent(); //取得当前节点下的所有Text节点内容,这里就包括introduction下和imageUrl下的Text以及空格 } return doc;
其中getXmlEncoding方法在XML设置了encoding的情况下,取不到,不知道为什么。