婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > Ruby中XML格式數據處理庫REXML的使用方法指南

Ruby中XML格式數據處理庫REXML的使用方法指南

熱門標簽:樂昌電話機器人 北京語音電銷機器人價格 邯鄲外呼調研線路 武漢呼叫中心外呼系統線路商 真人語音電銷機器人系統 開封百應電銷機器人聯系方式 買了外呼系統不想用了怎么辦 電話機器人電話卡封號怎么辦 浦東上海400開頭的電話申請

以樹方式使用 REXML
REXML 的目的是 正好夠用。在最大程度上,它能很好地完成任務。 實際上, REXML 支持兩種不同樣式的 XML 處理 ― “樹”和“流”。 第一種樣式是 DOM 所嘗試要做的更簡單的版本;第二種樣式是 SAX 所嘗試要做的更簡單的版本。 讓我們先研究樹樣式。假設我們要提取上一個示例中的同一個地址簿文檔。 下面的示例來自我所創建的經修改的 eval.rb ; 標準 eval.rb (鏈接到 Ruby 教程)可以根據對復雜對象的表達式求值顯示非常長的計算結果 ― 我的 eval.rb 在沒有錯誤發生的情況下不作出反應:
如何使用 REXML 來引用嵌套數據

ruby> require "rexml/document"
ruby> include REXML
ruby> addrbook = (Document.new File.new "address.xml").root
ruby> persons = addrbook.elements.to_a("http://person")
ruby> puts persons[1].elements["address"].attributes["city"]
New York

這個表達式很普通。 .to_a() 方法創建文檔中所有 person> 元素的數組,在其它命名中它可能是有用的。 元素有點象 DOM 節點,但它其實更接近于 XML 本身(而且使用起來也更簡單)。 .to_a() 的參數是 XPath,在這種情況下,可以標識文檔中任何地方的所有 person> 元素。如果我們只需要第一層上的元素,可以使用:
創建匹配元素的數組

ruby> persons = addrbook.elements.to_a("/addressbook/person")

我們甚至可以更直接地將 XPath 用作 .elements 屬性的重載索引。例如:
使用 REXML 來引用嵌套數據的另一種方法

ruby> puts addrbook.elements["http://person[2]/address"].attributes["city"]
New York

請注意,XPath 使用基于 1 的索引,不象 Ruby 和 Python 數組使用基于 0 的索引。換句話說, 它仍是我們正在檢查其所在城市的同一個人。通過查看 REXML 請注意,XPath 使用基于 1 的索引,不象 Ruby 和 Python 數組使用基于 0 的索引。換句話說, 它仍是我們正在檢查其所在城市的同一個人。通過查看
用 REXML 顯示元素的 XML 源代碼

ruby> puts addrbook.elements["http://person[2]/address"]
address city='New York' street='118 St.' number='344' state='NY'/>
ruby> puts addrbook.elements["http://person[2]/contact-info"]
contact-info>
 email address='robb@iro.ibm.com'/>
 home-phone number='03-3987873'/>
/contact-info>

此外,XPath 不必只與一個元素匹配。我們已在定義 persons 數組時看見過,但另一個示例強調了這一點:
將多個元素與 XPath 匹配

ruby> puts addrbook.elements.to_a("http://person/address[@state='CA']")
address city='Sacramento' street='Spruce Rd.' number='99' state='CA'/>
address city='Los Angeles' street='Pine Rd.' number='1234' state='CA'/>

與此相反, .elements 屬性的索引只產生 第一個匹配的元素:
當 XPath 只匹配第一次出現時

ruby> puts addrbook.elements.to_a("http://person/address[@state='CA']")
address city='Sacramento' street='Spruce Rd.' number='99' state='CA'/>
address city='Los Angeles' street='Pine Rd.' number='1234' state='CA'/>

也可以通過 REXML 中的 XPath 類使用 XPath 地址, 它具有諸如 .first() 、 .each() 和 .match() 這樣的方法。
REXML 元素的一個獨特的慣用方法是 .each 迭代器。雖然 Ruby 有一個可對集合進行操作的循環結構 for , 但 Ruby 程序員通常更喜歡使用迭代器方法來將控制傳遞給代碼塊。下面的兩種結構是等價的, 但第二種結構有更為自然的 Ruby 感覺:
通過在 REXML 中匹配 XPath 進行迭代

ruby> for addr in addrbook.elements.to_a("http://address[@state='CA']")
  |  puts addr.attributes["city"]
  | end
Sacramento
Los Angeles
ruby> addrbook.elements.each("http://address[@state='CA']") {
  |  |addr| puts addr.attributes["city"]
  | }
Sacramento
Los Angeles

以流方式使用 REXML
出于“正好夠用”的目的, REXML 的樹方式可能是 Ruby 語言最簡單的方法。 但 REXML 還提供了一種流方式,它象是 SAX 的更輕量級的變體。 正如使用 SAX 一樣, REXML 沒有向應用程序程序員提供來自 XML 文檔的缺省數據結構。 相反,“listener”或“handler”類負責提供響應文檔流中各種事件的一組方法。 以下是常用集合:開始標記、結束標記、遇到的元素文本等等。
雖然流方式遠遠沒有象以樹方式工作那樣容易,但通常它的速度要快很多。 REXML 教程聲稱流方式的速度要快 1500倍。 雖然我沒有嘗試過對它進行基準測試,但我猜想這是一種有限的情況(我的小示例在樹方式中也是瞬間完成的)。 總之,如果速度要緊,那么速度上的差異很可能是顯著的。
讓我們研究一個非常簡單的示例,它所做的事情與上面的“列出加州城市”示例相同。 對它進行擴展以用于復雜的文檔處理相對比較簡單:
REXML 中 XML 文檔的流處理

ruby> require "rexml/document"
ruby> require "rexml/streamlistener"
ruby> include REXML
ruby> class Handler
  |  include StreamListener
  |  def tag_start name, attrs
  |    if name=="address" and attrs.assoc("state")[1]=="CA"
  |     puts attrs.assoc("city")[1]
  |    end
  |  end
  | end
ruby> Document.parse_stream((File.new "address.xml"), Handler.new)
Sacramento
Los Angeles

流處理示例中要注意的一件事情是,標記屬性被作為一組數組傳遞, 它要處理的工作比起散列要稍微多一點(但可能在庫中創建會更快)。

編碼問題
REXML所有文本節點中都是以UTF-8編碼的,所有調用的代碼都要注意這一點,在程序中,傳遞給REXML的字符串必須是經過UTF-8編碼的。

REXML不可能總是正確猜測出你的文本的編碼方式,所以它總是假定為UTF-8編碼。同時,如果你試圖添加其他編碼方式的文本,REXML不會發 出警告。添加者必須保證自己添加的是UTF-8的文本。如果添加標準的ASCII 7位編碼,是沒有關系的。如果使用ISO8859-1文本,必須在添加之前轉換為UTF-8編碼。可以使用text.unpack("C").pack("U")。變更編碼進行輸出,只有Document.write()和Document.to_s() 支持。如果需要輸出特定編碼的節點,必須用Output把輸出對象包裝起來。

e = Element.new "a/>"
e.text = "f\xfcr"  # ISO-8859-1 '??'
o = ''
e.write( Output.new( o, "ISO-8859-1" ) )

可以向Output傳遞任何支持的編碼。

您可能感興趣的文章:
  • Ruby中使用Nokogiri包來操作XML格式數據的教程
  • 實例解析Ruby程序中調用REXML來解析XML格式數據的用法
  • Ruby使用REXML庫來解析xml格式數據的方法
  • Ruby程序中創建和解析XML文件的方法
  • 在Ruby中處理XML和XSLT以及XPath的簡單教程
  • Ruby的XML格式數據解析庫Nokogiri的使用進階

標簽:自貢 河北 鄂州 六安 松原 石嘴山 宜春 淄博

巨人網絡通訊聲明:本文標題《Ruby中XML格式數據處理庫REXML的使用方法指南》,本文關鍵詞  Ruby,中,XML,格式,數據處理,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Ruby中XML格式數據處理庫REXML的使用方法指南》相關的同類信息!
  • 本頁收集關于Ruby中XML格式數據處理庫REXML的使用方法指南的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 余干县| 塔河县| 莲花县| 友谊县| 丰镇市| 会理县| 延庆县| 夏津县| 德清县| 荃湾区| 赣州市| 五常市| 本溪市| 特克斯县| 麻城市| 江山市| 明光市| 麻阳| 长岭县| 巴东县| 海丰县| 普格县| 甘洛县| 湘阴县| 周口市| 沈阳市| 寿阳县| 东源县| 枣强县| 顺平县| 芦溪县| 和政县| 罗山县| 崇州市| 贵德县| 张家口市| 宝山区| 余姚市| 乌兰浩特市| 宁德市| 兴城市|