Tag: xml

parsingJSON比parsingXML更快: 我正在创build一个复杂的JavaScript库来处理我公司的服务器端框架。服务器端框架将其数据编码为简单的XML格式。没有花哨的命名空间或类似的东西。理想情况下，我想将浏览器中的所有数据parsing为JSON。但是，如果我这样做，我需要重写一些服务器端代码也吐出JSON。这是一个痛苦，因为我们有公共的API，我不能轻易改变。我真正关心的是浏览器中parsingJSON和XML的性能。真的有很大的不同吗？还是应该专门去JSON？有没有人有任何经验或在两者之间的性能差异的基准？我意识到，大多数现代Web开发人员可能会selectJSON，我可以看到为什么。不过，我真的只是performance感兴趣。如果有一个certificate巨大的差异，那么我准备花费额外的精力为客户端生成JSON服务器端。

使用XPath，如何根据文本内容和属性值来select一个节点？: 鉴于这个XML： <DocText> <WithQuads> <Page pageNumber="3"> <Word> July <Quad> <P1 X="84" Y="711.25" /> <P2 X="102.062" Y="711.25" /> <P3 X="102.062" Y="723.658" /> <P4 X="84.0" Y="723.658" /> </Quad> </Word> <Word> </Word> <Word> 30, <Quad> <P1 X="104.812" Y="711.25" /> <P2 X="118.562" Y="711.25" /> <P3 X="118.562" Y="723.658" /> <P4 X="104.812" Y="723.658" /> </Quad> </Word> </Page> </WithQuads> 我想查找具有“July”文本和四/ P1 / X属性大于90的节点。因此，在这种情况下，它不应该返回任何匹配。 […]

正则expression式\ p {L}和\ p {N}: 我是新来的正则expression式，并给予以下正则expression式： (\p{L}|\p{N}|_|-|\.)* 我知道什么意思和| 意思是“或”，而\逃脱。但是我不知道\p{L}和\p{N}是什么意思。我search了Google，没有结果… 有人能帮我吗？

SAX模型是否有任何XPath处理器？: 我正在寻找一个XPath评估器，它不重build整个DOM文档来查找文档的节点：实际上，对象是用SAX模型pipe理大量的XML数据（理想情况下超过2Gb）有利于内存pipe理，并可以search节点。谢谢大家的支持！对于所有那些说不可能的人：我最近在问了这个问题之后，find了一个名为“saxpath”的项目（ http://www.saxpath.org/ ），但是我找不到任何的实施项目。

在GAE上parsing完全有效的XML时，“prolog中不允许使用内容”: 在过去的48小时里，我一直在对付这个绝对令人愤怒的虫子，所以我想我最终会扔在毛巾上，在我把笔记本电脑从窗户里扔出去之前，先试着问这里。我试图从我对AWS SimpleDB的调用中parsing响应XML。答案刚刚回来就好了; 例如，它可能看起来像： <?xml version="1.0" encoding="utf-8"?> <ListDomainsResponse xmlns="http://sdb.amazonaws.com/doc/2009-04-15/"> <ListDomainsResult> <DomainName>Audio</DomainName> <DomainName>Course</DomainName> <DomainName>DocumentContents</DomainName> <DomainName>LectureSet</DomainName> <DomainName>MetaData</DomainName> <DomainName>Professors</DomainName> <DomainName>Tag</DomainName> </ListDomainsResult> <ResponseMetadata> <RequestId>42330b4a-e134-6aec-e62a-5869ac2b4575</RequestId> <BoxUsage>0.0000071759</BoxUsage> </ResponseMetadata> </ListDomainsResponse> 我将这个XML传递给parsing器 XMLEventReader eventReader = xmlInputFactory.createXMLEventReader(response.getContent()); 并调用eventReader.nextEvent(); 一堆时间来获得我想要的数据。这是奇怪的部分 – 它在本地服务器内部工作得很好。回答来了，我parsing，大家都很开心。问题是，当我将代码部署到Google App Engine时，传出的请求仍然有效，并且响应XML似乎与我完全相同且正确，但响应无法parsing，但出现以下exception： com.amazonaws.http.HttpClient handleResponse: Unable to unmarshall response (ParseError at [row,col]:[1,1] Message: Content is not allowed in prolog.): <?xml […]

我应该使用XML中的元素还是属性？: 我正在学习W3School的XML属性。作者提到以下（重点是我的）： XML元素与属性 <person sex="female"> <firstname>Anna</firstname> <lastname>Smith</lastname> </person> <person> <sex>female</sex> <firstname>Anna</firstname> <lastname>Smith</lastname> </person> 在第一个例子中，性是一个属性。最后，性是一个元素。两个例子都提供了相同的信息。没有关于何时使用属性以及何时使用元素的规则。属性在HTML中很方便。在XML中，我的build议是避免它们。改用元素。避免XML属性？使用属性的一些问题是：属性不能包含多个值（元素可以）属性不能包含树结构（元素可以）属性不容易扩展（为了将来的变化）属性很难阅读和维护。使用数据元素。使用属性来获取与数据无关的信息。所以作者的观点是一个着名的，或者这是XML的最佳做法？ XML中的属性应该避免吗？ W3Schools还提到了以下内容（重点是我的）：元数据的XML属性有时ID引用被分配给元素。这些ID可以用来识别XML元素，就像HTML中的ID属性一样。这个例子演示了这个： <messages> <note id="501"> <to>Tove</to> <from>Jani</from> <heading>Reminder</heading> <body>Don't forget me this weekend!</body> </note> <note id="502"> <to>Jani</to> <from>Tove</from> <heading>Re: Reminder</heading> <body>I […]

如何在Python中将XML转换为JSON？: 可能重复：使用Python将XML转换为JSON？我在App Engine上做了一些工作，我需要将从远程服务器检索到的XML文档转换为等效的JSON对象。我使用xml.dom.minidom来parsing由urlfetch返回的XML数据。我也试图使用django.utils.simplejson将parsing的XML文档转换为JSON。我完全不知道如何把两者结合在一起。以下是我正在修改的代码： from xml.dom import minidom from django.utils import simplejson as json #pseudo code that returns actual xml data as a string from remote server. result = urlfetch.fetch(url,'','get'); dom = minidom.parseString(result.content) json = simplejson.load(dom) self.response.out.write(json)

是否可以在XML文档中插入HTML内容？: 我需要将HTML内容插入到XML文档中，这是可能的，还是应该将HTML内容编码到BASE64或其他类似的东西中？

在Eclipse中格式化XML代码: 当我在Eclipse中编写.xml文件时，我经常需要手动缩进代码。例如 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http://schemas.android.com/apk/res/android" android:background="@color/background" android:layout_height="fill_parent" android:layout_width="fill_parent" /> 格式化后它看起来像这样。 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http://schemas.android.com/apk/res/android" android:background="@color/background" android:layout_height="fill_parent" android:layout_width="fill_parent" /> 如何自动化呢？我无法在Eclipse for XML中find格式设置。

JQuery – 将ajax响应存储到全局variables中: 我仍然是jQuery和ajax场景的新手，但我有一个$ .ajax请求执行一个GET来检索一些XML文件（〜6KB或更less），但是在用户花费在该页面的XML内容应该不会/不会改变（这个devise我不能改变，我也没有改变XML文件，因为我正在从别的地方读取它）。因此，我有一个全局variables，它将响应数据存储到数据中，并且对数据的任何后续查找都在这个variables上完成，因此不需要进行多个请求。鉴于XML文件可以增加的事实，我不知道这是最好的做法，也来自java背景，我对全球公共variables的想法通常是一个禁忌。所以我的问题是，是否有更好的方法来做到这一点，以及如果文件扩展到一些荒谬的文件大小是否会导致任何内存问题的问题？我认为数据可以传递给xml对象中的一些getter / settertypes的函数，这将解决我的全局公共variables问题，但仍然提出了是否应该将响应存储在对象本身中的问题。例如，我现在做的是： // top of code var xml; // get the file $.ajax({ type: "GET", url: "test.xml", dataType: "xml", success : function(data) { xml = data; } }); // at a later stage do something with the 'xml' object var foo = $(xml).find('something').attr('somethingElse');