Tag: XMLparsing

如何在C＃中编写parsing器？: 我如何去写在C＃中的parsing器（recursion下降？）？现在我只想要一个简单的parsing器来分析算术expression式（并读取variables？）。虽然后来我打算写一个XML和HTMLparsing器（用于学习的目的）。我这样做是因为parsing器有用的各种各样的东西：Web开发，编程语言解释器，内部工具，游戏引擎，地图和瓷砖编辑器等等。那么编写parsing器的基本理论是什么？在C＃中实现一个？ C＃是parsing器的正确语言（我曾经用C ++编写过一个简单的算术parsing器，效率很高，JIT编译certificate是否合适？）。任何有用的资源和文章。最重要的是，代码示例（或代码示例的链接）。注意：出于好奇，有没有人回答这个问题在C＃中实现了一个parsing器？

beautifulsoup findAll find_all: 我想用Pythonparsing一个html文件，我使用的模块是美丽的。我使用之后，发生了一些奇怪的事情。据说函数“find_all”是和“findAll”一样，但我已经试过了。但它是不同的。谁能告诉我不同？ import urllib, urllib2, cookielib from BeautifulSoup import * site = "http://share.dmhy.org/topics/list?keyword=TARI+TARI+team_id%3A407" rqstr = urllib2.Request(site) rq = urllib2.urlopen(rqstr) fchData = rq.read() soup = BeautifulSoup(fchData) t = soup.findAll('tr') print t

Android列表视图刷新: 我有一个ListView显示我通过数组（这是在另一个类，我通过它的对象访问它）的一些数据。每当我通过上下文菜单从ListView中删除一个元素时，这个列表不会刷新，而是从数组中删除这个元素。我如何刷新列表来显示这个？码： public void onCreateContextMenu(ContextMenu menu, View v, ContextMenuInfo menuInfo) { if (v.getId()==R.id.mainListView) { AdapterView.AdapterContextMenuInfo info = (AdapterView.AdapterContextMenuInfo)menuInfo; post=info.position; menu.setHeaderTitle(stocks[info.position]); String[] menuItems = stt; for (int i = 0; i<menuItems.length; i++) { menu.add(Menu.NONE, i, i, menuItems[i]); } } } @Override public boolean onContextItemSelected(MenuItem item) { AdapterView.AdapterContextMenuInfo info = (AdapterView.AdapterContextMenuInfo)item.getMenuInfo(); int menuItemIndex = item.getItemId(); […]

JavaparsingXML文档给“内容不允许在序言。”错误: 我正在用Java编写一个程序，它接受一个自定义XML文件并对其进行parsing。我正在使用XML文件进行存储。我在Eclipse中得到以下错误。 [Fatal Error] :1:1: Content is not allowed in prolog. org.xml.sax.SAXParseException: Content is not allowed in prolog. at com.sun.org.apache.xerces.internal.parsers.DOMParser.parse(DOMParser.java:239) at com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderImpl.parse(DocumentBuilderImpl.java:283 ) at javax.xml.parsers.DocumentBuilder.parse(DocumentBuilder.java:208) at me.ericso.psusoc.RequirementSatisfier.parseXML(RequirementSatisfier.java:61) at me.ericso.psusoc.RequirementSatisfier.getCourses(RequirementSatisfier.java:35) at me.ericso.psusoc.programs.RequirementSatisfierProgram.main(RequirementSatisfierProgram.java:23 ) 包含XML文件的开始部分： <?xml version="1.0" ?> <PSU> <Major id="IST"> <name>Information Science and Technology</name> <degree>BS</degree> <option> Information Systems: Design and Development Option</option> <requirements> <firstlevel type="General_Education" […]

是否允许XML属性值中的换行符？: 我意识到这不是优雅或想要的，但它允许（在格式良好的XML）的XML元素中的属性值跨越多行？例如 <some-xml-element value="this value goes over…. multiple lines!" /> 是的，我意识到有更好的写作方式。我会亲自把它写成： <some-xml-element> <value>this value goes over… multiple lines!</value> </some-xml-element> 要么： <some-xml-element value="this value goes over…. " /> 但是我们有我们自己的XMLparsing器，我想知道第一个例子是否允许在格式良好的XML中。

NetworkOnMainThread: 当我尝试实现下面的代码时，我得到一个NetworkOnMainThreadException： public class HandlingXMLStuff extends ListActivity{ static final String URL = "xml_file"; static final String ITEM = "item"; //parent static final String Id = "id"; static final String Name = "name"; static final String Desc = "desc"; static final String Link = "Link"; @Override public void onCreate(Bundle savedInstanceState){ super.onCreate(savedInstanceState); setContentView(R.layout.xmllist); ArrayList<HashMap<String, String>> menuItems = new […]

SAX和DOM有什么区别？: 我阅读了一些关于XMLparsing器的文章，并且遇到了SAX和DOM 。 SAX是基于事件的， DOM是树模型 – 我不了解这些概念之间的差异。从我所了解的情况来看，基于事件的意味着某种事件发生在节点上。就像点击一个特定的节点时，它会给所有的子节点，而不是同时加载所有的节点。但在DOMparsing的情况下，它将加载所有的节点，并build立树模型。我的理解是正确的吗？请纠正我如果我错了，或者以更简单的方式向我解释基于事件和树模型。

使用PythonparsingHTML: 我正在寻找一个Python的HTMLparsing器模块，它可以帮助我以Python列表/字典/对象的forms获取标签。如果我有一个文件的forms： <html> <head>Heading</head> <body attr1='val1'> <div class='container'> <div id='class'>Something here</div> <div>Something else</div> </div> </body> </html> 那么它应该给我一个方法来通过HTML标签的名称或ID来访问嵌套标签，这样我就可以基本上要求它把body标签中class='container'的div标签中的内容/文本或类似的东西。如果你已经使用Firefox的“检查元素”function（查看HTML），你会知道它会给你所有的标签，像树一样，以一种很好的嵌套方式。我更喜欢一个内置的模块，但可能会有点太多。在Stack Overflow和一些博客上，我经历了大量的问题，其中大部分都提到了BeautifulSoup或者lxml或者HTMLParser，但是很less有这些详细的function，只是最终争论哪个更快更好。

我应该在C ++中使用什么XMLparsing器？: 我有XML文档，我需要parsing和/或我需要build立XML文档，并将其写入文本（文件或内存）。由于C ++标准库没有这个库，我应该使用什么？注意：这是一个明确的，C ++ – FAQ风格的问题。所以是的，这是其他人的重复。我不是简单地适合那些其他的问题，因为他们倾向于要求更具体的东西。这个问题更通用。

通过“ElementTree”在Python中用命名空间parsingXML: 我有我想用Python的ElementTreeparsing的以下XML： <rdf:RDF xml:base="http://dbpedia.org/ontology/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:owl="http://www.w3.org/2002/07/owl#" xmlns:xsd="http://www.w3.org/2001/XMLSchema#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns="http://dbpedia.org/ontology/"> <owl:Class rdf:about="http://dbpedia.org/ontology/BasketballLeague"> <rdfs:label xml:lang="en">basketball league</rdfs:label> <rdfs:comment xml:lang="en"> a group of sports teams that compete against each other in Basketball </rdfs:comment> </owl:Class> </rdf:RDF> 我想查找所有owl:Class标签，然后提取其中所有rdfs:label实例的值。我正在使用下面的代码： tree = ET.parse("filename") root = tree.getroot() root.findall('owl:Class') 由于命名空间，我收到以下错误。 SyntaxError: prefix 'owl' not found in prefix map 我尝试阅读文档在http://effbot.org/zone/element-namespaces.htm，但我仍然无法得到这个工作，因为上面的XML有多个嵌套的命名空间。请让我知道如何改变代码来find所有的owl:Class标签。