什么是parsing?

parsing是我在开发过程中遇到的很多问题,但是作为一个初级的解决scheme,我认为在需要的时候,我会在某个时间点解决问题。 在我目前的项目中,我被告知要为某个函数find并使用一个HTMLparsing器,在网上我find了一对,但是HTMLparsing器实际上做了什么? parsing一个对象意味着什么?

parsing通常适用于文本 – 阅读文本并将其转换为更有用的内存格式,在某种程度上“理解”它的含义。 例如,XMLparsing器将采用字符(或字节)序列并将其转换为元素,属性等。

在某些情况下(特别是编译器), 词法分析和语法分析是分开的,所以parsing器的真正“理解”部分工作在一系列令牌(标识符,运算符等)上,而不是在原始字符上。

你可以从这里开始: http : //en.wikipedia.org/wiki/Parsing 。 简短摘录:

parsing或语法分析是分析一串符号的过程,无论是自然语言还是计算机语言,都符合forms语法的规则。 术语parsing来自拉丁语pars(orationis),意思是部分(语音)。

parsing正在获取一组数据并从中提取有意义的信息。 使用HTMLparsing,您正在阅读一些html并返回一组结构化的标签和文本

parsing器是一个编译器/解释器组件,可以将数据分解成更小的元素,以便于翻译成另一种语言。 parsing器以令牌或程序指令序列的formsinputinput,并且通常以分析树或抽象语法树的forms构build数据结构。

Parse (computers) ,由Dictionary.com提供:

分析(string)以便将字符组与基础语法的语法单元相关联。

这是识别HTML内的标记[标签,属性]的过程。

在计算机科学和语言学中,句法分析或者更正式的句法分析是分析由一系列记号(例如单词)组成的文本的过程,以确定其关于给定(更多或更多)的语法结构less)forms语法。

:0)

维基百科

不要试图自己写一些简单的parsing器。 有这个使用ANTLR和野牛是我能想到的两个很好的工具。

如果您使用这些工具,当您遇到问题时,您将能够寻求帮助。

欢呼,马丁。