Tag: parsing

GCC和Clangparsing器是否真的是手写的?

看来GCC和LLVM-Clang使用手写recursion下降parsing器 ,而不是机器生成的,基于Bison-Flex的自底向上parsing。 请问有人可以证实这是事实吗? 如果是这样,为什么主stream编译器框架使用手写parsing器? 更新 : 这里有关这个话题的有趣的博客

findstring中最后一次出现的子string,将其replace

所以我有一个相同格式的string列表,我想find最后一个“。” 字符,并用“。 – ”代替。 我试过使用rfind,但我似乎无法正确使用它来做到这一点。

Double.TryParse或Convert.ToDouble – 哪个更快更安全?

我的应用程序使用VSTO读取Excel文件,并将读取的数据添加到StringDictionary 。 它只添加数字,只有几位数字(1000 1000,2 1000,34 – 逗号是俄罗斯标准中的分隔符)。 有什么更好的检查,如果当前string是一个合适的数字? object data, string key; // data had read try { Convert.ToDouble(regionData, CultureInfo.CurrentCulture); dic.Add(key, regionData.ToString()); } catch (InvalidCastException) { // is not a number } 要么 double d; string str = data.ToString(); if (Double.TryParse(str, out d)) // if done, then is a number { dic.Add(key, str); } 我必须使用StringDictionary而不是Dictionary<string, […]

我如何分割和parsingPython中的string?

我想在Python中分割这个string: 2.7.0_bf4fda703454 我想在下划线_上分割该string,以便我可以使用左侧的值。

在Node.js中parsing巨大的日志文件 – 逐行读取

我需要在Javascript / Node.js(我正在使用多维数据集)parsing大型(5-10 Gb)日志文件。 logline看起来像这样: 10:00:43.343423 I'm a friendly log message. There are 5 cats, and 7 dogs. We are in state "SUCCESS". 我们需要读取每一行,做一些parsing(例如,删除7和SUCCESS ),然后使用他们的JS客户端将这些数据抽取到Cube( https://github.com/square/cube )中。 首先,Node中的规范方法是逐行读入文件? 这似乎是相当普遍的问题在线: http://www.quora.com/What-is-the-best-way-to-read-a-file-line-by-line-in-node-js 在node.js中一次读取一行文件? 很多答案似乎指向了一堆第三方模块: https://github.com/nickewing/line-reader https://github.com/jahewson/node-byline https://github.com/pkrumins/node-lazy https://github.com/Gagle/Node-BufferedReader 但是,这似乎是一个相当基本的任务 – 当然,stdlib中有一个简单的方法来逐行读取文本文件? 其次,我需要处理每一行(例如将时间戳转换为Date对象,并提取有用的字段)。 什么是最好的方式来做到这一点,最大限度地提高吞吐量? 是否有某种方法不会在每行中读取或者将其发送到Cube? 第三 – 我猜测使用string拆分,包含(IndexOf!= -1?)的JS等价物将比正则expression式快很多? 有没有人在Node.js中parsing大量的文本数据有很多经验? 干杯,维克多

如何从它的hexRGBstring创build一个System.Drawing.Color?

我想从像#FF00FF或FF00FF这样的值创build一个System.Drawing.Color ,而不需要为此编写代码。 有任何.NET内置的parsing器呢?

无法加载文件或程序集System.Net.Http,版本= 4.0.0.0与ASP.NET(MVC 4)Web API OData预发行

问题 在安装Microsoft ASP.NET Web API OData包5.0.0-rc1 prerelease后,最终出现以下exception: 无法加载文件或程序集“System.Web.Http,Version = 4.0.0.0,Culture = neutral,PublicKeyToken = 31bf3856ad364e35”或其依赖项之一。 定位的程序集清单定义与程序集引用不匹配。 (来自HRESULT的exception:0x80131040) 我的MVC 4项目是全新的,真的很小,没有什么奇特的。 我的目标是.NET框架4.5 我需要这个nuget包来实现使用Delta类的PATCH (当我使用包的版本4.0.0.0时,Delta类不工作)。 我该如何解决这个问题? 我的版本的System.Web.Http 在GAC中,我有5.0.0.0版本的System.Web.Http gacutil -l System.Web.Http全局程序集caching包含以下程序集:System.Web.Http,Version = 5.0.0.0,Culture = neutral,PublicKeyToken = 31bf3856ad364e35,processorArchitecture = MSIL 在Visual Studio中 ,当我浏览程序集时,给定版本的System.Web.Http是4.0.0.0 (为什么?) 在我的项目中 ,引用System.Web.Http 有版本5.0.0.0 指向包的\ lib \ net45 \文件夹 有CopyLocal = true 我试过的东西 我试图在Web.config中将redirectv 4.0.0.0绑定到5.0.0.0 <dependentAssembly> <assemblyIdentity […]

如何将逗号分隔string转换为Python列表?

给定一个由commma分隔的几个值序列的string: mStr = 'A,B,C,D,E' 如何将string转换为列表? mList = ['A', 'B', 'C', 'D', 'E']

评估一串简单的mathexpression式

挑战 这是挑战(我自己的发明,尽pipe如果以前在网上其他地方出现过,我不会感到惊讶)。 编写一个函数,该函数接受一个简单的mathexpression式的string表示forms的单个参数,并将其评估为浮点值。 “简单expression式”可以包括以下任何一项:正数或负数小数, + , – , * , / , ( , ) 。 expression式使用(正常)中缀表示法 。 运营商应该按照它们出现的顺序进行评估,也就是说, 不应该像BODMAS那样进行评估 ,当然,应该正确观察括号。 该函数应该返回此表单的任何可能expression式的正确结果。 但是,该函数不必处理格式错误的expression式(即语法错误的expression式)。 expression式的例子: 1 + 3 / -8 = -0.5 (No BODMAS) 2*3*4*5+99 = 219 4 * (9 – 4) / (2 * 6 – 2) + 8 = 10 1 + ((123 * […]

从引用回复中parsing电子邮件内容

我试图弄清楚如何从任何可能包含的引用回复文本中parsing出电子邮件的文本。 我已经注意到,通常电子邮件客户端会在“如此如此写的date”上放置一个“尖括号”。 不幸的是,不是每个人都这样做 有没有人有任何想法如何以编程方式检测答复文本? 我正在使用C#编写这个parsing器。