Tag: expression式

在PCRE / PHP中匹配Unicode字母字符

我试图写一个合理的宽容validation器的名称在PHP中,我的第一次尝试包括以下模式: // unicode letters, apostrophe, hyphen, space $namePattern = "/^([\\p{L}'\\- ])+$/"; 这最终传递给preg_match()的调用。 据我所知,这与你的香草ASCII字母表一起工作,但似乎在sp或张之类的更为棘手的字符上绊倒。 模式本身有什么问题吗? 也许我希望\p{L}做比我想象的更多的工作? 或者它与传入input的方式有什么关系? 我不确定它是否相关,但确实在表单页面上指定了UTF8编码。

有没有像正则expression式中的计数器variablesreplace?

如果我有很多比赛,例如在多线模式下,我想用比赛的一部分以及增加的计数器号码replace它们。 我想知道是否有任何正则expression式味道有这样一个variables。 我找不到一个,但我似乎记得这样的东西存在… 我不是在谈论脚本语言,您可以使用callback进行replace。 这是关于能够使用RegexBuddy,崇高的文本,gskinner.com/RegExr等工具来做到这一点…很像您可以用\ 1或$ 1引用捕获的子string一样。

为什么String.split需要pipe道分隔符才能被转义?

我正在试图parsing一个文件,每个行与pipe道分隔值。 它没有正确工作,当我没有逃脱pipe道分隔方法的分隔符,但它逃脱了如下所示的pipe道后正常工作。 private ArrayList<String> parseLine(String line) { ArrayList<String> list = new ArrayList<String>(); String[] list_str = line.split("\\|"); // note the escape "\\" here System.out.println(list_str.length); System.out.println(line); for(String s:list_str) { list.add(s); System.out.print(s+ "|"); } return list; } 有人可以解释为什么pipe道angular色需要逃脱split()方法吗?

JavaScript的正则expression式 – 看看后面的替代?

这是一个在大多数正则expression式中工作正常的正则expression式: (?<!filename)\.js$ 这与匹配.js的string以.js结尾,除了filename.js Javascript没有正则expression式。 任何人都可以把一个替代正则expression式实现相同的结果,并在JavaScript中工作? 这里有一些想法,但需要帮手function。 我只是希望用正则expression式来实现它: http : //blog.stevenlevithan.com/archives/mimic-lookbehind-javascript

正则expression式(grep)用于多行search需要

可能重复: 如何在文件中search多行模式? 使用pcregrep 我正在运行一个grep来查找任何* .sql文件,它包含单词select后跟单词customerName后跟单词from 。 这个select语句可以跨越多行,可以包含制表符和换行符。 我已经尝试了以下几个变化: $ grep -liIr –include="*.sql" –exclude-dir="\.svn*" –regexp="select[a-zA-Z0- 9+\n\r]*customerName[a-zA-Z0-9+\n\r]*from" 然而,这只是永远运行。 任何人都可以帮助我正确的语法吗?

有没有正则expression式来检测有效的正则expression式?

是否有可能使用另一个正则expression式检测有效的正则expression式? 如果是这样,请给下面的例子代码。

不能用正则expression式逃避反斜杠?

我正在使用以下正则expression式 ^[a-zA-Z0-9\',!;\?\$\^:\\\/`\|~&\" @#%\*\{}\(\)_\+\.\s=-]{1,1000}$ 我知道这是丑陋的,但迄今为止,它的目的不是反斜杠不被允许,因为我认为它应该是因为它逃脱了,我也试过\\\而不是相同的结果。 有任何想法吗?

从string中删除非utf8字符

我有一个问题,从string中删除非UTF8字符,显示不正确。 字符是这样的0x97 0x61 0x6C 0x6F(hex表示) 删除它们的最好方法是什么? 正则expression式还是别的?

正则expression式来validationJSON

我正在寻找一个正则expression式,允许我validationjson。 对于正则expression式我是非常新的,我知道用正则expression式parsing是不好的,但它可以用来validation?

正则expression式匹配有效的IPv6地址

我在写一个匹配有效IPv6地址的正则expression式时遇到了麻烦,包括压缩forms的正则expression式(每个字节对中省略了::或前导零)。 有人可以提出一个满足要求的正则expression式吗? 我正在考虑扩展每个字节对,并用简单的正则expression式匹配结果。