Tag: 正则表达式

用特定模式从txt文件创建熊猫数据框

我需要基于以下结构创建基于文本文件的Pandas DataFrame: Alabama[edit] Auburn (Auburn University)[1] Florence (University of North Alabama) Jacksonville (Jacksonville State University)[2] Livingston (University of West Alabama)[2] Montevallo (University of Montevallo)[2] Troy (Troy University)[2] Tuscaloosa (University of Alabama, Stillman College, Shelton State)[3][4] Tuskegee (Tuskegee University)[5] Alaska[edit] Fairbanks (University of Alaska Fairbanks)[2] Arizona[edit] Flagstaff (Northern Arizona University)[6] Tempe (Arizona State University) Tucson (University […]

从字符串中提取主机名称

我只想匹配一个URL的根,而不是一个文本字符串的整个URL。 鉴于: http://www.youtube.com/watch?v=ClkQA2Lb_iE http://youtu.be/ClkQA2Lb_iE http://www.example.com/12xy45 http://example.com/random 我想得到最后2个实例解析到www.example.com或example.com域。 我听说正则表达式很慢,这将是我在页面上的第二个正则表达式,所以如果有反正没有正则表达式让我知道。 我正在寻求这个解决方案的JS / jQuery版本。

你如何才能与正则表达式匹配有效的罗马数字?

考虑到我的其他问题 ,我决定我甚至不能创建一个匹配罗马数字的正则表达式(更不用说一个可以产生它们的上下文无关文法了) 问题是只匹配有效的罗马数字。 例如,990不是“XM”,而是“CMXC” 我为这个正则表达式的问题是,为了允许或不允许某些字符,我需要回头看看。 例如,我们需要数千和数百个。 我可以允许M {0,2} C?M(允许900,1000,1900,2000,2900和3000)。 但是,如果比赛在CM上,我不能让后面的字符是C或D(因为我已经在900)。 我怎样才能表达这个正则表达式? 如果它在一个正则表达式中不能表达,那么它是否可以用上下文无关语法来表示?

jQuery验证:如何添加正则表达式验证规则?

我正在使用jQuery验证插件 。 好东西! 我想迁移我现有的ASP.NET解决方案来使用jQuery而不是ASP.NET验证器。 我缺少正则表达式验证器的替代品。 我想能够做到这样的事情: $("Textbox").rules("add", { regularExpression: "^[a-zA-Z'.\s]{1,40}$" }) 如何添加自定义规则来实现这一目标?

正则表达式来匹配网址

我正在使用下面的正则表达式来匹配一个URL: $search = "/([\S]+\.(MUSEUM|TRAVEL|AERO|ARPA|ASIA|COOP|INFO|NAME|BIZ|CAT|COM|INT|JOBS|NET|ORG|PRO|TEL|AC|AD|AE|AF|AG|AI|AL|AM|AN|AO|AQ|AR|AS|AT|AU|au|AW|AX|AZ|BA|BB|BD|BE|BF|BG|BH|BI|BJ|BL|BM|BN|BO|BR|BS|BT|BV|BW|BY|BZ|CA|CC|CD|CF|CG|CH|CI|CK|CL|CM|CN|CO|CR|CU|CV|CX|CY|CZ|DE|DJ|DK|DM|DO|DZ|EC|EDU|EE|EG|EH|ER|ES|ET|EU|FI|FJ|FK|FM|FO|FR|GA|GB|GD|GE|GF|GG|GH|GI|GL|GM|GN|GOV|GP|GQ|GR|GS|GT|GU|GW|GY|HK|HM|HN|HR|HT|HU|ID|IE|IL|IM|IN|IO|IQ|IR|IS|IT|JE|JM|JO|JP|KE|KG|KH|KI|KM|KN|KP|KR|KW|KY|KZ|LA|LB|LC|LI|LK|LR|LS|LT|LU|LV|LY|MA|MC|MD|ME|MF|MG|MH|MIL|MK|ML|MM|MN|MO|MOBI|MP|MQ|MR|MS|MT|MU|MV|MW|MX|MY|MZ|NA|NC|NE|NF|NG|NI|NL|NO|NP|NR|NU|NZ|OM|PA|PE|PF|PG|PH|PK|PL|PM|PN|PR|PS|PT|PW|PY|QA|RE|RO|RS|RU|RW|SA|SB|SC|SD|SE|SG|SH|SI|SJ|SK|SL|SM|SN|SO|SR|ST|SU|SV|SY|SZ|TC|TD|TF|TG|TH|TJ|TK|TL|TM|TN|TO|R|H|TP|TR|TT|TV|TW|TZ|UA|UG|UK|UM|US|UY|UZ|VA|VC|VE|VG|VI|VN|VU|WF|WS|YE|YT|YU|ZA|ZM|ZW)([\S]*))/i"; 但它有点搞砸了,因为它也匹配我不想要的“abc.php”。 和一些像ABC …测试。 我希望它匹配abc.com虽然。 和www.abc.com以及http://abc.com 。 这只是需要稍微调整,但我不知道是什么。 (应该有一个斜线后的任何域名,它现在没有检查,它只是检查\ S) 感谢您的时间。

正则表达式查找包含在两个字符之间的字符串,同时排除分隔符

我需要从字符串中提取一组包含在两个分隔符之间的字符,而不必自己返回分隔符。 一个简单的例子应该有帮助: 目标 :提取方括号之间的子字符串,而不返回括号本身。 基本字符串 : 这是一个测试字符串[或多或少] 如果我使用下面的注册表。 恩。 \ [*?\] 这场比赛是[或多或少] 。 我只需要更多或更少 (没有括号)。 可以做到吗?

如何分割一个字符串与多个分隔符在JavaScript中?

如何在JavaScript中使用多个分隔符分割字符串? 我试图分裂在逗号和空格,但是,AFAIK,JS的分裂功能只支持一个分隔符。

为什么用正则表达式解析XML是一个坏主意?

我只是审查了我以前的一篇文章,并注意到一些人建议我不使用正则表达式来解析XML。 在这种情况下,XML是相对简单的,正则表达式没有任何问题。 我也在解析一些其他的代码格式,所以为了统一起见,这是有道理的。 但我很好奇在其他情况下这可能会造成问题。 这只是一个“不要重蹈覆辙”的问题?

在正则表达式中支持\ K

\K转义序列将匹配的开始重置为令牌列表中的当前位置(这仅影响报告为完全匹配的内容)。 什么环境/语言/版本在正则表达式引擎中支持\K (保留),以及在模式中使用此功能需要哪些库(如果有的话)?

如何在SQLite查询中使用正则表达式?

我想在sqlite中使用正则表达式,但我不知道如何。 我的表有一个字符串这样的列:“3,12,13,14,19,28,32”现在,如果我键入“其中x LIKE'3”“我也得到包含像13或32 ,但我想只得到具有该字符串中的值3的行。 有谁知道如何解决这个问题?