如何将西里尔字符与正则expression式匹配

如何使用正则expression式匹配法语和俄语西里尔字母字符? 我只想做字母字符,没有数字或特殊字符。 现在我有

[A-ZA-Z]

6 Solutions collect form web for “如何将西里尔字符与正则expression式匹配”

这取决于你的正则expression风格。 如果它支持Unicode字符类(例如.NET), \p{L}匹配一个字母字符(在任何字符集中)。

要匹配俄罗斯(西里尔)字符,你可以使用这个正则expression式:

 [\p{IsCyrillic}] 

如果你使用现代的PHP版本 – 只是:

 preg_match("/^[\p{L}]+$/u"); 

不要忘记u标志为unicode支持!

看看这个问题:正则expression式和unicode

各种正则expression式方言使用[:alpha:]作为当前语言环境中的任何字母数字字符。 (你可能需要把它放在一个字符类中,例如[[:alpha:]] 。)

正则expression式匹配正则(英文)字母表的西里尔字母:

 ^[A-Za-z.!@?#"$%&:;() *\+,\/;\-=[\\\]\^_{|}<>\u0400-\u04FF]*$ 

它匹配特殊字符,西里尔文字母,英文字母。

  • Javascriptparsing错误'\ u2028'的Unicode字符
  • 如何从JSON获取string对象而不是Unicode?
  • 使用Python读取Pandas中的CSV文件时的UnicodeDecodeError
  • Java正则expression式中\ w和\ b的Unicode等价物?
  • 如何在Python 3中设置sys.stdout编码?
  • 获取一个字符的Unicode值
  • 如何从我的XML文件中删除BOM字符
  • Unicode Regex; 无效的XML字符
  • 为什么在XML 1.0中“控制”字符是非法的?
  • Python 2.6中对csv文件的一般Unicode / UTF-8支持
  • 什么是Python 3.4,Unicode,不同的语言和Windows的处理?