C#拆分string,但保持拆分字符/分隔符

我是由三个不同的字符分割一个string,但我希望输出包括我分裂的字符。 有没有简单的方法来做到这一点?

如果分裂的字符是, ,和; ,我会尝试:

 string[] parts = Regex.Split(originalString, @"(?<=[.,;])") 

(?<=PATTERN)对于PATTERN是积极的PATTERN 。 它应该在前面的文字符合PATTERN任何地方匹配,所以在任何字符出现之后应该有匹配(和分割)。

从BFree的答案构build,我有同样的目标,但我想分裂一个类似于原始分割方法的字符数组,我也有多个分割每个string:

 public static IEnumerable<string> SplitAndKeep(this string s, char[] delims) { int start = 0, index; while ((index = s.IndexOfAny(delims, start)) != -1) { if(index-start > 0) yield return s.Substring(start, index - start); yield return s.Substring(index, 1); start = index + 1; } if (start < s.Length) { yield return s.Substring(start); } } 

以防万一任何人想要这个答案以及…

你可以使用string[] parts = Regex.Split(originalString, @"(?=yourmatch)")代替string[] parts = Regex.Split(originalString, @"(?<=[.,;])")无论你的分隔符是什么,你的yourmatch

假设原来的string是

777-猫

777 – 狗

777 – 鼠标

777 – 大鼠

777 – 狼

Regex.Split(originalString, @"(?=777)")将返回

777 – 猫

777 – 狗

等等

这似乎工作,但它没有被testing太多。

 public static string[] SplitAndKeepSeparators(string value, char[] separators, StringSplitOptions splitOptions) { List<string> splitValues = new List<string>(); int itemStart = 0; for (int pos = 0; pos < value.Length; pos++) { for (int sepIndex = 0; sepIndex < separators.Length; sepIndex++) { if (separators[sepIndex] == value[pos]) { // add the section of string before the separator // (unless its empty and we are discarding empty sections) if (itemStart != pos || splitOptions == StringSplitOptions.None) { splitValues.Add(value.Substring(itemStart, pos - itemStart)); } itemStart = pos + 1; // add the separator splitValues.Add(separators[sepIndex].ToString()); break; } } } // add anything after the final separator // (unless its empty and we are discarding empty sections) if (itemStart != value.Length || splitOptions == StringSplitOptions.None) { splitValues.Add(value.Substring(itemStart, value.Length - itemStart)); } return splitValues.ToArray(); } 
 result = originalString.Split(separator); for(int i = 0; i < result.Length - 1; i++) result[i] += separator; 

编辑 – 这是一个不好的答案 – 我误解了他的问题,没有看到他是由多个字符分裂。)

(编辑 – 一个正确的LINQ版本是尴尬的,因为分隔符不应该连接到拆分数组中的最后一个string。)

迭代string(这是正则expression式的作用,当你发现一个分离器,然后剥离一个子string。

伪代码

 int hold, counter; List<String> afterSplit; string toSplit for(hold = 0, counter = 0; counter < toSplit.Length; counter++) { if(toSplit[counter] = /*split charaters*/) { afterSplit.Add(toSplit.Substring(hold, counter)); hold = counter; } } 

这是C#,但不是真的。 显然,select适当的函数名称。 另外,我认为那里可能会有一个错误的错误。

但那会做你所问的。

最近我写了一个扩展方法做到这一点:

 public static class StringExtensions { public static IEnumerable<string> SplitAndKeep(this string s, string seperator) { string[] obj = s.Split(new string[] { seperator }, StringSplitOptions.None); for (int i = 0; i < obj.Length; i++) { string result = i == obj.Length - 1 ? obj[i] : obj[i] + seperator; yield return result; } } } 

Regex.Split看起来可能可以做你想要的东西。

 using System.Collections.Generic; using System.Text.RegularExpressions; namespace ConsoleApplication9 { class Program { static void Main(string[] args) { string input = @"This;is:a.test"; char sep0 = ';', sep1 = ':', sep2 = '.'; string pattern = string.Format("[{0}{1}{2}]|[^{0}{1}{2}]+", sep0, sep1, sep2); Regex regex = new Regex(pattern); MatchCollection matches = regex.Matches(input); List<string> parts=new List<string>(); foreach (Match match in matches) { parts.Add(match.ToString()); } } } } 

Java代码:

 public static class String_Ext { public static string[] SplitOnGroups(this string str, string pattern) { var matches = Regex.Matches(str, pattern); var partsList = new List<string>(); for (var i = 0; i < matches.Count; i++) { var groups = matches[i].Groups; for (var j = 0; j < groups.Count; j++) { var group = groups[j]; partsList.Add(group.Value); } } return partsList.ToArray(); } } var parts = "abcde \tfgh\tikj\r\nlmno".SplitOnGroups(@"\s+|\S+"); for (var i = 0; i < parts.Length; i++) Print(i + "|" + Translate(parts[i]) + "|"); 

输出:

 0|abcde| 1| \t| 2|fgh| 3|\t| 4|ikj| 5|\r\n| 6|lmno| 

很多的答案! 一个我敲起来以各种string拆分(原来的答案迎合只是字符,即长度为1)。 这还没有经过充分的testing。

 public static IEnumerable<string> SplitAndKeep(string s, params string[] delims) { var rows = new List<string>() { s }; foreach (string delim in delims)//delimiter counter { for (int i = 0; i < rows.Count; i++)//row counter { int index = rows[i].IndexOf(delim); if (index > -1 && rows[i].Length > index + 1) { string leftPart = rows[i].Substring(0, index + delim.Length); string rightPart = rows[i].Substring(index + delim.Length); rows[i] = leftPart; rows.Insert(i + 1, rightPart); } } } return rows; } 

请参阅使用Regex.Split() 。 我认为u / veggerby的答案是最好的。 请注意,他使用围绕匹配的分隔符的正则expression式组句法(例如'('和')')将它们保留在返回的分割中。