删除包含特定string的文本文件中的行

我将如何使用sed删除包含特定string的文本文件中的整行？

要删除行并将输出打印到标准输出：

sed '/pattern to match/d' ./infile

要直接修改文件：

 sed -i '/pattern to match/d' ./infile

要直接修改文件（并创build一个备份）：

 sed -i.bak '/pattern to match/d' ./infile

对于Mac OS X用户：

 sed -i '' '/pattern/d' ./infile

还有很多其他方法可以删除sed以外的特定string

AWK

 awk '!/pattern/' file > temp && mv temp file

ruby（1.9+）

 ruby -i.bak -ne 'print if not /test/' file

Perl的

 perl -ni.bak -e "print unless /pattern/" file

壳（bash3.2 +）

 while read -r line do [[ ! $s =~ pattern ]] && echo "$line" done <file > o mv o file

GNU grep

 grep -v "pattern" file > temp && mv temp file

当然sed （打印反向比实际删除更快）。

 sed -n '/pattern/!p' file

您可以使用sed来replace文件中的行。但是，它似乎比使用grep反转第二个文件，然后将第二个文件移动到原来的要慢得多。

例如

 sed -i '/pattern/d' filename

要么

 grep -v "pattern" filename > filename2; mv filename2 filename

无论如何，我的机器上第一个命令需要3倍的时间。

简单的方法来做到这一点：

 sed --in-place '/some string here/d' yourfile

你可以考虑使用ex （这是一个标准的基于UNIX命令的编辑器）：

 ex +g/match/d -cwq file

哪里：

+执行给定的Ex命令（ man ex ），与执行wq （写入和退出）的-c相同，
g/match/d – 用于删除给定match行的Ex命令，请参阅： g的功率

上面的例子是POSIX兼容的方法，用于在Unix.SE和POSIX规范中就地编辑文件。

与sed的区别在于：

sed是一个文件编辑器，不是文件编辑器。 ^BashFAQ

除非你喜欢不可移植的代码，I / O开销和一些其他不良的副作用。所以基本上一些参数（如in-place / -i ）是非标准的FreeBSD扩展，可能在其他操作系统上不可用。

我在Mac上苦苦挣扎。另外，我需要使用variablesreplace。所以我用：

sed -i '' "/$pattern/d" $file

其中$file是需要删除的文件， $pattern是要删除的模式。从这个评论中挑选出来的。这里要注意的是在"/$pattern/d"使用双引号 。当我们使用单引号时，variables将不起作用。

要像grep那样得到一个像结果一样的地方，你可以这样做：

 echo "$(grep -v "pattern" filename)" >filename

你也可以使用这个

  grep -v 'pattern' filename

这里-v将打印只有你的模式（这意味着反转匹配）

我用一个包含大约345000行的文件做了一个小基准。在这种情况下，使用grep的方式似乎比sed方法快了15倍。

我已经尝试了和没有设置LC_ALL = C，似乎并没有显着改变时间。 searchstring（CDGA_00004.pdbqt.gz.tar）位于文件中间的某个位置。

这里是命令和时间：

 time sed -i "/CDGA_00004.pdbqt.gz.tar/d" /tmp/input.txt real 0m0.711s user 0m0.179s sys 0m0.530s time perl -ni -e 'print unless /CDGA_00004.pdbqt.gz.tar/' /tmp/input.txt real 0m0.105s user 0m0.088s sys 0m0.016s time (grep -v CDGA_00004.pdbqt.gz.tar /tmp/input.txt > /tmp/input.tmp; mv /tmp/input.tmp /tmp/input.txt ) real 0m0.046s user 0m0.014s sys 0m0.019s

SED：

'/James\|John/d'
-n '/James\|John/!p'

AWK：

'!/James|John/'
/James|John/ {next;} {print}

GREP：

-v 'James\|John'

 perl -i -nle'/regexp/||print' file1 file2 file3 perl -i.bk -nle'/regexp/||print' file1 file2 file3

echo -e "/thing_to_delete\ndd\033:x\n" | vim file_to_edit.txt

以防万一有人想要完成匹配的string，可以使用-w在grep中标记，w在整个中。也就是说，例如，如果要删除具有编号11的行，但保留编号为111的行：

 -bash-4.1$ head file 1 11 111 -bash-4.1$ grep -v "11" file 1 -bash-4.1$ grep -w -v "11" file 1 111

如果你想一次排除几个确切的模式，也可以使用-f标志。如果“黑名单”是要从“文件”中删除的每行上有多个模式的文件：

 grep -w -v -f blacklist file

删除包含特定string的文本文件中的行

Numpy修改数组的地方？

如何删除多个文件的尾部空格？

如何将制表符转换为目录的每个文件中的空格？

就地基数sorting

Python中a – = b和a = a – b之间的区别

如何使用合并sortingalgorithm就地sorting？

大pandas：特殊的性能下降后，在dropna重新命名

更新java映射条目