Tag: difflib

在Python中模糊string比较,与哪个库混淆使用

我想做模糊的string比较,但与哪个库混淆使用。 选项1: import Levenshtein Levenshtein.ratio('hello world', 'hello') Result: 0.625 选项2: import difflib difflib.SequenceMatcher(None, 'hello world', 'hello').ratio() Result: 0.625 在这个例子中,两者给出了相同的答案。 但我更喜欢使用difflib 。 任何专家的build议。 谢谢。 Updated: 我正在做临床消息正常化(拼写检查),在这个过程中,我检查每个给定的单词与900,000字医学词典。 我更关心时间复杂度/性能。 你认为在这种情况下两者performance相似吗?

在Python中使用difflib比较两个.txt文件

我想比较两个文本文件,并输出比较文件中的第一个string不匹配,但有困难,因为我是非常新的python。 任何人都可以给我一个样本来使用这个模块。 当我尝试像这样的东西: result = difflib.SequenceMatcher(None, testFile, comparisonFile) 我得到一个错误,说'文件'types的对象没有len。