natsort函数的Python模拟(使用“自然顺序”algorithm对列表进行sorting)

我想知道在Python中是否有类似于PHP的natsort函数?

l = ['image1.jpg', 'image15.jpg', 'image12.jpg', 'image3.jpg'] l.sort() 

得到:

 ['image1.jpg', 'image12.jpg', 'image15.jpg', 'image3.jpg'] 

但我想得到:

 ['image1.jpg', 'image3.jpg', 'image12.jpg', 'image15.jpg'] 

UPDATE

解决scheme基于此链接

 def try_int(s): "Convert to integer if possible." try: return int(s) except: return s def natsort_key(s): "Used internally to get a tuple by which s is sorted." import re return map(try_int, re.findall(r'(\d+|\D+)', s)) def natcmp(a, b): "Natural string comparison, case sensitive." return cmp(natsort_key(a), natsort_key(b)) def natcasecmp(a, b): "Natural string comparison, ignores case." return natcmp(a.lower(), b.lower()) l.sort(natcasecmp); 

从我的答案 自然sortingalgorithm :

 import re def natural_key(string_): """See http://www.codinghorror.com/blog/archives/001018.html""" return [int(s) if s.isdigit() else s for s in re.split(r'(\d+)', string_)] 

例:

 >>> L = ['image1.jpg', 'image15.jpg', 'image12.jpg', 'image3.jpg'] >>> sorted(L) ['image1.jpg', 'image12.jpg', 'image15.jpg', 'image3.jpg'] >>> sorted(L, key=natural_key) ['image1.jpg', 'image3.jpg', 'image12.jpg', 'image15.jpg'] 

为了支持Unicodestring,应该使用.isdigit()而不是.isdigit() 。 请参阅@ phihag的评论中的示例。 相关: 如何显示Unicodes数值属性 。

.isdigit()在某些语言环境(例如Windows上的cp1252语言环境中的“\ xb2”('2'))中也可能失败( int()返回的值为Python 2上的字节串 。

您可以在PyPI上查看第三方的natsort库:

 >>> import natsort >>> l = ['image1.jpg', 'image15.jpg', 'image12.jpg', 'image3.jpg'] >>> natsort.natsorted(l) ['image1.jpg', 'image3.jpg', 'image12.jpg', 'image15.jpg'] 

充分披露,我是作者。

这个函数可以用作在Python 2.x和3.x中sortedkey=参数:

 def sortkey_natural(s): return tuple(int(part) if re.match(r'[0-9]+$', part) else part for part in re.split(r'([0-9]+)', s)) 
Interesting Posts