如何在Python中对数组中的唯一值进行计数?

所以我试图让这个程序,将要求用户input并将值存储在数组/列表中。
然后当input一个空白行时,它会告诉用户有多less这些值是唯一的。
我是build立在真实生活的原因,而不是作为一个问题集。

enter: happy enter: rofl enter: happy enter: mpg8 enter: Cpp enter: Cpp enter: There are 4 unique words! 

我的代码如下:

 # ask for input ipta = raw_input("Word: ") # create list uniquewords = [] counter = 0 uniquewords.append(ipta) a = 0 # loop thingy # while loop to ask for input and append in list while ipta: ipta = raw_input("Word: ") new_words.append(input1) counter = counter + 1 for p in uniquewords: 

这就是我迄今所得到的一切。
我不确定如何计算列表中单词的唯一数量?
如果有人可以发布解决scheme,所以我可以从中学习,或至less告诉我如何将是伟大的,谢谢!

你可以使用一个集合去除重复,然后len函数来计算集合中的元素:

 len(set(new_words)) 

另外,使用collections.Counter来重构你的代码:

  from collections import Counter words = ['a', 'b', 'c', 'a'] Counter(words).keys() # equals to list(set(words)) Counter(words).values() # counts the elements' frequency 

使用一组 :

 words = ['a', 'b', 'c', 'a'] unique_words = set(words) # == set(['a', 'b', 'c']) unique_word_count = len(unique_words) # == 3 

有了这个武装,你的解决scheme可以像这样简单:

 words = [] ipta = raw_input("Word: ") while ipta: words.append(ipta) ipta = raw_input("Word: ") unique_word_count = len(set(words)) print "There are %d unique words!" % unique_word_count 
 ipta = raw_input("Word: ") ## asks for input words = [] ## creates list unique_words = set(words) 

以下应该工作。 lambda函数过滤出重复的单词。

 inputs=[] input = raw_input("Word: ").strip() while input: inputs.append(input) input = raw_input("Word: ").strip() uniques=reduce(lambda x,y: ((y in x) and x) or x+[y], inputs, []) print 'There are', len(uniques), 'unique words' 

我会自己使用一套,但还有另外一种方法:

 uniquewords = [] while True: ipta = raw_input("Word: ") if ipta == "": break if not ipta in uniquewords: uniquewords.append(ipta) print "There are", len(uniquewords), "unique words!" 
 ipta = raw_input("Word: ") ## asks for input words = [] ## creates list while ipta: ## while loop to ask for input and append in list words.append(ipta) ipta = raw_input("Word: ") words.append(ipta) #Create a set, sets do not have repeats unique_words = set(words) print "There are " + str(len(unique_words)) + " unique words!" 

虽然set是最简单的方法,但您也可以使用字典,并使用some_dict.has(key)来填充只有唯一键和值的字典。

假设您已经使用用户的input填充了words[] ,请创build一个将列表中的唯一单词映射到数字的字典:

 word_map = {} i = 1 for j in range(len(words)): if not word_map.has_key(words[j]): word_map[words[j]] = i i += 1 num_unique_words = len(new_map) # or num_unique_words = i, however you prefer 

对于ndarray函数调用唯一的np.unique(array_name)

对于系列有一个函数调用value_counts()exa- Series_name.value_counts()