Tag: 独特

大pandas数量(不同)相当

我使用pandas作为数据库替代品,因为我有多个数据库(oracle,mssql等),我无法将一系列命令作为一个SQL等效。 我有一个表加载在一个DataFrame与一些列: YEARMONTH, CLIENTCODE, SIZE, …. etc etc 在SQL中,要计算每年不同客户端的数量将是: SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH; 结果会是 201301 5000 201302 13245 我怎样才能做到这一点在pandas?

在UNIX shell脚本中从列表中select唯一或不同的值

我有一个ksh脚本,返回一个很长的值列表,换行符分隔,我想只看到唯一/不同值。 有可能做到这一点? 例如,假设我的输出是目录中的文件后缀: tar gz java gz java tar class class 我想看到一个像这样的列表: tar gz java class

统计独特的价值

假设我有: v = rep(c(1,2, 2, 2), 25) 现在,我要计算每个唯一值出现的次数。 unique(v)返回唯一值是什么,但不是多less。 > unique(v) [1] 1 2 我想要一些给我的东西 length(v[v==1]) [1] 25 length(v[v==2]) [1] 75 但作为一个更一般的单线:)一些接近(但不完全)像这样: #<doesn't work right> length(v[v==unique(v)])

在Excel中的列中计算唯一值

我有一个包含一些数据的列的.xls文件。 我如何计算包含此列的唯一值的数量? 我search了很多选项,但是他们给出的公式总是给我错误。 例如, =INDEX(List, MATCH(MIN(IF(COUNTIF($B$1:B1, List)=0, 1, MAX((COUNTIF(List, "<"&List)+1)*2))*(COUNTIF(List, "<"&List)+1)), COUNTIF(List, "<"&List)+1, 0)) 回报

如何删除所有重复项,以便R中的数据框中保留NONE?

对于PHP也有类似的问题 ,但是我正在使用R,并且无法将解决scheme转换为我的问题。 我有这个数据框10行50列,其中一些行是绝对相同的。 如果我使用唯一的,我得到一行 – 我们说 – “types”,但我真正想要的是只得到那些只出现一次的行。 有谁知道我可以做到这一点? 我可以看一下簇和热图来手动sorting,但是我有比上面提到的更大的数据框(最多100行),这有点棘手。

按组添加ID列

我想根据两列纬度和经度在R中创build一个唯一的ID,以便重复的位置具有相同的簇ID。 例如: LAT LONG Cluster_ID 13.5330 -15.4180 1 13.5330 -15.4180 1 13.5330 -15.4180 1 13.5330 -15.4180 1 13.5330 -15.4170 2 13.5330 -15.4170 2 13.5330 -15.4170 2 13.5340 -14.9350 3 13.5340 -14.9350 3 13.5340 -15.9170 4 13.3670 -14.6190 5

在numpy.array中查找唯一的行

我需要在numpy.arrayfind唯一的行。 例如: >>> a # I have array([[1, 1, 1, 0, 0, 0], [0, 1, 1, 1, 0, 0], [0, 1, 1, 1, 0, 0], [1, 1, 1, 0, 0, 0], [1, 1, 1, 1, 1, 0]]) >>> new_a # I want to get to array([[1, 1, 1, 0, 0, 0], [0, 1, 1, 1, […]