pandas集团通过价值的范围

有一个简单的方法在pandas调用groupby值的增量范围？例如，考虑到下面的例子，我可以用0.155增量对B列进行分组和列组化，以便例如列B中的第一对组被划分成0, -0.155, 0.155 - 0.31 ...到0, -0.155, 0.155 - 0.31 ...之间的范围0, -0.155, 0.155 - 0.31 ...

 import numpy as np import pandas as pd df=pd.DataFrame({'A':np.random.random(20),'B':np.random.random(20)}) AB 0 0.383493 0.250785 1 0.572949 0.139555 2 0.652391 0.401983 3 0.214145 0.696935 4 0.848551 0.516692

或者，我可以首先将这些增量的数据分类到一个新的列，然后使用groupby来确定任何可能适用于A列的相关统计数据？

您可能对pd.cut感兴趣：

 >>> df.groupby(pd.cut(df["B"], np.arange(0, 1.0+0.155, 0.155))).sum() AB B (0, 0.155] 2.775458 0.246394 (0.155, 0.31] 1.123989 0.471618 (0.31, 0.465] 2.051814 1.882763 (0.465, 0.62] 2.277960 1.528492 (0.62, 0.775] 1.577419 2.810723 (0.775, 0.93] 0.535100 1.694955 (0.93, 1.085] NaN NaN [7 rows x 2 columns]

尝试这个：

 df = df.sort('B') bins = np.arange(0,1.0,0.155) ind = np.digitize(df['B'],bins) print df.groupby(ind).head()

当然，你可以使用组的任何function，而不仅仅是head 。

pandas集团通过价值的范围

如何在mediawiki中创build自己的自定义组？

Bashtesting中的复合条件组

Linq与计数组

从不删除或更新数据的通用数据库

我可以用Java正则expression式replace组吗？

如何为列中的每组相同值分配唯一的ID号

列的顺序是否按照分组来划分？

用于查找count> 1的logging的SQL查询

将Pandas GroupBy对象转换为DataFrame

如何列出Linux组中的所有用户？