Tag: 分裂应用组合

Python的pandas,DF.groupby()。agg(),列引用在agg()

在具体的问题上,说我有一个DataFrame DF word tag count 0 a S 30 1 the S 20 2 a T 60 3 an T 5 4 the T 10 我想为每个“单词”find“最多”的“标签” 。 所以回报会是这样的 word tag count 1 the S 20 2 a T 60 3 an T 5 我不在乎计数栏,或者订单/索引是原始的还是乱七八糟的。 返回字典{ 'the':'S' ,…}就好了。 我希望我能做到 DF.groupby(['word']).agg(lambda x: x['tag'][ x['count'].argmax() ] ) 但它不起作用。 […]