Tag: pandas

如何dynamic更新ipython笔记本中的一个循环(在一个单元格内)

环境:Python 2.7,matplotlib 1.3,IPython笔记本1.1,linux,chrome。 代码位于一个单独的input单元格中,使用–pylab=inline 我想使用IPython笔记本和pandas来消耗一个stream,并dynamic更新每5秒的情节。 当我使用print语句以文本格式打印数据时,它工作得很好:输出单元只是保持打印数据和添加新行。 但是,当我试图绘制数据(然后在一个循环中更新它),该图不会显示在输出单元格中。 但是,如果我删除循环,只需绘制一次。 它工作正常。 然后我做了一些简单的testing: i = pd.date_range('2013-1-1',periods=100,freq='s') while True: plot(pd.Series(data=np.random.randn(100), index=i)) #pd.Series(data=np.random.randn(100), index=i).plot() also tried this one time.sleep(5) 输出不会显示任何东西,直到我手动中断进程(ctrl + m + i)。 并且在我中断之后,图表正确显示为多条重叠线。 但是我真正想要的是每5秒显示并更新一次(或每当plot()函数被调用,就像我上面提到的print语句输出一样,这很好)。 只在细胞完成后显示最终的图表是不是我想要的。 我甚至试图在每个plot()之后明确添加draw()函数,等等。 不知道如何通过IPython笔记本中的一个单元格内的for / while循环来dynamic更新图表。

python从DataFrame制作热图

我有一个从Python的pandas包生成的数据框。 如何使用pandas包中的DataFrame生成热图。 import numpy as np from pandas import * Index= ['aaa','bbb','ccc','ddd','eee'] Cols = ['A', 'B', 'C','D'] df = DataFrame(abs(np.random.randn(5, 4)), index= Index, columns=Cols) >>> df ABCD aaa 2.431645 1.248688 0.267648 0.613826 bbb 0.809296 1.671020 1.564420 0.347662 ccc 1.501939 1.126518 0.702019 1.596048 ddd 0.137160 0.147368 1.504663 0.202822 eee 0.134540 3.708104 0.309097 1.641090 >>>

如何将单独的Pan​​das DataFrame作为子图进行绘制?

我有几个pandas数据框共享相同的价值规模,但有不同的列和索引。 当调用df.plot() ,我得到单独的graphics图像。 我真正想要的是把他们全部放在同样的情节下,但不幸的是我没有想出一个解决scheme,并且非常感谢他们的帮助。

如何将pandas数据框中的date转换为“date”数据types?

我有一个pandas数据框,其中的一列包含格式为“YYYY-MM-DD”的datestring,例如“2013-10-28”。 此刻,列的dtype是“对象”。 如何将列值转换为Pandasdate格式?

pandas可以自动识别date吗?

今天,我感到非常惊讶的是,从数据文件(例如)读取数据时,pandas能够识别值的types: df = pandas.read_csv('test.dat', delimiter=r"\s+", names=['col1','col2','col3']) 例如,可以通过这种方式检查: for i, r in df.iterrows(): print type(r['col1']), type(r['col2']), type(r['col3']) 在特定的整数,浮游物和string被正确识别。 不过,我有一个具有以下格式的date的列: 2013-6-4 。 这些date被认为是string(而不是Pythondate对象)。 有什么方法可以将“pandas”学习到认可的date?

pythonpandas数据框到字典

我有一个两列的数据框,并打算将其转换为Python字典 – 第一列将是关键,第二将是价值。 先谢谢你。 dataframe: id value 0 0 10.2 1 1 5.7 2 2 7.4

在Pandas数据框中查找唯一值,而不考虑行或列的位置

我有一个pandas数据框,我想find该数据框中的所有唯一值…不pipe行/列。 如果我有一个10 x 10的数据框,并假设他们有84个独特的值,我需要find他们 – 不是计数。 我可以创build一个集合并通过遍历数据框的行来添加每行的值。 但是,我觉得这可能是低效的(不能certificate这一点)。 有没有一种有效的方法来find它? 有没有预定义的function?

pandas:没有。 最大行数

我有一个问题,查看下面的DataFrame : n = 100 foo = DataFrame(index=range(n)) foo['floats'] = np.random.randn(n) foo 问题是它不会在ipython笔记本中按默认打印所有行,但是我必须切片来查看结果行。 即使以下选项也不会改变输出: pd.set_option('display.max_rows', 500) 有谁知道如何显示整个数组?

将Pandas Column转换为DateTime

在pandas DataFrame中有一个字段是以string格式导入的。 它应该是一个date时间variables。 如何将其转换为date时间列,然后根据date进行过滤。 例: DataFrame名称: raw_data 列名: Mycol 列中的值格式: '05SEP2014:00:00:00.000'

在pandas中混洗/置换DataFrame

什么是一个简单而有效的方法来按照行或列的方式在pandas中混洗数据框? 即如何编写一个函数shuffle(df, n, axis=0) ,它取一个dataframe,一个shuffle(df, n, axis=0)数n和一个轴( axis=0是行, axis=1是列)并返回一个dataframe的副本已经洗牌了n次。 编辑 :关键是要做到这一点,而不会破坏数据框的行/列标签。 如果你只是洗牌df.index丢失所有的信息。 我希望得到的df与原来的相同,除了行的顺序或列的顺序不同。 编辑2 :我的问题不清楚。 当我说洗牌行,我的意思是独立洗牌每一行。 所以,如果你有两个列a和b ,我希望每一行都是自己洗牌的,所以如果你只是重新sorting每一行,就没有a和b之间的相同关联。 就像是: for 1…n: for each col in df: shuffle column return new_df 但希望比天真的循环更有效。 这对我不起作用: def shuffle(df, n, axis=0): shuffled_df = df.copy() for k in range(n): shuffled_df.apply(np.random.shuffle(shuffled_df.values),axis=axis) return shuffled_df df = pandas.DataFrame({'A':range(10), 'B':range(10)}) shuffle(df, 5)