Tag: python

在Python中,是否有比较两个文本文件内容是否相同的简明方法?

我不在乎分歧是什么。 我只想知道内容是否有所不同。

内存中列表的大小

我只是在内存中试验了python数据结构的大小。 我写了下面的代码片断: import sys lst1=[] lst1.append(1) lst2=[1] print(sys.getsizeof(lst1), sys.getsizeof(lst2)) 我testing了以下configuration的代码: Windows 7 64bit,Python3.1:输出是: 52 40所以lst1有52个字节,而lst2有40个字节。 使用Python3.2的Ubuntu 11.4 32bit:输出是48 32 Ubuntu 11.4 32bit Python2.7: 48 36 任何人都可以向我解释为什么这两个大小不同,尽pipe两个列表都包含1? 在getsizeof函数的python文档中,我发现了以下内容: …adds an additional garbage collector overhead if the object is managed by the garbage collector. 在我的小例子中是这样吗?

更新spark中的dataframe列

看看新的spark数据框api,目前还不清楚是否可以修改dataframe列。 我将如何去改变数据框的行x列y中的值? 在pandas这将是df.ix[x,y] = new_value 编辑:合并下面说的,你不能修改现有的数据框,因为它是不可变的,但你可以返回一个新的数据框与所需的修改。 如果您只是想根据条件replace列中的值,如np.where : from pyspark.sql import functions as F update_func = (F.when(F.col('update_col') == replace_val, new_value) .otherwise(F.col('update_col'))) df = df.withColumn('new_column_name', update_func) 如果要对列执行一些操作并创build一个添加到数据框的新列: import pyspark.sql.functions as F import pyspark.sql.types as T def my_func(col): do stuff to column here return transformed_value # if we assume that my_func returns a string my_udf = F.UserDefinedFunction(my_func, […]

Python中的营业日

我需要从当前date减去工作日 。 我目前有一些代码需要在最近的工作日始终运行。 如果我们是星期一到星期五,今天可能是今天,但是如果是星期六或星期天,那么我需要把它设置回周末前的星期五。 我目前有一些非常笨重的代码来做到这一点: lastBusDay = datetime.datetime.today() if datetime.date.weekday(lastBusDay) == 5: #if it's Saturday lastBusDay = lastBusDay – datetime.timedelta(days = 1) #then make it Friday elif datetime.date.weekday(lastBusDay) == 6: #if it's Sunday lastBusDay = lastBusDay – datetime.timedelta(days = 2); #then make it Friday 有没有更好的办法? 我可以告诉timedelta工作在平日而不是日历天吗?

python bytearrays在哪里使用?

我最近遇到了python中称为bytearray的dataType。 有人可以提供需要bytearrays的场景吗?

用给定的均值计算正态分布的概率,标准偏差为Python

如何计算正态分布的概率给定的意思,标准为Python? 在这个问题中,我可以根据定义像OP那样定义自己的函数: 计算Python中的随机variables的概率 只是想知道是否有一个库函数调用将允许你这样做。 在我的想象中会这样: nd = NormalDistribution(mu=100, std=12) p = nd.prob(98) 在Perl中有一个类似的问题: 我怎样才能计算一个给定在Perl正常分布点的概率? 。 但我没有看到一个在Python中。 Numpy有一个random.normal函数,但它像抽样,不完全是我想要的。

为什么printf()在Python中给出一个奇怪的输出?

我试图在Linux的python命令行中使用C函数printf() 。 为了做到这一点,我导入了ctypes 。 我的问题是:如果我创build一个CDLL对象在CDLL中使用printf()函数,我得到一个非常奇怪的输出: >>> import ctypes >>> libc = ctypes.CDLL("libc.so.6") >>> for i in range(10): … libc.printf("%d", i) … 01 11 21 31 41 51 61 71 81 91 >>> 但是,当我在一个函数中调用这个循环时,它按预期工作: >>> import ctypes >>> libc = ctypes.CDLL("libc.so.6") >>> def pr(): … for i in range(10): … libc.printf("%d", i) … libc.printf("\n") … >>> […]

如何从Python中的类对象创build一个新的实例

我需要dynamic地在Python中创build一个类的实例。 基本上我使用load_module和inspect模块来导入和加载到类对象,但我不知道如何创build这个类对象的实例。 请帮忙!

我可以在Python3.x上使用Django(dev 1.6.x)上的MySQL吗?

我使用Django开发(1.6.x)从git回购,我想使用MySQL,但在settings.py文件无法安装MySQL,因为python3和Django不支持MySQL,所以我用pymysql包python3.x没有任何问题,但在Django无法在settings.py上settings.py 。 我可以在Django上使用mysql(或pymysql或?)与python3吗?

使用Python在Google App Engine数据存储中复制实体,而不必在“编译”时知道属性名称

在我写的一个Python的Google App Engine应用程序中,我有一个存储在数据存储中的实体,我需要检索该实体,并将其复制一份(除了密钥外),然后放回该实体。 我应该怎么做? 特别是,当我这样做的时候,有没有什么需要注意的警告或诀窍,以便得到我期望的那种副本,而不是别的。 埃塔:呃,我试了一下,我碰到了问题。 我想以这样的方式制作我的副本,以便在编写代码时不必知道属性的名称。 我的想法是这样做的: #theThing = a particular entity we pull from the datastore with model Thing copyThing = Thing(user = user) for thingProperty in theThing.properties(): copyThing.__setattr__(thingProperty[0], thingProperty[1]) 这个执行没有任何错误,直到我试图从数据存储中取出copyThing,在这一点上,我发现所有的属性都设置为None(显然,除了用户和键之外)。 所以很明显,这段代码正在做一些事情,因为它将用Nonereplace默认值(所有属性都设置了默认值),但根本不是我想要的。 build议?