Tag: numpy

错误:Microsoft Visual C ++ 10.0是必需的(无法findvcvarsall.bat)

我试图用PyCharm安装numpy,但我不断收到此错误: 错误:Microsoft Visual C ++ 10.0是必需的(无法findvcvarsall.bat)。 有人可以请我解释一下,我必须做什么来解决这个错误(尽可能简单和详细)? 即时通讯使用Python 3.4.2(我知道这已被回答之前,但我不明白)。

如何从一个numpy数组中提取任意一行的值?

我有一个包含一些图像数据的numpy数组。 我想绘制在图像上绘制的横断面的“轮廓”。 最简单的情况是与图像边缘平行的轮廓,所以如果图像数组是imdat ,那么选定点(r,c)处的轮廓简单地是imdat[r] (水平)或imdat[:,c] (垂直)。 现在,我想把两个点(r1,c1)和(r2,c2)作为input,它们都位于imdat 。 我想绘制连接这两点的线的值的轮廓。 从这样的一行中获得一个numpy数组的值的最好方法是什么? 更一般地说,沿着path/多边形? 我以前使用过切片和索引,但是我似乎无法得到这样一个优雅的解决scheme,即连续的切片元素不在同一行或列中。 谢谢你的帮助。

迭代一个numpy数组

有没有更详细的替代这个: for x in xrange(array.shape[0]): for y in xrange(array.shape[1]): do_stuff(x, y) 我想出了这个: for x, y in itertools.product(map(xrange, array.shape)): do_stuff(x, y) 这节省了一个缩进,但仍然非常丑陋。 我希望看起来像这样的伪代码: for x, y in array.indices: do_stuff(x, y) 有这样的事吗?

Softmax函数 – python

从Udacity的深度学习阶段来看,y_i的softmax就是简单的指数除以整个Y向量的指数之和: 其中S(y_i)是S(y_i)的softmax函数, e是指数, j是否。 input向量Y中的列。 我已经尝试了以下内容: import numpy as np def softmax(x): """Compute softmax values for each sets of scores in x.""" e_x = np.exp(x – np.max(x)) return e_x / e_x.sum() scores = [3.0, 1.0, 0.2] print(softmax(scores)) 它返回: [ 0.8360188 0.11314284 0.05083836] 但build议的解决scheme是: def softmax(x): """Compute softmax values for each sets of scores in x.""" […]

我如何使用numpy.correlate做自相关?

我需要做一组数字的自动关联,据我所知,它只是集合与自身的相关性。 我试过用numpy的相关函数,但我不相信结果,因为它几乎总是给出一个向量,其中第一个数不是最大的,它应该是这样的。 所以,这个问题真的是两个问题: numpy.correlate究竟是干什么的? 我怎样才能使用它(或其他)做自相关?

pandasread_csv low_memory和dtype选项

打电话时 df = pd.read_csv('somefile.csv') 我得到: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130:DtypeWarning:列(4,5,7,16)有混合types。 在导入时指定dtype选项或设置low_memory = False。 为什么low_memory选项与low_memory有关,为什么会使这个问题low_memory呢?

切片NumPy二维数组,或者如何从一个nxn数组(n> m)中提取一个mxm子matrix?

我想分割一个NumPy nxn数组。 我想提取该数组的m行和列的任意select(即在行数/列数中没有任何模式),使其成为一个新的mxm数组。 对于这个例子,让我们说数组是4×4,我想从中提取一个2×2数组。 这是我们的arrays: from numpy import * x = range(16) x = reshape(x,(4,4)) print x [[ 0 1 2 3] [ 4 5 6 7] [ 8 9 10 11] [12 13 14 15]] 要删除的行和列是相同的。 最简单的情况是当我想提取一个在开始或结束的2×2子matrix,即: In [33]: x[0:2,0:2] Out[33]: array([[0, 1], [4, 5]]) In [34]: x[2:,2:] Out[34]: array([[10, 11], [14, 15]]) 但是如果我需要删除另一个行/列的混合呢? […]

如何以正确的方式平滑曲线?

让我们假设我们有一个数据集,可能会给大概 import numpy as np x = np.linspace(0,2*np.pi,100) y = np.sin(x) + np.random.random(100) * 0.2 因此,我们有20%的数据集的变化。 我的第一个想法是使用scipy的UnivariateSpline函数,但问题是这并没有考虑到小噪声的好处。 如果考虑频率,背景比信号小得多,所以只有截止的样条可能是一个想法,但是这涉及到来回傅里叶变换,这可能导致不良行为。 另一种方式是移动平均线,但这也需要正确的延迟select。 任何提示/书籍或链接如何解决这个问题?

如何一个热点编码变体长度的function?

给出一个变体长度特征列表: features = [ ['f1', 'f2', 'f3'], ['f2', 'f4', 'f5', 'f6'], ['f1', 'f2'] ] 其中每个样本具有不同数量的特征,并且特征dtype是str并且已经很热。 为了使用sklearn的特征select工具,我必须将features转换成如下的2D数组: f1 f2 f3 f4 f5 f6 s1 1 1 1 0 0 0 s2 0 1 0 1 1 1 s3 1 1 0 0 0 0 我怎么能通过sklearn或numpy实现呢?

为什么numpy.array这么慢?

我对此感到困惑 def main(): for i in xrange(2560000): a = [0.0, 0.0, 0.0] main() $ time python test.py real 0m0.793s 现在让我们看看numpy: import numpy def main(): for i in xrange(2560000): a = numpy.array([0.0, 0.0, 0.0]) main() $ time python test.py real 0m39.338s 神圣的CPU周期蝙蝠侠! 使用numpy.zeros(3)改进,但仍然不够IMHO $ time python test.py real 0m5.610s user 0m5.449s sys 0m0.070s numpy.version.version ='1.5.1' 如果您想知道在第一个示例中是否跳过了列表创build优化,那么不是: […]