Tag: numpy

错误：Microsoft Visual C ++ 10.0是必需的（无法findvcvarsall.bat）: 我试图用PyCharm安装numpy，但我不断收到此错误：错误：Microsoft Visual C ++ 10.0是必需的（无法findvcvarsall.bat）。有人可以请我解释一下，我必须做什么来解决这个错误（尽可能简单和详细）？即时通讯使用Python 3.4.2（我知道这已被回答之前，但我不明白）。

如何从一个numpy数组中提取任意一行的值？: 我有一个包含一些图像数据的numpy数组。我想绘制在图像上绘制的横断面的“轮廓”。最简单的情况是与图像边缘平行的轮廓，所以如果图像数组是imdat ，那么选定点(r,c)处的轮廓简单地是imdat[r] （水平）或imdat[:,c] （垂直）。现在，我想把两个点(r1,c1)和(r2,c2)作为input，它们都位于imdat 。我想绘制连接这两点的线的值的轮廓。从这样的一行中获得一个numpy数组的值的最好方法是什么？更一般地说，沿着path/多边形？我以前使用过切片和索引，但是我似乎无法得到这样一个优雅的解决scheme，即连续的切片元素不在同一行或列中。谢谢你的帮助。

迭代一个numpy数组: 有没有更详细的替代这个： for x in xrange(array.shape[0]): for y in xrange(array.shape[1]): do_stuff(x, y) 我想出了这个： for x, y in itertools.product(map(xrange, array.shape)): do_stuff(x, y) 这节省了一个缩进，但仍然非常丑陋。我希望看起来像这样的伪代码： for x, y in array.indices: do_stuff(x, y) 有这样的事吗？

Softmax函数 – python: 从Udacity的深度学习阶段来看，y_i的softmax就是简单的指数除以整个Y向量的指数之和：其中S(y_i)是S(y_i)的softmax函数， e是指数， j是否。 input向量Y中的列。我已经尝试了以下内容： import numpy as np def softmax(x): """Compute softmax values for each sets of scores in x.""" e_x = np.exp(x – np.max(x)) return e_x / e_x.sum() scores = [3.0, 1.0, 0.2] print(softmax(scores)) 它返回： [ 0.8360188 0.11314284 0.05083836] 但build议的解决scheme是： def softmax(x): """Compute softmax values for each sets of scores in x.""" […]

我如何使用numpy.correlate做自相关？: 我需要做一组数字的自动关联，据我所知，它只是集合与自身的相关性。我试过用numpy的相关函数，但我不相信结果，因为它几乎总是给出一个向量，其中第一个数不是最大的，它应该是这样的。所以，这个问题真的是两个问题： numpy.correlate究竟是干什么的？我怎样才能使用它（或其他）做自相关？

pandasread_csv low_memory和dtype选项: 打电话时 df = pd.read_csv('somefile.csv') 我得到： /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130：DtypeWarning：列（4,5,7,16）有混合types。在导入时指定dtype选项或设置low_memory = False。为什么low_memory选项与low_memory有关，为什么会使这个问题low_memory呢？

切片NumPy二维数组，或者如何从一个nxn数组（n> m）中提取一个mxm子matrix？: 我想分割一个NumPy nxn数组。我想提取该数组的m行和列的任意select（即在行数/列数中没有任何模式），使其成为一个新的mxm数组。对于这个例子，让我们说数组是4×4，我想从中提取一个2×2数组。这是我们的arrays： from numpy import * x = range(16) x = reshape(x,(4,4)) print x [[ 0 1 2 3] [ 4 5 6 7] [ 8 9 10 11] [12 13 14 15]] 要删除的行和列是相同的。最简单的情况是当我想提取一个在开始或结束的2×2子matrix，即： In [33]: x[0:2,0:2] Out[33]: array([[0, 1], [4, 5]]) In [34]: x[2:,2:] Out[34]: array([[10, 11], [14, 15]]) 但是如果我需要删除另一个行/列的混合呢？ […]

如何以正确的方式平滑曲线？: 让我们假设我们有一个数据集，可能会给大概 import numpy as np x = np.linspace(0,2*np.pi,100) y = np.sin(x) + np.random.random(100) * 0.2 因此，我们有20％的数据集的变化。我的第一个想法是使用scipy的UnivariateSpline函数，但问题是这并没有考虑到小噪声的好处。如果考虑频率，背景比信号小得多，所以只有截止的样条可能是一个想法，但是这涉及到来回傅里叶变换，这可能导致不良行为。另一种方式是移动平均线，但这也需要正确的延迟select。任何提示/书籍或链接如何解决这个问题？

如何一个热点编码变体长度的function？: 给出一个变体长度特征列表： features = [ ['f1', 'f2', 'f3'], ['f2', 'f4', 'f5', 'f6'], ['f1', 'f2'] ] 其中每个样本具有不同数量的特征，并且特征dtype是str并且已经很热。为了使用sklearn的特征select工具，我必须将features转换成如下的2D数组： f1 f2 f3 f4 f5 f6 s1 1 1 1 0 0 0 s2 0 1 0 1 1 1 s3 1 1 0 0 0 0 我怎么能通过sklearn或numpy实现呢？

为什么numpy.array这么慢？: 我对此感到困惑 def main(): for i in xrange(2560000): a = [0.0, 0.0, 0.0] main() $ time python test.py real 0m0.793s 现在让我们看看numpy： import numpy def main(): for i in xrange(2560000): a = numpy.array([0.0, 0.0, 0.0]) main() $ time python test.py real 0m39.338s 神圣的CPU周期蝙蝠侠！使用numpy.zeros(3)改进，但仍然不够IMHO $ time python test.py real 0m5.610s user 0m5.449s sys 0m0.070s numpy.version.version ='1.5.1' 如果您想知道在第一个示例中是否跳过了列表创build优化，那么不是： […]