Tag: numpy

从sklearn导入ImportError:无法导入名称check_build

我尝试从sklearn导入时出现以下错误: >>> from sklearn import svm Traceback (most recent call last): File "<pyshell#17>", line 1, in <module> from sklearn import svm File "C:\Python27\lib\site-packages\sklearn\__init__.py", line 16, in <module> from . import check_build ImportError: cannot import name check_build 我使用Python 2.7,scipy-0.12.0b1超级包,numpy-1.6.0超级包,scikit-learn-0.11我有一个Windows 7机器 我已经检查了这个问题的几个答案,但没有一个解决了这个错误。

从NumPy 2D数组中删除重复的列和行

我正在使用2D形状arrays来存储经度+纬度对。 有一点,我必须合并这些二维数组中的两个,然后删除任何重复的条目。 我一直在寻找一个类似numpy.unique的function,但我没有运气。 我一直在想的任何实现看起来都非常“没有优化”。 例如,我试图将数组转换为元组列表,删除重复的集合,然后再次转换为数组: coordskeys = np.array(list(set([tuple(x) for x in coordskeys]))) 有没有现有的解决scheme,所以我不重新发明轮子? 为了说清楚,我正在寻找: >>> a = np.array([[1, 1], [2, 3], [1, 1], [5, 4], [2, 3]]) >>> unique_rows(a) array([[1, 1], [2, 3],[5, 4]]) 顺便说一句,我只想使用它的元组列表,但列表是如此之大,他们消耗我的4Gb RAM + 4Gb交换(numpy数组更有效率)。

3D的Numpy meshgrid

Numpy的meshgrid对于将两个向量转换为坐标网格非常有用。 将这个扩展到三个维度的最简单方法是什么? 因此,给定三个向量x,y和z,构造可用作坐标的3x3D数组(而不是2x2D数组)。

如何将张量转换为TensorFlow中的一个numpy数组?

如何将Tensorflow与Python绑定一起使用张量转换为numpy数组?

使用SciPy或NumPy生成具有指定权重的离散随机variables

我正在寻找一个简单的函数,可以根据它们相应的(也是指定的)概率生成一个指定的随机值数组。 我只需要它来生成浮点值,但我不明白为什么它不应该能够产生任何标量。 我可以从现有的function中想到很多构build这个function的方法,但我想我可能只是错过了一个明显的SciPy或NumPyfunction。 例如: >>> values = [1.1, 2.2, 3.3] >>> probabilities = [0.2, 0.5, 0.3] >>> print some_function(values, probabilities, size=10) (2.2, 1.1, 3.3, 3.3, 2.2, 2.2, 1.1, 2.2, 3.3, 2.2) 注:我发现scipy.stats.rv_discrete,但我不明白它是如何工作的。 具体而言,我不明白这(下面)意味着什么,也不应该做什么: numargs = generic.numargs [ <shape(s)> ] = ['Replace with resonable value', ]*numargs 如果rv_discrete是我应该使用的,请给我一个简单的例子和​​上面的“形状”的说明解释?

从SciPy Sparse Matrix填充一个Pandas SparseDataFrame

我注意到pandas现在支持稀疏matrix和数组 。 目前,我创buildDataFrame()如下所示: return DataFrame(matrix.toarray(), columns=features, index=observations) 有没有办法用scipy.sparse.csc_matrix()或csr_matrix()创build一个csr_matrix() ? 转换为密集格式严重杀死RAM。 谢谢!

浓缩距离matrix如何工作? (pdist)

scipy.spatial.distance.pdist返回一个浓缩距离matrix。 从文档 : 返回一个压缩的距离matrixY.对于每个和(其中),度量dist(u = X [i],v = X [j])被计算并存储在条目ij中。 我以为我的意思是i*j 。 但是我想我可能是错的。 考虑 X = array([[1,2], [1,2], [3,4]]) dist_matrix = pdist(X) 那么文档说dist(X[0], X[2])应该是dist_matrix[0*2] 。 然而, dist_matrix[0*2]是0 – 不应该是2.8。 给定i和j ,我应该用什么公式来访问两个向量的相似性?

Numpyfunction多个条件

我有一个称为dists的距离数组。 我想select两个值之间的dists。 我写了下面这行代码来做到这一点: dists[(np.where(dists >= r)) and (np.where(dists <= r + dr))] 但是,这只能select条件 (np.where(dists <= r + dr)) 如果我通过使用一个临时variables顺序执行命令,它工作正常。 为什么上面的代码不起作用,我如何才能使它工作? 干杯

replace大于某个值的Python NumPy数组的所有元素

我有一个2D NumPy数组,并希望用255.0replace大于或等于阈值T的所有值。 据我所知,最根本的方法是: shape = arr.shape result = np.zeros(shape) for x in range(0, shape[0]): for y in range(0, shape[1]): if arr[x, y] >= T: result[x, y] = 255 什么是最简洁和pythonic的方式来做到这一点? 有没有更快(可能不那么简洁和/或pythonicless)的方式来做到这一点? 这将成为人体头部MRI扫描窗口/等级调整子程序的一部分。 2D numpyarrays是图像像素数据。

如何检查numpy / scipy中的blas / lapack链接?

基于这个步骤,我基于blas和lapack来或多或less地构build了我的numpy / scipy环境。 当我完成后,我该如何检查,我的numpy / scipy函数是否确实使用了先前构build的blas / lapackfunction?