什么是最简单的方法来在二维扩展一个numpy数组?

我有一个2d数组,看起来像这样:

XX xx 

什么是最有效的方式来添加一个额外的行和列:

 xxy xxy yyy 

对于奖励积分,我想也能够淘汰单行和列,所以例如在下面的matrix,我想能够淘汰所有的只剩下x的 – 特别是我试图同时删除第n行和第n列 – 我希望能够尽快做到这一点:

 xxaxx xxaxx aaaaa xxaxx xxaxx 

代码行我认为最短的是第一个问题。

 >>> import numpy as np >>> p = np.array([[1,2],[3,4]]) >>> p = np.append(p, [[5,6]], 0) >>> p = np.append(p, [[7],[8],[9]],1) >>> p array([[1, 2, 7], [3, 4, 8], [5, 6, 9]]) 

而第二个问题

  p = np.array(range(20)) >>> p.shape = (4,5) >>> p array([[ 0, 1, 2, 3, 4], [ 5, 6, 7, 8, 9], [10, 11, 12, 13, 14], [15, 16, 17, 18, 19]]) >>> n = 2 >>> p = np.append(p[:n],p[n+1:],0) >>> p = np.append(p[...,:n],p[...,n+1:],1) >>> p array([[ 0, 1, 3, 4], [ 5, 6, 8, 9], [15, 16, 18, 19]]) 

第一个问题的一个有用的替代答案,使用 tomeedee的答案,将使用numpy的 vstack column_stack 方法:

给定matrixp,

 >>> import numpy as np >>> p = np.array([ [1,2] , [3,4] ]) 

增广matrix可以通过以下方式产生:

 >>> p = np.vstack( [ p , [5 , 6] ] ) >>> p = np.column_stack( [ p , [ 7 , 8 , 9 ] ] ) >>> p array([[1, 2, 7], [3, 4, 8], [5, 6, 9]]) 

这些方法在实践中可能比np.append()方便,因为它们允许一维数组无需任何修改即可附加到matrix,与以下情况形成对比:

 >>> p = np.array([ [ 1 , 2 ] , [ 3 , 4 ] , [ 5 , 6 ] ] ) >>> p = np.append( p , [ 7 , 8 , 9 ] , 1 ) Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/usr/lib/python2.6/dist-packages/numpy/lib/function_base.py", line 3234, in append return concatenate((arr, values), axis=axis) ValueError: arrays must have same number of dimensions 

在回答第二个问题时,删除行和列的好方法是使用逻辑数组索引,如下所示:

给定matrixp,

 >>> p = np.arange( 20 ).reshape( ( 4 , 5 ) ) 

假设我们要删除第1行和第2列:

 >>> r , c = 1 , 2 >>> p = p [ np.arange( p.shape[0] ) != r , : ] >>> p = p [ : , np.arange( p.shape[1] ) != c ] >>> p array([[ 0, 1, 3, 4], [10, 11, 13, 14], [15, 16, 18, 19]]) 

注意 – 对于经过改造的Matlab用户 – 如果你想在一行中做这些,你需要索引两次:

 >>> p = np.arange( 20 ).reshape( ( 4 , 5 ) ) >>> p = p [ np.arange( p.shape[0] ) != r , : ] [ : , np.arange( p.shape[1] ) != c ] 

这种技术也可以扩展去除行和列的集合 ,所以如果我们想删除行0和2,列1,2和3,我们可以使用numpy的setdiff1d函数来生成所需的逻辑索引:

 >>> p = np.arange( 20 ).reshape( ( 4 , 5 ) ) >>> r = [ 0 , 2 ] >>> c = [ 1 , 2 , 3 ] >>> p = p [ np.setdiff1d( np.arange( p.shape[0] ), r ) , : ] >>> p = p [ : , np.setdiff1d( np.arange( p.shape[1] ) , c ) ] >>> p array([[ 5, 9], [15, 19]]) 

第一个问题的另一个优雅的解决scheme可能是insert命令:

 p = np.array([[1,2],[3,4]]) p = np.insert(p, 2, values=0, axis=1) # insert values before column 2 

导致:

 array([[1, 2, 0], [3, 4, 0]]) 

insert可能比append速度慢,但允许您用一个值填充整行/列。

至于第二个问题 ,之前已经build议delete

 p = np.delete(p, 2, axis=1) 

这又恢复了原始数组:

 array([[1, 2], [3, 4]]) 

我发现通过分配更大的matrix来“扩展”要容易得多。 例如

 import numpy as np p = np.array([[1,2], [3,4]]) g = np.array(range(20)) g.shape = (4,5) g[0:2, 0:2] = p 

这里是数组:

p

  array([[1, 2], [3, 4]]) 

g

 array([[ 0, 1, 2, 3, 4], [ 5, 6, 7, 8, 9], [10, 11, 12, 13, 14], [15, 16, 17, 18, 19]]) 

以及分配后的结果g

  array([[ 1, 2, 2, 3, 4], [ 3, 4, 7, 8, 9], [10, 11, 12, 13, 14], [15, 16, 17, 18, 19]]) 

您可以使用:

 >>> np.concatenate([array1, array2, ...]) 

例如

 >>> import numpy as np >>> a = [[1, 2, 3],[10, 20, 30]] >>> b = [[100,200,300]] >>> a = np.array(a) # not necessary, but numpy objects prefered to built-in >>> b = np.array(b) # "^ >>> a array([[ 1, 2, 3], [10, 20, 30]]) >>> b array([[100, 200, 300]]) >>> c = np.concatenate([a,b]) >>> c array([[ 1, 2, 3], [ 10, 20, 30], [100, 200, 300]]) >>> print c [[ 1 2 3] [ 10 20 30] [100 200 300]] 

〜 – + – 〜 – + – 〜 – + – 〜

有时,如果一个numpy数组对象的shape属性的初始值为不完整的值,会遇到麻烦。 这个问题是通过赋予shape属性元组来解决的:(array_length,element_length)。

注意:这里'array_length'和'element_length'是整数参数,可以replacefor中的值。 一个“元组”只是一对括号中的数字。

例如

 >>> import numpy as np >>> a = np.array([[1,2,3],[10,20,30]]) >>> b = np.array([100,200,300]) # initialize b with incorrect dimensions >>> a.shape (2, 3) >>> b.shape (3,) >>> c = np.concatenate([a,b]) Traceback (most recent call last): File "<pyshell#191>", line 1, in <module> c = np.concatenate([a,b]) ValueError: all the input arrays must have same number of dimensions >>> b.shape = (1,3) >>> c = np.concatenate([a,b]) >>> c array([[ 1, 2, 3], [ 10, 20, 30], [100, 200, 300]]) 

也许你需要这个。

 >>> x = np.array([11,22]) >>> y = np.array([18,7,6]) >>> z = np.array([1,3,5]) >>> np.concatenate((x,y,z)) array([11, 22, 18, 7, 6, 1, 3, 5])