如何规范一个NumPy数组在一定的范围内?

在对audio或图像arrays进行一些处理之后,需要在一定的范围内进行归一化处理,然后才能将其写回文件。 这可以这样做:

# Normalize audio channels to between -1.0 and +1.0 audio[:,0] = audio[:,0]/abs(audio[:,0]).max() audio[:,1] = audio[:,1]/abs(audio[:,1]).max() # Normalize image to between 0 and 255 image = image/(image.max()/255.0) 

有没有一个较为详细,方便的function方式来做到这一点? matplotlib.colors.Normalize()似乎没有关系。

 audio /= np.max(np.abs(audio),axis=0) image *= (255.0/image.max()) 

使用/=*=可以消除中间临时数组,从而节省一些内存。 所以,乘法比分割要便宜

 image *= 255.0/image.max() # Uses 1 division and image.size multiplications 

比…快得多

 image /= image.max()/255.0 # Uses 1+image.size divisions 

由于我们在这里使用的是基本的numpy方法,所以我认为这是一个有效的numpy解决scheme。

您也可以使用sklearn重新调整。 优点是您可以调整标准偏差的标准化,除了以数据为中心,还可以在任一轴,按function或logging执行此操作。

 from sklearn.preprocessing import scale X = scale( X, axis=0, with_mean=True, with_std=True, copy=True ) 

关键字参数axiswith_meanwith_std是自解释的,并以默认状态显示。 参数copy如果设置为False ,则在原地执行操作。 文档在这里 。

你可以使用“我”(如idiv,imul ..)版本,而且看起来并不糟糕:

 image /= (image.max()/255.0) 

对于另外一种情况,你可以写一个函数来规范一个n维数组:

 def normalize_columns(arr): rows, cols = arr.shape for col in xrange(cols): arr[:,col] /= abs(arr[:,col]).max() 

如果数组包含正面和负面的数据,我会去:

 import numpy as np a = np.random.rand(3,2) # Normalised [0,1] b = (a - np.max(a))/-np.ptp(a) # Normalised [0,255] as integer c = (255*(a - np.max(a))/-np.ptp(a)).astype(int) # Normalised [-1,1] d = 2*(a - np.max(a))/-np.ptp(a)-1 

另外值得一提的是,即使这不是OP的问题, 标准化 :

 e = (a - np.mean(a)) / np.std(a)