python中數據拼接的集中操作

數組拼接方法一

思路:首先將數組轉成列表,然後利用列表的拼接函數append()、extend()等進行拼接處理,最後將列表轉成數組。

示例1:

>>> import numpy as np
>>> a=np.array([1,2,5])
>>> b=np.array([10,12,15])
>>> a_list=list(a)
>>> b_list=list(b)

>>> a_list.extend(b_list)

>>> a_list
[1, 2, 5, 10, 12, 15]
>>> a=np.array(a_list)
>>> a
array([ 1,  2,  5, 10, 12, 15])

該方法只適用於簡單的一維數組拼接,由於轉換過程很耗時間,對於大量數據的拼接一般不建議使用。

 

數組拼接方法二

思路:numpy提供了numpy.append(arr, values, axis=None)函數。對於參數規定,要麼一個數組和一個數值;要麼兩個數組,不能三個及以上數組直接append拼接。append函數返回的始終是一個一維數組。

示例2:

>>> a=np.arange(5)
>>> a
array([0, 1, 2, 3, 4])
>>> np.append(a,10)
array([ 0,  1,  2,  3,  4, 10])
>>> a
array([0, 1, 2, 3, 4])

 

>>> b=np.array([11,22,33])
>>> b
array([11, 22, 33])
>>> np.append(a,b)
array([ 0,  1,  2,  3,  4, 11, 22, 33])

 

>>> a
array([[1, 2, 3],
       [4, 5, 6]])
>>> b=np.array([[7,8,9],[10,11,12]])
>>> b
array([[ 7,  8,  9],
       [10, 11, 12]])
>>> np.append(a,b)
array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12])

numpy的數組沒有動態改變大小的功能,numpy.append()函數每次都會重新分配整個數組,並把原來的數組複製到新數組中。

 

數組拼接方法三

思路:numpy提供了numpy.concatenate((a1,a2,…), axis=0)函數。能夠一次完成多個數組的拼接。其中a1,a2,…是數組類型的參數

示例3:

>>> a=np.array([1,2,3])
>>> b=np.array([11,22,33])
>>> c=np.array([44,55,66])
>>> np.concatenate((a,b,c),axis=0)  # 默認情況下,axis=0可以不寫
array([ 1,  2,  3, 11, 22, 33, 44, 55, 66]) #對於一維數組拼接,axis的值不影響最後的結果

 

>>> a=np.array([[1,2,3],[4,5,6]])
>>> b=np.array([[11,21,31],[7,8,9]])
>>> np.concatenate((a,b),axis=0)
array([[ 1,  2,  3],
       [ 4,  5,  6],
       [11, 21, 31],
       [ 7,  8,  9]])

>>> np.concatenate((a,b),axis=1)  #axis=1表示對應行的數組進行拼接
array([[ 1,  2,  3, 11, 21, 31],
       [ 4,  5,  6,  7,  8,  9]])

 

對numpy.append()和numpy.concatenate()兩個函數的運行時間進行比較

示例4:

>>> from time import clock as now
>>> a=np.arange(9999)
>>> b=np.arange(9999)
>>> time1=now()
>>> c=np.append(a,b)
>>> time2=now()
>>> print time2-time1
28.2316728446
>>> a=np.arange(9999)
>>> b=np.arange(9999)
>>> time1=now()
>>> c=np.concatenate((a,b),axis=0)
>>> time2=now()
>>> print time2-time1
20.3934997107

可知,concatenate()效率更高,適合大規模的數據拼接

 

 

 

原文來自:https://blog.csdn.net/zyl1042635242/article/details/43162031

發佈了38 篇原創文章 · 獲贊 82 · 訪問量 39萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章