一、astype函数 Python

astype函数是NumPy中的一个重要函数,常用于数组的数据类型转换。它的基本语法是:astype(dtype, order='K', casting='unsafe', subok=True, copy=True),其中dtype参数表示指定的目标数据类型,可以是Python数据类型或NumPy中定义的数据类型,其余参数都是可选的。
例如,假设我们有一个二维数组x:
import numpy as np x = np.array([[1, 2], [3, 4], [5, 6]]) print(x.dtype) # 输出:int64
默认情况下,x的数据类型为int64。如果我们想将它转换为float类型,可以这样做:
y = x.astype(float)
print(y.dtype) # 输出:float64
print(y) # 输出:[[1. 2.]
# [3. 4.]
# [5. 6.]]
在这个例子中,astype函数将x数组的数据类型从int64转换为float64。
二、astype不是定义函数
注意,astype不是Python内置函数,它是NumPy库中定义的一个函数。如果在使用astype函数时遇到“astype is not defined”错误,可能是因为没有正确导入NumPy库或者代码中的语法错误。
例如,以下示例中的代码会导致“名字 'astype' 未定义”错误:
# 错误示例 x = [1, 2, 3, 4, 5] y = x.astype(float)
正确的代码应该是:
# 正确示例 import numpy as np x = np.array([1, 2, 3, 4, 5]) y = x.astype(float)
三、参数说明
1. dtype参数
dtype参数是必须指定的,表示目标数据类型。可以是Python数据类型,例如int、float、str等,也可以是NumPy中的数据类型,例如np.int32、np.float64等。
如果指定的目标数据类型和数组的原始数据类型不一致,astype函数将会执行数据类型转换。例如,将整型数组转换为浮点型数组:
import numpy as np x = np.array([1, 2, 3]) y = x.astype(float) print(y) # 输出:[1. 2. 3.]
需要注意的是,如果指定的数据类型无法表示原始数据,astype函数会执行截断操作,也就是将数据截断至目标数据类型的范围内。例如,将大于255的无符号整型数据转换为uint8类型:
import numpy as np x = np.array([255, 256, 257], dtype=np.uint16) y = x.astype(np.uint8) print(y) # 输出:[255 0 1]
2. order参数
order参数用于指定数组的内存布局,默认值为'K',表示优先使用数组本身的内存布局。当order取值为'C'或'F'时,将强制使用按行排列('C')或按列排列('F')的内存布局。
例如,以下示例中的代码将数组x从按行排列('C')的内存布局转换为按列排列('F')的内存布局:
import numpy as np
x = np.array([[1, 2], [3, 4], [5, 6]])
y = x.astype(float, order='F')
print(y.flags) # 输出:C_CONTIGUOUS : False
# F_CONTIGUOUS : True
# OWNDATA : True
# ...
3. casting参数
casting参数用于指定数据类型转换时的转换规则,有三种取值:
'no':不允许任何转换。
'equiv':只允许等价类型转换,例如int转换为float。
'unsafe':允许任何类型转换,即使可能导致数据丢失。
例如,以下示例中的代码不允许将浮点型数据转换为整型:
import numpy as np x = np.array([1.2, 2.5, 3.7]) y = x.astype(int, casting='no') # 报错:Can't cast float64 to int64 without losing precision
4. subok参数
subok参数用于指定是否返回一个派生类,默认为True,即返回一个与输入参数类型相同的派生类。如果取值为False,则返回一个NumPy数组对象。
以下示例中的代码将返回一个类型为ndarray_subclass的派生类:
import numpy as np
class ndarray_subclass(np.ndarray):
pass
x = np.array([1, 2, 3], dtype=np.int32).view(ndarray_subclass)
y = x.astype(float, subok=True)
print(type(y)) # 输出:
5. copy参数
copy参数用于指定是否为返回的数组对象分配新的内存,默认为True,即始终创建一个新数组并复制数据。如果取值为False,则可能直接返回原始数组的视图。
例如,以下示例中的代码直接返回原始数组的视图:
import numpy as np x = np.array([1, 2, 3], dtype=np.int32) y = x.astype(float, copy=False) print(y is x) # 输出:True print(y.base is x) # 输出:True

京公网安备 11010802030320号