astype函数详解_千锋教育

一、astype函数 Python

astype函数是NumPy中的一个重要函数，常用于数组的数据类型转换。它的基本语法是：astype(dtype, order='K', casting='unsafe', subok=True, copy=True)，其中dtype参数表示指定的目标数据类型，可以是Python数据类型或NumPy中定义的数据类型，其余参数都是可选的。

例如，假设我们有一个二维数组x：

import numpy as np
x = np.array([[1, 2], [3, 4], [5, 6]])
print(x.dtype) # 输出：int64

默认情况下，x的数据类型为int64。如果我们想将它转换为float类型，可以这样做：

y = x.astype(float)
print(y.dtype) # 输出：float64
print(y) # 输出：[[1. 2.]
        #      [3. 4.]
        #      [5. 6.]]

在这个例子中，astype函数将x数组的数据类型从int64转换为float64。

二、astype不是定义函数

注意，astype不是Python内置函数，它是NumPy库中定义的一个函数。如果在使用astype函数时遇到“astype is not defined”错误，可能是因为没有正确导入NumPy库或者代码中的语法错误。

例如，以下示例中的代码会导致“名字 'astype' 未定义”错误：

# 错误示例
x = [1, 2, 3, 4, 5]
y = x.astype(float)

正确的代码应该是：

# 正确示例
import numpy as np
x = np.array([1, 2, 3, 4, 5])
y = x.astype(float)

三、参数说明

1. dtype参数

dtype参数是必须指定的，表示目标数据类型。可以是Python数据类型，例如int、float、str等，也可以是NumPy中的数据类型，例如np.int32、np.float64等。

如果指定的目标数据类型和数组的原始数据类型不一致，astype函数将会执行数据类型转换。例如，将整型数组转换为浮点型数组：

import numpy as np
x = np.array([1, 2, 3])
y = x.astype(float)
print(y) # 输出：[1. 2. 3.]

需要注意的是，如果指定的数据类型无法表示原始数据，astype函数会执行截断操作，也就是将数据截断至目标数据类型的范围内。例如，将大于255的无符号整型数据转换为uint8类型：

import numpy as np
x = np.array([255, 256, 257], dtype=np.uint16)
y = x.astype(np.uint8)
print(y) # 输出：[255   0   1]

2. order参数

order参数用于指定数组的内存布局，默认值为'K'，表示优先使用数组本身的内存布局。当order取值为'C'或'F'时，将强制使用按行排列（'C'）或按列排列（'F'）的内存布局。

例如，以下示例中的代码将数组x从按行排列（'C'）的内存布局转换为按列排列（'F'）的内存布局：

import numpy as np
x = np.array([[1, 2], [3, 4], [5, 6]])
y = x.astype(float, order='F')
print(y.flags) # 输出：C_CONTIGUOUS : False
              #      F_CONTIGUOUS : True
              #      OWNDATA : True
              #      ...

3. casting参数

casting参数用于指定数据类型转换时的转换规则，有三种取值：

'no'：不允许任何转换。 'equiv'：只允许等价类型转换，例如int转换为float。 'unsafe'：允许任何类型转换，即使可能导致数据丢失。

例如，以下示例中的代码不允许将浮点型数据转换为整型：

import numpy as np
x = np.array([1.2, 2.5, 3.7])
y = x.astype(int, casting='no') # 报错：Can't cast float64 to int64 without losing precision

4. subok参数

subok参数用于指定是否返回一个派生类，默认为True，即返回一个与输入参数类型相同的派生类。如果取值为False，则返回一个NumPy数组对象。

以下示例中的代码将返回一个类型为ndarray_subclass的派生类：

import numpy as np
class ndarray_subclass(np.ndarray):
    pass

x = np.array([1, 2, 3], dtype=np.int32).view(ndarray_subclass)
y = x.astype(float, subok=True)
print(type(y)) # 输出：

5. copy参数

copy参数用于指定是否为返回的数组对象分配新的内存，默认为True，即始终创建一个新数组并复制数据。如果取值为False，则可能直接返回原始数组的视图。

例如，以下示例中的代码直接返回原始数组的视图：

import numpy as np
x = np.array([1, 2, 3], dtype=np.int32)
y = x.astype(float, copy=False)
print(y is x) # 输出：True
print(y.base is x) # 输出：True