NumPy - 数据类型
NumPy 支持比 Python 更多种类的数值类型。 下表显示了 NumPy 中定义的不同数据类型的标量。
序号 | 数据类型及描述 |
---|---|
1. | bool_ 存储为一个字节的布尔值(真或假) |
2. | int_ 默认整数,相当于 C 的long ,通常为int32 或int64 |
3. | intc 相当于 C 的int ,通常为int32 或int64 |
4. | intp 用于索引的整数,相当于 C 的size_t ,通常为int32 或int64 |
5. | int8 字节(-128 ~ 127) |
6. | int16 16 位整数(-32768 ~ 32767) |
7. | int32 32 位整数(-2147483648 ~ 2147483647) |
8. | int64 64 位整数(-9223372036854775808 ~ 9223372036854775807) |
9. | uint8 8 位无符号整数(0 ~ 255) |
10. | uint16 16 位无符号整数(0 ~ 65535) |
11. | uint32 32 位无符号整数(0 ~ 4294967295) |
12. | uint64 64 位无符号整数(0 ~ 18446744073709551615) |
13. | float_ float64 的简写 |
14. | float16 半精度浮点:符号位,5 位指数,10 位尾数 |
15. | float32 单精度浮点:符号位,8 位指数,23 位尾数 |
16. | float64 双精度浮点:符号位,11 位指数,52 位尾数 |
17. | complex_ complex128 的简写 |
18. | complex64 复数,由两个 32 位浮点表示(实部和虚部) |
19. | complex128 复数,由两个 64 位浮点表示(实部和虚部) |
上面的标量有一些后面带了下划线,很可能是这个名字是内建的类或者关键字。想要使用在后面加了下划线。
NumPy 里的数字类型是dtype
(数据类型)对象的实例,每个对象具有唯一的特征。 这些类型可以是np.bool_
,np.float32
等。
每个内建类型都有一个唯一定义它的字符代码:
'b'
:布尔值'i'
:符号整数'u'
:无符号整数'f'
:浮点'c'
:复数浮点'm'
:时间间隔'M'
:日期时间'O'
:Python 对象'S', 'a'
:字节串'U'
:Unicode'V'
:原始数据(void
)
数据类型对象 (dtype
)
数据类型对象描述了对应于数组的固定内存块的解释,取决于以下方面:
数据类型(整数、浮点或者 Python 对象)
数据大小
字节序(小端或大端)
在结构化类型的情况下,字段的名称,每个字段的数据类型,和每个字段占用的内存块部分。
如果数据类型是子列表,它的形状和数据类型。
字节顺序取决于数据类型的前缀<
或>
。 <
意味着编码是小端(最小有效字节存储在最小地址中)。 >
意味着编码是大端(最大有效字节存储在最小地址中)。
dtype
可由以下语法构造:
numpy.dtype(object, align, copy)
参数为:
Object
:被转换为数据类型的对象。Align
:如果为true
,则向字段添加间隔,使其类似 C 的结构体。Copy
? 生成dtype
对象的新副本,如果为flase
,结果是内建数据类型对象的引用。
示例 1
使用标量创建dtype对象
# 使用数组标量类型
import numpy as np
dt = np.dtype(np.int32)
print(dt)
输出如下:
int32
示例 2
不仅能够使用标量创建,还能够使用标量对应的字符代码来创建 dtype 对象。
#int8,int16,int32,int64 可替换为等价的字符串 'i1','i2','i4',uint,float,complex同理。
import numpy as np
dt = np.dtype('i4')
print(dt)
输出如下:
int32
示例 3
# 使用端记号
import numpy as np
dt = np.dtype('>i4')
print(dt)
输出如下:
>i4
下面的例子展示了结构化数据类型的使用。 这里声明了字段名称和相应的标量数据类型。
示例 4
# 首先创建结构化数据类型。
import numpy as np
dt = np.dtype([('age',np.int8)])
print(dt)
输出如下:
[('age', 'i1')]
注意这里的的参数是[()], 列表里面传入元组。这是个很奇怪的传输内容,
原因如下:
- dtype 不仅可以可以表示简单(已经内置的)数据类型。还可以类似 C 语言中的结构体。
- 定义的方法是,传入一个列表,列表中的每个元组是一个数据,元组中要有名和数据类型。类似于
('name', 'type')
的结构。例如定义一个 people 类型的结构体类型。在numpy中可以这样定义它定义了一个如下的结构类型 ``` { char[20] name; char age; bool sex; }
people = np.dtype([('name', 'S20'), ('age', 'i1'), ('sex', np.bool_)]
示例 5
# 现在将其应用于 ndarray 对象
import numpy as np
dt = np.dtype([('age',np.int8)])
a = np.array([(10,),(20,),(30,)], dtype = dt)
print(a)
输出如下:
[(10,) (20,) (30,)]
示例 6
# type名称可用于访问 age 列的内容
import numpy as np
dt = np.dtype([('age', np.int8)])
a = np.array([(10,),(20,),(30,)], dtype = dt)
print(a['age'])
输出如下:
[10 20 30]
示例 7
以下示例定义名为 student 的结构化数据类型,其中包含字符串字段name
,整数字段age
和浮点字段marks
。 此dtype
应用于ndarray
对象。
import numpy as np
student = np.dtype([('name','S20'), ('age', 'i1'), ('marks', 'f4')])
print(student)
输出如下:
[('name', 'S20'), ('age', 'i1'), ('marks', '<f4')])
示例 8
import numpy as np
student = np.dtype([('name','S20'), ('age', 'i1'), ('marks', 'f4')])
a = np.array([('abc', 21, 50),('xyz', 18, 75)], dtype = student)
print(a)
输出如下:
[('abc', 21, 50.0), ('xyz', 18, 75.0)]