Bài 3: Kiểu dữ liệu – Numpy trong Python

Đăng bởi : Admin | Lượt xem : 2883 | Chuyên mục : AI

NumPy tương hỗ nhiều kiểu tài liệu hơn nhiều so với Python. Bảng sau đây cho thấy những kiểu tài liệu vô hướng khác nhau được xác lập trong NumPy .

  1. bool_ : Boolean (Đúng hoặc Sai) được lưu trữ dưới dạng byte
  2. int_ : Kiểu số nguyên mặc định (giống C long; thường là int64 hoặc int32)
  3. intc : Giống hệt với int C (thường là int32 hoặc int64)
  4. intp : Số nguyên được sử dụng để lập chỉ số (giống như C ssize_t; thông thường là int32 hoặc int64)
  5. int8 : Byte (-128 đến 127)
  6. int16 : Số nguyên (-32768 đến 32767 )
  7. int32 : Số nguyên (-2147483648 đến 2147483647 )
  8. int64 : Số nguyên (-9223372036854775808 đến 9223372036854775807 )
  9. uint8 : Số nguyên không dấu (0 đến 255)
  10. uint16 : Số nguyên không dấu (0 đến 65535)
  11. uint32 : Số nguyên không dấu (0 đến 4294967295)
  12. uint64 : Số nguyên không dấu (0 đến 18446744073709551615)
  13. float_ : Viết tắt cho float64
  14. float16 : Nửa chính xác float: bit dấu, số mũ 5 bit, phần định trị 10 bit
  15. float32 : số thực chính xác đơn: bit dấu, số mũ 8 bit, phần định trị 23 bit
  16. float64 : số thực chính xác kép: bit dấu, số mũ 11 bit, phần định trị 52 bit
  17. complex_ : Viết tắt cho complex128
  18. complex64
  19. complex128

Các kiểu số NumPy là các thể hiện của các đối tượng dtype (kiểu dữ liệu), mỗi đối tượng có các đặc điểm riêng biệt. Các kiểu có sẵn như np.bool_, np.float32, v.v.

Đối tượng kiểu dữ liệu (dtype) :

Một đối tượng người dùng kiểu tài liệu miêu tả diễn giải khối bộ nhớ cố định và thắt chặt tương ứng với một mảng, tùy thuộc vào những góc nhìn sau

  • Loại dữ liệu (integer, float or Python object)
  • Kích thước của dữ liệu
  • Thứ tự Byte (little-endian hoặc big-endian)
  • Trong trường hợp kiểu có cấu trúc, tên của các trường, kiểu dữ liệu của từng trường và một phần của khối bộ nhớ được lấy bởi từng trường.
  • Nếu kiểu dữ liệu là một mảng con, hình dạng và kiểu dữ liệu của nó

Thứ tự byte được quyết định hành động bằng cách thêm tiền tố ‘ < ' hoặc ' > ‘ vào kiểu tài liệu. ‘ < ' có nghĩa là mã hóa có giá trị nhỏ ( ít quan trọng nhất được tàng trữ ở địa chỉ nhỏ nhất ). ' > ‘ có nghĩa là mã hóa là big-endian ( byte quan trọng nhất được tàng trữ ở địa chỉ nhỏ nhất ) .Một đối tượng người tiêu dùng dtype được kiến thiết xây dựng bằng cú pháp sau :

numpy.dtype(object, align, copy)

Tham số là :

  • Object − Được chuyển đổi thành đối tượng kiểu dữ liệu
  • Align −Nếu đúng, thêm phần đệm vào trường để làm cho trường tương tự như C-struct
  • Copy − Tạo một bản sao mới của đối tượng dtype. Nếu sai, kết quả là tham chiếu đến đối tượng kiểu dữ liệu nội trang
Ví dụ 1:
# using array-scalar type 
import numpy as np 
dt = np.dtype(np.int32) 
print dt

Kết quả :

int32
Ví dụ 2 :
#int8, int16, int32, int64 can be replaced by equivalent string 'i1', 'i2','i4', etc. 
import numpy as np 

dt = np.dtype('i4')
print dt

Kết quả :

int32
Ví dụ 3 :
# using endian notation 
import numpy as np 
dt = np.dtype('&gti4') 
print dt

Kết quả :

&gti4

Các ví dụ sau đây cho thấy việc sử dụng kiểu tài liệu có cấu trúc. Ở đây, tên trường và kiểu tài liệu vô hướng tương ứng sẽ được khai báo .

Ví dụ 4 :
# first create structured data type 
import numpy as np 
dt = np.dtype([('age',np.int8)]) 
print dt

Kết quả :

[('age', 'i1')]
Ví dụ 5 :
# now apply it to ndarray object 
import numpy as np 

dt = np.dtype([('age',np.int8)]) 
a = np.array([(10,),(20,),(30,)], dtype = dt) 
print a

Kết quả :

[(10,) (20,) (30,)]
Ví dụ 6 :
# file name can be used to access content of age column 
import numpy as np 

dt = np.dtype([('age',np.int8)]) 
a = np.array([(10,),(20,),(30,)], dtype = dt) 
print a['age']

Kết quả :

[10 20 30]
Ví dụ 7 :

Các ví dụ sau đây xác định kiểu dữ liệu có cấu trúc được gọi là student với trường chuỗi là ‘name’, trường số nguyên ‘age’ và trường float ‘mark’. Loại dtype này được áp dụng cho đối tượng ndarray.

import numpy as np 
student = np.dtype([('name','S20'), ('age', 'i1'), ('marks', 'f4')]) 
print student

tác dụng :

[('name', 'S20'), ('age', 'i1'), ('marks', '&ltf4')])
Ví dụ 8 :
import numpy as np 

student = np.dtype([('name','S20'), ('age', 'i1'), ('marks', 'f4')]) 
a = np.array([('abc', 21, 50),('xyz', 18, 75)], dtype = student) 
print a

hiệu quả :

[('abc', 21, 50.0), ('xyz', 18, 75.0)]

Mỗi kiểu tài liệu dựng sẵn có một mã ký tự nhận dạng riêng không liên quan gì đến nhau :

  • ‘b’ − boolean
  • ‘i’ − (signed) integer ( số nguyên )
  • ‘u’ − unsigned integer ( số nguyên không dấu )
  • ‘f’ − floating-point ( số thực )
  • ‘c’ − complex-floating point
  • ‘m’ − timedelta
  • ‘M’ − datetime
  • ‘O’ − (Python) objects
  • ‘S’, ‘a’ − (byte-)string
  • ‘U’ − Unicode
  • ‘V’ − raw data (void)
ĐÁNH GIÁ post
Bài viết liên quan

Tư vấn miễn phí (24/7) 094 179 2255