1.1. Khái niệm thông tin và dữ liệu
- Thông tin là những hiểu biết có thể có được về 1 thực thể nào đó
- Dữ liệu là thông tin đưa vào máy tính để xử lý
1.2. Đơn vị đo lượng thông tin
- Đơn vị cơ bản đo thông tin là bit [Binary Digital]
- Bit là đơn vị nhỏ nhất được lưu trữ trong máy tính để biểu diễn hai trạng thái 0 và 1 [0: không có điện; 1: có điện] ta còn thường gọi là mã nhị phân
Hình 1. Biểu diến thông tin bằng dãy tám bit
- Ngoài đơn vị bit, ta cũng thường dùng đơn vị đo lượng thông tin là Byte [đọc là bai]
- 1 byte = 8 bit
Một số đơn vị bội của Byte
Kí hiệu | Đọc | Độ lớn |
Byte | Bai | 8 bit |
KB | Ki-lô-bai | 1024 byte |
MB | Mê-ga-bai | 1024 KB |
GB | Gi-ga-bai | 1024 MB |
TB | Tê-ra-bai | 1024 GB |
PB | Pê-ta-bai | 1024 TB |
Bảng 1. Một số đơn vị bội của Byte
1.3. Các dạng thông tin
Thông tin có 2 loại: số và phi số
- Số: Số nguyên, số thực,…
- Phi số: Văn bản, hình ảnh, âm thành,…
- Dạng văn bản: Tờ báo, cuốn sách, tấm bia,…
- Dạng hình ảnh: Bức tranh vẽ, ảnh chụp, bản đồ, biển báo,…
- Dạng âm thanh: Tiếng nói con người, tiếng sóng biển, tiếng đàn, tiếng chim hót,…
1.4. Mã hóa thông tin trong máy tính
- Để máy tính xử lí được, thông tin cần phải được biến đổi thành dãy bit [biểu diễn bằng các số 0, 1]. Cách biến đổi như thế được gọi là mã hoá thông tin
- Ví dụ:
Hình 2. Mã hóa thông tin trong máy tính
- Để mã hoá thông tin dạng văn bản ta dùng bộ mã ASCII để mã hoá các ký tự. Mã ASCII các ký tự đánh số từ: 0 đến 255
- Bộ mã Unicode: có thể mã hóa 65536 =216 ký tự, có thể mã hóa tất cả các bảng chữ cái trên thế giới
1.5. Biểu diễn thông tin trong máy tính
a. Thông tin loại số
- Hệ đếm:
- Hệ thập phân: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9
- Hệ nhị phân: 0, 1
- Hệ cơ số mười sáu [hexa]: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F
Biểu diễn số trong các hệ đếm:
- Hệ thập phân: Mọi số N có thể biểu diễn dưới dạng
\[N = a_{n} 10^{n} + a_{n-1} 10^{n-1} + …+ a_{1} 10^{1} + a_{0} 10^{0} + a_{-1} 10^{-1} +…+ a_{-m} 10^{-m}\]
\[0 \leq a_{i} \leq 9\]
- Hệ nhị phân: Tương tự như trong hệ thập phân, mọi số N cũng có biểu diễn dạng
\[N = a_{n} 2^{n} + a_{n-1} 2^{n-1} + …+ a_{1} 2^{1} + a_{0} 2^{0} + a_{-1} 2^{-1} +…+ a_{-m} 2^{-m} \]
\[a_{i} = 0, 1 \]
- Hệ hexa: Biểu diễn số trong hệ hexa cũng tương tự
\[N = a_{n} 16^{n} + a_{n-1} 16^{n-1} + …+ a_{1} 16^{1} + a_{0}16^{0} + a_{-1} 16 ^{-1} +…+ a_{-m} 16^{-m}\]
\[0 \leq a_{i} \leq15\]
Với quy ước: A = 10, B = 11, C = 12, D = 13, E = 14, F = 15
Chuyển đổi giữa các hệ đếm:
Đổi số trong hệ cơ số 10 sang hệ cơ số 2 và hệ cơ số 16
Hình 3. Ví dụ minh họa đổi số trong hệ cơ số 10 sang hệ cơ số 2 và hệ cơ số 16
Biểu diễn số trong máy tính:
- Biểu diễn số nguyên:
\[ 7_{[10]} = 111_{[2]}\]
Hình 4. Ví dụ minh họa biểu diễn số nguyên
- Trong đó:
- Phần nhỏ nhất của bộ nhớ lưu trữ số 0 hoặc 1: 1 bit
- Một byte có 8 bit, bit cao nhất thể hiện dấu [bit dấu]
- Có thể dùng 1 byte, 2 byte, 4 byte… để biểu diễn số nguyên
- Biểu diễn số thực:
- Biểu diễn số thực dưới dạng dấu phẩy động:
- Ví dụ: 13456,25 = 0.1345625 x 105
- Dạng tổng quát: ±M x 10±K
- Trong đó:
- M: Là phần định trị [\[0,1\leq M < 1\]]
- K: Là phần bậc [\[K \leq 0\]]
- Biểu diễn số thực trong một số máy tính:
Ví dụ: 0,007 = 0.7 x 10-2
- Biểu diễn số thực dưới dạng dấu phẩy động:
Hình 5. Ví dụ minh họa biểu diễn số thực
b. Thông tin loại phi số
Biểu diễn văn bản:
- Mã hoá thông tin dạng văn bản thông qua việc mã hóa từng kí tự và thường sử dụng:
- Bộ mã ASCII: Dùng 8 bit để mã hoá kí tự, mã hoá được 256 = 28 kí tự
- Bộ mã Unicode: Dùng 16 bit để mã hóa kí tự, mã hoá được 65536 = 216 kí tự
Trong bảng mã ASCII mỗi kí tự được biểu diễn bằng 1 byte
Các dạng khác: Hình ảnh, âm thanh cũng phải mã hoá thành các dãy bit
*Nguyên lí mã hóa nhị phân:
Thông tin có nhiều dạng khác nhau như số, văn bản, hình ảnh, âm thanh,… Khi đưa vào máy tính, chúng đều biến đổi thành dạng chung - dãy bit. Dãy bit đó là mã nhị phân của thông tin mà nó biểu diễn.