Hệ cơ sở dữ liệu phân tán là gì

Sự khác biệt giữa Cơ sở dữ liệu phân tán và Cơ sở dữ liệu tập trung

Tác Giả: Judy Howell

Ngày Sáng TạO: 1 Tháng BảY 2021

CậP NhậT Ngày Tháng: 1 Tháng 12 2022

Sự khác biệt giữa Cơ sở dữ liệu phân tán và Cơ sở dữ liệu tập trung - Công Nghệ

Cơ sở dữ liệu phân tán so với Cơ sở dữ liệu tập trung

Cơ sở dữ liệu tập trung là cơ sở dữ liệu trong đó dữ liệu được lưu trữ và duy trì ở một vị trí duy nhất. Đây là cách tiếp cận truyền thống để lưu trữ dữ liệu trong các doanh nghiệp lớn. Cơ sở dữ liệu phân tán là cơ sở dữ liệu trong đó dữ liệu được lưu trữ trong các thiết bị lưu trữ không nằm ở cùng một vị trí thực nhưng cơ sở dữ liệu được điều khiển bằng Hệ thống quản lý cơ sở dữ liệu trung tâm [DBMS].

Cơ sở dữ liệu tập trung là gì?

Trong cơ sở dữ liệu tập trung, tất cả dữ liệu của một tổ chức được lưu trữ ở một nơi duy nhất như máy tính lớn hoặc máy chủ. Người dùng ở các vị trí xa truy cập dữ liệu thông qua Mạng diện rộng [WAN] bằng cách sử dụng các chương trình ứng dụng được cung cấp để truy cập dữ liệu. Cơ sở dữ liệu tập trung [máy tính lớn hoặc máy chủ] có thể đáp ứng tất cả các yêu cầu đến hệ thống, do đó có thể dễ dàng trở thành một nút cổ chai. Nhưng vì tất cả dữ liệu nằm ở một nơi duy nhất nên việc bảo trì và sao lưu dữ liệu sẽ dễ dàng hơn. Hơn nữa, việc duy trì tính toàn vẹn của dữ liệu sẽ dễ dàng hơn vì một khi dữ liệu được lưu trữ trong cơ sở dữ liệu tập trung, dữ liệu lỗi thời sẽ không còn ở những nơi khác.

Cơ sở dữ liệu phân tán là gì?

Trong cơ sở dữ liệu phân tán, dữ liệu được lưu trữ trong các thiết bị lưu trữ được đặt ở các vị trí thực tế khác nhau. Chúng không được gắn vào một CPU chung nhưng cơ sở dữ liệu được kiểm soát bởi một DBMS trung tâm. Người dùng truy cập dữ liệu trong cơ sở dữ liệu phân tán bằng cách truy cập mạng WAN. Để giữ cho một cơ sở dữ liệu phân tán được cập nhật, nó sử dụng các quá trình sao chép và nhân bản. Quá trình nhân bản xác định các thay đổi trong cơ sở dữ liệu phân tán và áp dụng những thay đổi đó để đảm bảo rằng tất cả các cơ sở dữ liệu phân tán trông giống nhau. Tùy thuộc vào số lượng cơ sở dữ liệu phân tán, quá trình này có thể trở nên rất phức tạp và tốn thời gian. Quá trình nhân bản xác định một cơ sở dữ liệu là cơ sở dữ liệu chính và nhân bản cơ sở dữ liệu đó. Quá trình này không phức tạp như quá trình sao chép nhưng đảm bảo rằng tất cả các cơ sở dữ liệu phân tán có cùng một dữ liệu.

Sự khác biệt giữa Cơ sở dữ liệu phân tán và Cơ sở dữ liệu tập trung là gì?

Trong khi cơ sở dữ liệu tập trung giữ dữ liệu của nó trong các thiết bị lưu trữ ở một vị trí duy nhất được kết nối với một CPU, hệ thống cơ sở dữ liệu phân tán giữ dữ liệu của nó trong các thiết bị lưu trữ có thể được đặt ở các vị trí địa lý khác nhau và được quản lý bằng cách sử dụng DBMS trung tâm. Cơ sở dữ liệu tập trung dễ bảo trì và cập nhật hơn vì tất cả dữ liệu được lưu trữ ở một vị trí duy nhất. Hơn nữa, việc duy trì tính toàn vẹn của dữ liệu và tránh yêu cầu trùng lặp dữ liệu sẽ dễ dàng hơn. Tuy nhiên, tất cả các yêu cầu truy cập dữ liệu đều được xử lý bởi một thực thể như một máy tính lớn duy nhất, và do đó nó có thể dễ dàng trở thành một nút cổ chai. Nhưng với cơ sở dữ liệu phân tán, có thể tránh được sự tắc nghẽn này vì các cơ sở dữ liệu được song song hóa làm cho tải cân bằng giữa một số máy chủ. Nhưng giữ cho dữ liệu được cập nhật trong hệ thống cơ sở dữ liệu phân tán đòi hỏi phải làm việc thêm, do đó làm tăng chi phí bảo trì và phức tạp và cũng yêu cầu phần mềm bổ sung cho mục đích này. Hơn nữa, việc thiết kế cơ sở dữ liệu cho cơ sở dữ liệu phân tán phức tạp hơn so với cơ sở dữ liệu tập trung.

1. Các hệ cơ sở dữ liệu tập trung

- Đặc trưng cơ bản để phân biệt kiến trúc một hệ CSDL là cách tổ chức lưu trữ CSDL.

- Với hệ CSDL tập trung, toàn bộ dữ liệu được lưu tại một máy hoặc một dàn máy. Những người dùng từ xa có thể truy cập vào CSDL thông qua các phương tiện truyền thông dữ liệu.

- Việc phân loại phụ thuộc vào cách tổ chức khai thác, cụ thể là:

+ Những ai sẽ truy cập vào CSDL?

+ Việc truy cập được thực hiện từ đâu

+ Các môđun của hệ QTCSDL được lưu trữ ở đâu?

- Dựa vào các tiêu chí trên người ta chia các hệ CSDL tập trung thành 3 loại:

+ Hệ CSDL cá nhân;

+ Hệ CSDL trung tâm;

+ Hệ CSDL khách - chủ.

a. Hệ CSDL cá nhân

- Khái niệm: Hệ CSDL cá nhân là hệ CSDL có một người dùng. Thông thường, người này vưa thiết kế, tạo lập và bảo trì CSDL, đồng thời cũng là người khai thác thông tin, tự lập và hiển thị các báo cáo.

- Đặc điểm:

+ Dữ liệu được tập trung ở một máy;

+ Chỉ một người hoặc một nhóm người truy cập theo nguyên tắc lần lượt [không có tương tranh, xung đột];

+ Toàn bộ hệ QTCSDL được lưu ngay tại hệ thống chứa CSDL;

+ Việc truy cập vào CSDL được thực hiện ngay hệ thống chứa CSDL.

- Ưu điểm và nhược điểm:

+ Ưu điểm: Việc phát triển và sử dụng các hệ CSDL cá nhân khá đơn giản và dễ dàng.

+ Nhược điểm: Tình an toàn thường không cao.

Hình 1. Hệ cơ sở dữ liệu cá nhân

b. Hệ CSDL trung tâm

- Khái niệm: Hệ cơ sở dữ liệu trung tâm là hệ CSDL được cài đặt trên máy tính trung tâm. 

- Đặc điểm:

+ Dữ liệu được lưu trữ trên máy tính trung tâm.

+ Nhiều người dùng từ xa có thể truy cập CSDL.

- Tùy thuộc vào việc tổ chức: máy tính trung tâm có thể là một máy hay một dàn máy và có rất nhiều người dùng. Việc truy cập thông qua thiết bị đầu cuối và phương tiện truyền thông.

Hình 2. Hệ cơ sở dữ liệu trung tâm

c. Hệ CSDL khách - chủ

- Trong kiến trúc khách-chủ, các thành phần của hệ QTCSDL: bộ phận cung cấp tài nguyên được đặt ở máy chủ, bộ phận yêu cầu cấp phát tài nguyên đặt ở máy khách. Hai thành phần này không nhất thiết phải cài đặt trên cùng một máy tính. 

- Phần mềm máy khách:

+ Tiếp nhận kết quả và tổ chức đưa ra khuôn dạng phù hợp.

+ Chuyển tới yêu cầu của máy chủ và chờ đợi trả lời;

+ Tổ chức giao diện, tiếp nhận yêu cầu truy cập thông tin;

- Phần mềm máy chủ:

+ Tiếp nhận yêu cầu truy vấn thông tin;

+ Xử lý

+ Gửi kết quả tới máy khách.

- Việc xử lý yêu cầu truy cập thông tin được thực hiện theo nguyên lý truy cập từ xa [RPC – Remote Procedure Call].

- Kiến trúc loại này có một số ư­u điểm sau:

+ Khả năng truy cập rộng rãi đến các CSDL;

+ Nâng cao khả năng thực hiện của CPU: các CPU ở máy chủ và máy khách khác nhau có thể cùng chạy song song, mỗi CPU thực hiện một nhiệm vụ;

+ Chi phí cho phần cứng giảm do chỉ cần máy chủ có cấu hình mạnh để lưu trữ và quản trị dữ liệu;

+ Chi phí truyền thông được giảm do một phần các thao tác được giải quyết trên máy khách, chỉ cần: yêu cầu về truy cập CSDL gửi đến máy chủ và dữ liệu kết quả gửi về máy khách;

+ Nâng cao khả năng đảm bảo tính nhất quán của dữ liệu vì các ràng buộc được định nghĩa và kiểm tra trên máy chủ.

+ Kiến trúc này phù hợp với việc xây dựng các hệ thống mở.

2. Các hệ CSDL phân tán

Hình 3. Hệ CSDL khách-chủ

a. Khái niệm CSDL phân tán

- CSDL phân tán là một tập hợp dữ liệu có liên quan [về logic] được dùng chung và phân tán về mặt vật lí trên một mạng máy tính.

Hình 4. Cơ sở dữ liệu phân tán

- Một hệ QTCSDL phân tán là một hệ thống phần mềm cho phép quản trị CSDL phân tán và làm cho người sử dụng không nhận thấy sự phân tán về lưu trữ dữ liệu.

- Người dùng truy cập vào CSDL phân tán thông qua chương trình ứng dụng. Các chương trình ứng dụng được chia làm hai loại:

+ Chương trình không yêu cầu dữ liệu từ nơi khác;

+ Chương trình có yêu cầu dữ liệu từ nơi khác.

Hình 5. Hệ CSDL phân tán

- Có thể chia các hệ CSDL phân tán thành 2 loại chính: thuần nhất và hỗn hợp.

+ Hệ CSDL phân tán thuần nhất: các nút trên mạng đều dùng cùng một hệ QTCSDL.

+ Hệ CSDL phân tán hỗn hợp: các nút trên mạng có thể dùng các hệ QTCSDL khác nhau.

b. Một số ưu điểm và hạn chế của các hệ CSDL phân tán

- Sự phân tán dữ liệu và các ứng dụng có một số ưu điểm so với các hệ CSDL tập trung:

+ Cấu trúc phân tán dữ liệu thích hợp cho bản chất phân tán của nhiều người dùng.

+ Dữ liệu được chia sẻ trên mạng nhưng vẫn cho phép quản trị dữ liệu địa phương [dữ liệu đặt tại mỗi trạm]

+ Dữ liệu có tính sẵn sàng cao.

+ Dữ liệu có tính tin cậy cao vì khi một nút gặp sự cố, có thể khôi phục được dữ liệu tại đây do bản sao của nó có thể được lưu trữ tại một nút khác nữa.

+ Hiệu năng của hệ thống được nâng cao hơn.

+ Cho phép mở rộng các tổ chức một cách linh hoạt. Có thể thêm nút mới vào mạng máy tính mà không ảnh hưởng đến hoạt động của các nút sẵn có.

- So với các hệ CSDL tập trung, hệ CSDL phân tán có một số hạn chế như sau:

+ Hệ thống phức tạp hơn vì phải làm ẩn đi sự phân tán dữ liệu đối với người dùng.

+ Chi phí cao hơn.

+ Đảm bảo an ninh khó khăn hơn.

+ Đảm bảo tính nhất quán dữ liệu khó hơn.

+ Việc thiết kế CSDL phân tán phức tạp hơn.

1. Các hệ cơ sở dữ liệu tập trung

- Đặc trưng cơ bản để phân biệt kiến trúc một hệ CSDL là cách tổ chức lưu trữ CSDL.

- Với hệ CSDL tập trung, toàn bộ dữ liệu được lưu tại một máy hoặc một dàn máy. Những người dùng từ xa có thể truy cập vào CSDL thông qua các phương tiện truyền thông dữ liệu.

- Việc phân loại phụ thuộc vào cách tổ chức khai thác, cụ thể là:

+ Những ai sẽ truy cập vào CSDL?

+ Việc truy cập được thực hiện từ đâu

+ Các môđun của hệ QTCSDL được lưu trữ ở đâu?

- Dựa vào các tiêu chí trên người ta chia các hệ CSDL tập trung thành 3 loại:

+ Hệ CSDL cá nhân;

+ Hệ CSDL trung tâm;

+ Hệ CSDL khách - chủ.

a. Hệ CSDL cá nhân

- Khái niệm: Hệ CSDL cá nhân là hệ CSDL có một người dùng. Thông thường, người này vưa thiết kế, tạo lập và bảo trì CSDL, đồng thời cũng là người khai thác thông tin, tự lập và hiển thị các báo cáo.

- Đặc điểm:

+ Dữ liệu được tập trung ở một máy;

+ Chỉ một người hoặc một nhóm người truy cập theo nguyên tắc lần lượt [không có tương tranh, xung đột];

+ Toàn bộ hệ QTCSDL được lưu ngay tại hệ thống chứa CSDL;

+ Việc truy cập vào CSDL được thực hiện ngay hệ thống chứa CSDL.

- Ưu điểm và nhược điểm:

+ Ưu điểm: Việc phát triển và sử dụng các hệ CSDL cá nhân khá đơn giản và dễ dàng.

+ Nhược điểm: Tình an toàn thường không cao.

Hình 1. Hệ cơ sở dữ liệu cá nhân

b. Hệ CSDL trung tâm

- Khái niệm: Hệ cơ sở dữ liệu trung tâm là hệ CSDL được cài đặt trên máy tính trung tâm. 

- Đặc điểm:

+ Dữ liệu được lưu trữ trên máy tính trung tâm.

+ Nhiều người dùng từ xa có thể truy cập CSDL.

- Tùy thuộc vào việc tổ chức: máy tính trung tâm có thể là một máy hay một dàn máy và có rất nhiều người dùng. Việc truy cập thông qua thiết bị đầu cuối và phương tiện truyền thông.

Hình 2. Hệ cơ sở dữ liệu trung tâm

c. Hệ CSDL khách - chủ

- Trong kiến trúc khách-chủ, các thành phần của hệ QTCSDL: bộ phận cung cấp tài nguyên được đặt ở máy chủ, bộ phận yêu cầu cấp phát tài nguyên đặt ở máy khách. Hai thành phần này không nhất thiết phải cài đặt trên cùng một máy tính. 

- Phần mềm máy khách:

+ Tiếp nhận kết quả và tổ chức đưa ra khuôn dạng phù hợp.

+ Chuyển tới yêu cầu của máy chủ và chờ đợi trả lời;

+ Tổ chức giao diện, tiếp nhận yêu cầu truy cập thông tin;

- Phần mềm máy chủ:

+ Tiếp nhận yêu cầu truy vấn thông tin;

+ Xử lý

+ Gửi kết quả tới máy khách.

- Việc xử lý yêu cầu truy cập thông tin được thực hiện theo nguyên lý truy cập từ xa [RPC – Remote Procedure Call].

- Kiến trúc loại này có một số ư­u điểm sau:

+ Khả năng truy cập rộng rãi đến các CSDL;

+ Nâng cao khả năng thực hiện của CPU: các CPU ở máy chủ và máy khách khác nhau có thể cùng chạy song song, mỗi CPU thực hiện một nhiệm vụ;

+ Chi phí cho phần cứng giảm do chỉ cần máy chủ có cấu hình mạnh để lưu trữ và quản trị dữ liệu;

+ Chi phí truyền thông được giảm do một phần các thao tác được giải quyết trên máy khách, chỉ cần: yêu cầu về truy cập CSDL gửi đến máy chủ và dữ liệu kết quả gửi về máy khách;

+ Nâng cao khả năng đảm bảo tính nhất quán của dữ liệu vì các ràng buộc được định nghĩa và kiểm tra trên máy chủ.

+ Kiến trúc này phù hợp với việc xây dựng các hệ thống mở.

2. Các hệ CSDL phân tán

Hình 3. Hệ CSDL khách-chủ

a. Khái niệm CSDL phân tán

- CSDL phân tán là một tập hợp dữ liệu có liên quan [về logic] được dùng chung và phân tán về mặt vật lí trên một mạng máy tính.

Hình 4. Cơ sở dữ liệu phân tán

- Một hệ QTCSDL phân tán là một hệ thống phần mềm cho phép quản trị CSDL phân tán và làm cho người sử dụng không nhận thấy sự phân tán về lưu trữ dữ liệu.

- Người dùng truy cập vào CSDL phân tán thông qua chương trình ứng dụng. Các chương trình ứng dụng được chia làm hai loại:

+ Chương trình không yêu cầu dữ liệu từ nơi khác;

+ Chương trình có yêu cầu dữ liệu từ nơi khác.

Hình 5. Hệ CSDL phân tán

- Có thể chia các hệ CSDL phân tán thành 2 loại chính: thuần nhất và hỗn hợp.

+ Hệ CSDL phân tán thuần nhất: các nút trên mạng đều dùng cùng một hệ QTCSDL.

+ Hệ CSDL phân tán hỗn hợp: các nút trên mạng có thể dùng các hệ QTCSDL khác nhau.

b. Một số ưu điểm và hạn chế của các hệ CSDL phân tán

- Sự phân tán dữ liệu và các ứng dụng có một số ưu điểm so với các hệ CSDL tập trung:

+ Cấu trúc phân tán dữ liệu thích hợp cho bản chất phân tán của nhiều người dùng.

+ Dữ liệu được chia sẻ trên mạng nhưng vẫn cho phép quản trị dữ liệu địa phương [dữ liệu đặt tại mỗi trạm]

+ Dữ liệu có tính sẵn sàng cao.

+ Dữ liệu có tính tin cậy cao vì khi một nút gặp sự cố, có thể khôi phục được dữ liệu tại đây do bản sao của nó có thể được lưu trữ tại một nút khác nữa.

+ Hiệu năng của hệ thống được nâng cao hơn.

+ Cho phép mở rộng các tổ chức một cách linh hoạt. Có thể thêm nút mới vào mạng máy tính mà không ảnh hưởng đến hoạt động của các nút sẵn có.

- So với các hệ CSDL tập trung, hệ CSDL phân tán có một số hạn chế như sau:

+ Hệ thống phức tạp hơn vì phải làm ẩn đi sự phân tán dữ liệu đối với người dùng.

+ Chi phí cao hơn.

+ Đảm bảo an ninh khó khăn hơn.

+ Đảm bảo tính nhất quán dữ liệu khó hơn.

+ Việc thiết kế CSDL phân tán phức tạp hơn.

Thế nào là hệ CSDL trung tâm?

Hệ CSDL trung tâm - Là hệ CSDL được cài đặt trên máy tính trung tâm. Nhiều người dùng từ xa có thể truy cập CSDL này thông qua các thiết bị đầu cuối và các phương tiện truyền thông. - Tùy thuộc vào quy mô của tổ chức, máy tính trung tâm này một máy hay một dàn máy. Ví dụ: Các hệ thống đăng kí và bán vé máy bay.

Cơ sở dữ liệu tập trung là gì?

Phân loại theo mô hình CSDL tập trung [centralized database] một CSDL được đặt, lưu trữ và duy trì trong một địa điểm duy nhất. Đây vị trí thường xuyên nhất thiết phải đặt một hệ thống máy tính hoặc CSDL hệ thống trung tâm, ví dụ một máy chủ, hoặc một hệ thống máy tính lớn.

Tại sao lại sử dụng cơ sở dữ liệu phân tán?

Thuận lợi cho nhu cầu phát triển: Xu hướng dùng cơ sở dữ liệu phân tán sẽ cung cấp khả năng phát triển thuận lợi hơn và giảm được xung đột về chức năng giữa các đơn vị đã tồn tại và giảm được xung đột giữa các chương trình ứng dụng khi truy cập đến cơ sở dữ liệu.

So với hệ cơ sở dữ liệu tập trung hệ cơ sở dữ liệu phân tán có ưu điểm gì?

Sự phân tán dữ liệucác ứng dụng một số ưu điểm so với các hệ CSDL tập trung: + Cấu trúc phân tán dữ liệu thích hợp cho bản chất phân tán của nhiều người dùng. + Dữ liệu được chia sẻ trên mạng nhưng vẫn cho phép quản trị dữ liệu địa phương [dữ liệu đặt tại mỗi trạm] + Dữ liệu có tính sẵn sàng cao.

Chủ Đề