Aws redshift là gì

Khoá học Khoá học Khóa học AWS từ cơ bản đến nâng cao Chi tiết bài viết

khoảng 1 tháng

0 phút đọc

  • Amazon Redshift là dịch vụ lưu trữ dữ liệu quy mô hàng petabyte nhanh và mạnh mẽ.
  • Redshift được base trên PostgreSQL, tuy nhiên không được dùng trong OLTP [On-line transactional processing]
  • Redshift là OLAP - On-line analytical processing [dùng cho analytics và data warehousing]
  • Redshift tính tiền theo giờ chạy dựa trên instance mà bạn lựa chọn
  • x10 về mặt performance so với các data warehouse khác
  • Lưu trữ dữ liệu dưới dạng cột [Column]
  • Hỗ trợ mạn hình SQL interface để tạo các câu query truy vấn
  • Masively Parallel Query Execution [MPP]
  • Analytics/BI[Business intelligence]/Data Warehouse

  • Cluster: Đây là thành phần cốt lỗi trong kiến trúc của Redshift. Mỗi Cluster bao gồm một hoặc nhiều nodes thực hiện việc tính toán
  • Trong một Cluster sẽ có một hoặc nhiều Database
  • Leader node xử lý giao tiếp với các layer bên ngoài, ví dụ như thực hiện query, tổng hợp kết quả
  • Compute node: thực thi các câu truy vấn, gửi lại kết quả cho leader node
  • Node slices: Mỗi một Compute Node tiếp tục được chia nhỏ ra thành các Node Slice. Mỗi một Node Slice sẽ được phân chia đều CPU, Memory và Storage từ Compute Node đó.
  • Redshift Spectrum: truy vấn dữ liệu trực tiếp tới Amazon S3 mà không cần load dữ liệu vào các bảng của Redshift.
  • Backup & Restore, Security VPC/IAM/KMS, Monitoring

Redshift - Snapshot & DR [Disaster recovery]

  • Redshift không có cơ chế "Multi-AZ"
  • Bạn cần sử dụng snapshot để backup cluster và store trên S3
  • Bạn có thể restore một snapshot ra một cluster mới
  • Tạo snapshot có thể tự động hoặc bằng tay
    • Automated: bạn có thể tạo schedule tạo mỗi 8h/mỗi 5GB...
    • Manual:
  • Bạn có thể config Amazon Redshift tự động copy snapshots của một Cluster sang một Region mới

Redshift Spectrum là gì

Chỉnh sửa và đóng góp bài viết

Khi nói đến các dịch vụ điện toán đám mây, Amazon Redshift là một cường quốc về lưu trữ dữ liệu. Kho dữ liệu được sử dụng bởi một số công ty lớn nhất trên thế giới, bao gồm Ford Motor Company, Lyft, Intuit và Pfizer. Ngoài ra, kho dữ liệu lưu trữ cơ sở dữ liệu đám mây và dữ liệu sản xuất liên quan. Khái niệm dữ liệu lớn phụ thuộc vào khả năng xử lý, lưu trữ và phân tích dữ liệu trong kho bạc lớn và đó chính xác là những gì Amazon Redshift cung cấp.

Giống như không có sản phẩm nào khác, Amazon Redshift đã thúc đẩy việc áp dụng dữ liệu và lưu trữ dữ liệu lớn, cho phép các công ty xây dựng các ứng dụng mạnh mẽ và tạo các báo cáo có chứa tất cả dữ liệu họ cần để điều hành doanh nghiệp. sản phẩm kho dữ liệu nhanh chóng và toàn diện. Một khi bạn hiểu các điều khoản, bạn có thể tìm hiểu về lợi ích của sản phẩm.

Khái niệm cơ bản về kho dữ liệu

Một trong những điều đầu tiên bạn nên biết về Amazon Redshift là bạn có thể bắt đầu nhỏ. Mỗi công ty có thể đăng nhập vào một nút, nơi bạn lưu trữ cơ sở dữ liệu và dữ liệu của nó, sau đó chạy truy vấn và báo cáo về dữ liệu đó [và chạy các ứng dụng tùy chỉnh của riêng bạn]. Nút đầu tiên bạn tạo được gọi là nút lãnh đạo. Nếu bạn thêm nhiều hơn, chúng được gọi là các nút tính toán. Bạn có thể định nghĩa Amazon Redshift là một cụm các nút.

Tất nhiên, nó phức tạp hơn nhiều – Redshift là nền tảng cho một bộ sưu tập các sản phẩm điện toán đám mây là một phần của Dịch vụ web Amazon. Thành phần lưu trữ đám mây có Amazon S3 [hoặc Amazon Simple Storage Service], cung cấp chính kho lưu trữ đối tượng.

Tuy nhiên, nhiều công ty bắt đầu với một nút khi họ bắt đầu một sáng kiến ​​lưu trữ dữ liệu. Khi các yêu cầu lưu trữ dữ liệu của bạn mở rộng và thay đổi, bạn có thể thêm nhiều nút vào một cụm. Điều này sẽ cho phép bạn xây dựng nhiều ứng dụng hơn, chạy nhiều truy vấn hơn và phân tích nhiều hơn. Giá cả có thể phụ thuộc vào thời gian bạn muốn giữ cho các nút này hoạt động. Giá sẽ giảm nếu bạn dự trữ các nút trong một khoảng thời gian dài hơn, ví dụ. Trong một hoặc ba năm.

Điều quan trọng nữa là phải biết rằng hầu hết sự phức tạp nằm ở phía sau hậu trường. Điều này bao gồm bảo mật điểm cuối, quản trị, nhân rộng, triển khai và mọi thứ khác liên quan đến kho dữ liệu. Có bảng điều khiển web cho phép nhóm quản lý dịch vụ CNTT của bạn quản lý các phiên bản và tạo các nút mới. Tuy nhiên, bạn không cần lập kế hoạch hoặc quản lý các tính năng, sao lưu, lưu trữ hoặc quản lý cơ sở hạ tầng cho cơ sở dữ liệu hoặc dữ liệu, bao gồm cả máy chủ hoặc mạng.

Amazon gần đây đã công bố một số cải tiến cho Redshift. Một trong những thay đổi quan trọng nhất là các nút bạn sử dụng cho hiệu suất hoặc lưu trữ có thể được điều chỉnh riêng. Trước đây, một cụm được quản lý cho cả phân bổ hiệu năng và bộ nhớ. Amazon cũng cải thiện tốc độ mạng, đặc biệt là các kết nối giữa Redshift và Amazon S3. Amazon tuyên bố rằng Redshift hiện cung cấp hiệu suất gấp ba lần các sản phẩm kho dữ liệu cạnh tranh.

Lợi ích của Redshift

Giống như bất kỳ sáng kiến ​​điện toán đám mây nào, lý do sử dụng Amazon Redshift phải được thực hiện với tính linh hoạt. Như đã đề cập trước đó, các công ty có thể đặt một nút làm điểm bắt đầu. Tuy nhiên, từ đó, họ có thể tạo các cụm lớn với nhiều nút cho mỗi nhu cầu báo cáo mà họ có cho bất kỳ ứng dụng web nào. Có thể nói rằng khả năng kiểm soát cơ sở dữ liệu là vô tận không hoàn toàn đúng, nhưng điện toán đám mây sẽ trông như thế.

Một lợi ích khác vượt xa sự linh hoạt về những gì bạn có thể làm và các ứng dụng bạn chạy cũng là một lợi thế của cách mọi thứ được quản lý. Nhân viên CNTT của bạn không cần quản lý cơ sở hạ tầng điện toán đám mây hoặc các máy chủ, mạng hoặc lưu trữ được yêu cầu. Vì mọi thứ đều ở trên đám mây và là một phần của Dịch vụ web Amazon [hoặc AWS], mọi thứ đều được quản lý từ xa và tự động cập nhật.

Một lợi ích cuối cùng cần xem xét là Amazon Redshift cung cấp khuôn khổ cho một doanh nghiệp vượt qua các giới hạn hiện tại. Đây có thể là một ứng dụng mới sử dụng cơ sở dữ liệu trong đám mây [và dữ liệu được lưu trữ trên đám mây] hoặc một cách mới để phân tích dữ liệu kinh doanh. Một số công ty thậm chí còn tạo ra các phòng ban và bộ phận hoàn toàn mới dựa trên khả năng hiểu và xử lý dữ liệu mới được phát hiện của họ. Một ví dụ về điều này có thể là một nhà sản xuất ô tô có thể phân tích dữ liệu trong thời gian thực và phát triển các chức năng lái xe tự trị.

Cuối cùng, sức mạnh của Amazon Redshift chỉ bị giới hạn bởi trí tưởng tượng của công ty để bắt đầu một doanh nghiệp mới, chủ động, phát triển một sản phẩm mới hoặc bắt đầu một bộ phận mới.

Amazon RedshiftAmazon chuyển đỏ. Đây là nghĩa tiếng Việt của thuật ngữ Amazon Redshift - một thuật ngữ thuộc nhóm Technology Terms - Công nghệ thông tin.

Độ phổ biến[Factor rating]: 5/10

Amazon chuyển đỏ là một dịch vụ đám mây kho dữ liệu giúp các công ty lưu trữ và phân tích lượng dữ liệu lớn, lên đến quy mô petabyte. Đây theo yêu cầu dữ liệu kho công trình dịch vụ với Amazon Web Services [AWS], một nền tảng phổ biến cho kinh doanh thông minh và phân tích.

Xem thêm: Thuật ngữ công nghệ A-Z

Giải thích ý nghĩa

Amazon chuyển đỏ hoạt động trên tiền đề của việc thu thập một vài nút và tạo ra một cụm Amazon chuyển đỏ. Khách hàng có thể cung cấp cụm này và dữ liệu tải lên, sau đó sử dụng các truy vấn phân tích dữ liệu phức tạp để có được phân tích kinh doanh thông minh.

What is the Amazon Redshift? - Definition

Amazon Redshift is a data warehouse cloud service that helps companies to store and analyze large amounts of data, up to the petabyte scale. This on-demand data warehousing service works with Amazon Web Services [AWS], a popular platform for business intelligence and analytics.

Understanding the Amazon Redshift

Amazon Redshift works on the premise of collecting several nodes and creating an Amazon Redshift cluster. Clients can provision this cluster and upload data, then use complex data analysis queries to obtain business intelligence analysis.

Thuật ngữ liên quan

  • Amazon Web Services [AWS]
  • Amazon Simple Queue Service [Amazon SQS]
  • Amazon Simple Storage Service [Amazon S3]
  • Apache Hadoop
  • Apache Hive
  • Distributed Computing System
  • Cloud Provider
  • Subscription-Based Pricing
  • Cloud Portability
  • Cloud Enablement

Source: Amazon Redshift là gì? Technology Dictionary - Filegi - Techtopedia - Techterm

Video liên quan

Chủ Đề