Intel sse4.1 intel sse4.2 intel avx2 là gì

Ưu tiên cho mục đích phát triển những kahr năng quản lý hệ thống mạnh cho các dòng máy tính xách tay, Intel và AMD đã thêm chế độ quản lý hệ thống (SMM: System Managemnt Mode) và các bộ xử lý của họ suốt đầu những năm 90.SMM là chế độ hoạt động mục đích đặc biệt cung cấp cho điều khiển quản lý nguồn hệ thống cấp thấp và những chức năng kiểm soát phần cứng. SMM mang đến môi trường phần mềm riêng biệt mà hệ điều hành và các úng dụng không phải quan tâm đến, được dự định cho sử dụng bởi BIOS hệ thống hay mã trình điều khiển mức độ thấp. SMM đầu tiên được giới thiệu như thành phần của bộ xử lý xách tách Intel 386SL vào tháng 10 năm 1990. SMM sau đó xuất hiện như thành phần của bộ xử lý Intel 486SL vào tháng 11 năm 1992 và trong toàn bộ dòng 486 bắt đầu vào tháng 6 năm 1993. SMM đặc biệt vắng mặt trong các bộ xử lý Pentium đầu tiên khi chúng được phát hành vào tháng 3 năm 1993; tuy nhiên, SMM được bao gồm trong tất cả bộ xử lý Pentium 75MHz và nhanh hơn được phát hành vào hay sau tháng 10 năm 1994. AMD thêm SMM vào các bộ xử lý nhanh hơn được phát hành vào hay sau tháng 10 năm 1994. AMD thêm SMM vào các bộ xử lý Am486 được mở rộng và K5 cũng trong thời điểm này. Tất cả bộ xử lý dựa trên x86 của Intel và AMD được giới thiệu từ thời điểm này đều kết hợp SMM.

Intel sse4.1 intel sse4.2 intel avx2 là gì

SMM được khơi dậy bằng cách chuyển tín hiệu một chân ngắt đặc đặc biệt trên bộ xử lý, sinh ra một ngắt quản lý hệ thống (SMI: System Management Interript), ngắt (nonmasskable interrupt) ưu tiên cao nhất có thể. Khi SMM khởi động, bối cảnh hay tình trạng bộ xử lý và các chương trình đang chạy được lưu. Kế tiếp bộ xử lý chuyển sang không gian địa chỉ chuyên dụng riêng biệt và thực thi mã SMM, chạy trong suốt đối với chương trình được ngắt cũng như bất kỳ phần mềm nào khác trên hệ thống. Một khi nhiệm vụ SMM hoàn tất, một tập lệnh tiếp tục hồi phục lại bối cảnh hay tình trạng bộ xử lý và các chương trình đã được lưu trước đó, bộ xử lý tiếp tục chạy chính xác bắt đầu từ nơi mà nó ngừng lại. Trong khi được dùng ban đầu chủ yếu cho quản lý nguồn, SMM được thiết kế để sử dụng bởi bất kỳ chức năng hệ thống cấp thấp nào cần để thực hiện chức năng độc lập của hệ điều hành và phần mềm khác trong hệ thống. Trong các hệ thống hiện đại, điều này bao gồm phần sau:

+ Các chức năng quản lý nguồn ACPI và APM

+ Hỗ trợ kế thừa USB (bàn phím và chuột)

+ Khởi động Usb ( sự mô phỏng ổ đĩa)

+ Các chức năng mật khẩu và bảo mật

+ Giám sát nhiệt

+ Giám sát tốc độ quạt

+ Đọc/ghi CMOS RAM

+ Nâng cấp BIOS

+ Ghi các lỗi ECC bộ nhớ

+ Ghi các lỗi phần cứng ngoài bộ nhớ

+ Các chức năng đánh thức (Wake) và cảnh báo (Alert) như là Wake On LAN (WOL)

Một thí dụ của SMM trong hoạt động có thể thấy được khi hệ thống cố gắng truy cập một thiết bị ngoại vi được ngắt trước đó để tiết kiệm năng lượng. Cho thí dụ một chương trình thực hiện một yêu cầu để đọc một têp tin trên ổ cứng, nhưng ổ đĩa đã ngừng quay trước đó để tiết kiệm năng lượng. Trong lúc truy cập, thiết bị tiếp hợp chủ sinh ra một SMI (SMI: System Managemetn Interrupt) để gọi ra SMM (SMM: System Management Mode). Phần mềm SMM kế tiếp cho các lệnh để quay ổ cứng và chuẩn bị ổ cứng sẵn sàng. Rồi SMM quay lại kiểm soát hệ điều hành, tải tệp tin tiếp tục như thể ổ đĩa đang quay cùng.

Pentium thế hệ thứ năm và các bộ xử lý mới có tính năng đa đường dẫn thực thi tập lệnh nội bộ cho phép chúng thực thi nhiều tập lệnh trong cùng một thời gian. Chip 486 và tất cả những con chip xưa chỉ thực hiện một chỉ lệnh tại một thời điểm. Intel gọi khả năng thực thi nhiều hơn một tập lệnh cùng một thời điểm là công nghệ superscalar. Công nghệ này đưa ra hiệu năng thêm được so sánh với 486.

Kiến trúc superscalar thường được kết hợp với các chip RISC (Reduced Instruction Set Computer) công suất cao. Một chip RISC có một bộ tập lệnh ít phức tạp với ít tập lệnh đơn giản hơn. Mặc dù mỗi tập lệnh ít thực thi, toàn bộ xung có thể cao hơn, khiến nó có thể tăng sự hoạt động. Pentium là một trong những chip CISC (Complex Intruction Set Computer) được xem như siperscalar. Một chip CISC dùng một bộ tập lệnh tính năng vượt trội với nhiều tập lệnh phức tạp. Thí dụ sau đây sẽ làm rõ chức năng hai chip: muốn chỉ thị một robot lắp một bóng đèn, nếu dùng tập lệnh CISC, ta sẽ nói:

1.Nhặt bóng đèn lên

2.Cắm nó vào đui đèn

3.Xoay theo chiều kim đồng hồn đến khi chặt cứng

4.Nếu dùng tập lệnh RISC, ta sẽ nói:

5.Ta hạ thấp hơn

6.Nhặt bóng đèn

7.Nâng tay lên

8.Cắm nó vào đui đèn

9.Quay theo chiều kim đồng hồ một vòng

10.Bóng đèn chặt chưa? Nếu không, lập lại bước 5

Nói chung nhiều tập lệnh RISC được yêu cầu thực hiện công việc bởi vì mỗi tập lệnh tinh giản. Thuận lợi là chỉ có một ít mệnh lệnh tổng mà robot (hay Bộ xử lý) phải thực hiện và có thể thực hiện lệnh đơn khá nhanh , như thế trong nhiều trường hợp thực thi mệnh lệnh phức tạp cũng nhanh hơn như thế. Cuộc tranh luận tiếp diễn liệu RISC hay CISC thực thi tốt hơn nhưng trong thực tế không có chip thuần túy là RISC hay CISC, tất cả chỉ là vấn đề định nghĩa và các hàng là cái gì đó tùy tiện.

Intel và các bộ xử lý tương đương thường quan tâm chip CISC, mặc dầu các phiên bản thế hệ thức 5 và tiếp theo có nhiều thuộc tính RISC và bên trong bẻ các tập lệnh CISC thành những phiên bản RISC

Công nghệ MMX được cơ bản đặt tên cho các phát triển đa phương tiện, hay các phát triển toán ma trận, tùy thuộc vào người yêu cầu. Intel chính thức chỉ ra rằng nó thực sự không là chữ viết tắt hay không là gì khác hơn các kí tự MMX (không là một chứ viết tắt được yêu cầu nhìn từ bên ngoài mà những chữ này được đăng ký thương mại); tuy vậy, các căn nguyên phía trong có thể là một trong quyền ưu tiên. Công nghệ MMX được thể hiện ở Pentium thế hệ thứ 5 như một loại độn thêm làm cải tiến kỹ thuật nén hay giải nén video (video compression/decompression), thao tác ảnh, mã hóa và xử lý I/O…Tất cả đều được sử dụng trong sự đa dạng của phần mềm hiện nay.

MMX bao gồm hai cải tiến kiến trúc bộ xử lý. Cải tiến thứ nhất rất cơ bản; tất cả chip MMX đều có bộ nhớ đệm nội bộ L1 lớn hơn phiên bản không MMX của chúng. Điều này cải tiến được tốc độ của bất kỳ và tất cả phần mềm chạy trên con chip, không quan tâm tới nó có thực sử dụng những tập lệnh cụ thể của MMX hay không.

Phần cải tiến thứ hai là mở rộng tập lệnh bộ xử lý với 57 mệnh lệnh mới hay tập lệnh mới, cũng như một khả năng tập lệnh mới được gọi là tập lệnh đơn, đa dữ liệu (SIMD: Single Instruction, Multiple Data).

Những ứng dụng giao tiếp và đa phương tiện hiện đại thường sử dụng nhưng vòng lặp, chiếm 10% hoặc ít hơn của toàn bộ mã ứng dụng, có thể chiếm tới 90% thời gian hoạt động. SIMD cho phép một tập lệnh để thực hiện cùng nhiệm vụ trên đa phần dữ liệu, tương tự như tại một thời điểm một thầy giáo nói cho toàn bộ lớp ngồi xuống, hơn là đến từng học sinh cho ngồi xuống. SIMD cho phép con chip giảm những vòng lặp bộ xử lý chuyên sâu thông thường với video, audio, đồ họa và hoạt hình.

Intel thêm 57 tập lệnh mới thiết kế một cách cụ thể để thao tác và xử lý video, audio và dữ liệu đồ họa thật hữu hiệu. Những tập lệnh này được hướng tới sự tương đương mức độ cao (highly parallel) và thường các chuỗi lặp thường xuyên được thấy trong những hoạt động đa phương tiện. Highly parallerl chỉ ra một thực tế là xử lý giống nhau được thực hiện trên nhiều điểm dữ liệu, như là khi sửa đổi hình ảnh đồ họa. Điểm yếu chính của MMX là nó làm việc trên những giá trị số nguyên và được sử dụng bộ dấu chấm động (floadting-point unit) cho tiến trình xử lý, vì vậy thời gian bị mất khi chuyển dịch cần thiết tới hoạt động dấu chấm động là cần thiết. Những điểm yếu này được sửa chữa trong phần bổ xung cho MMX của Intel va AMD.

Intel cấp phép tính năng MMX cho các đối thủ cạnh tranh như AMD và Cyrix, sau đó họ có khả năng nâng cấp những bộ xử lý của họ với công nghệ MMX.

Intel sse4.1 intel sse4.2 intel avx2 là gì

SSE

Tháng 2 năm 1999 Intel giới thiệu bộ xử lý Pentium III bao gồm một cập nhật đối với MMX gọi là sự xếp đặt các mở rộng SIMD (SSE: Streaming SIMD Extensions). Đây được gọi là những tập lệnh mới Kaimai (KNI: Katmai New Instructions) bởi vì cơ bản chúng bao gồm bộ xử lý Katmai, tên mã của Pentium II. Celeron 533A và những bộ xử lý celeron nhanh hơn dựa trên nhân pentium III đều hỗ trợ các tập lệnh SSE. Pentium III đầu tiên, celeron 533 và những dòng thấp hơn (dựa trên nhân pentium II) đều không hỗ trợ SSE.

SSE bao gồm 70 tập lệnh mới cho xử lý đồ họa và âm thanh trên cơ sở MMX cung cấp. SSE tương tự như MMX; thực tế ngoài được gọi là KNI, SSE cũng được gọi là MMX-2 bởi một số người trước khi nó được phát hành. Ngoài ra để thêm vào nhiều tập lệnh kiểu MMX, tập lệnh SSE cho phép các tính toán dấu chấm động (floating-point calculation) và hiện nay dùng một bộ phận tách biệt trong bộ xử lý thay vì chia sẻ bộ dấu chấm động tiêu chuẩn như MMX.

SSE2 được giới thiệu vào tháng 10 năm 2004 cùng với bộ xử lý Pentium 4 Prescott, thêm 144 tập lệnh SIMD. SSE2 cũng bao gồm tất cả tập lệnh MMX và SSE trước đó.

SSE3 được ra mắt vào tháng 2 năm 2004 cùng với bộ xử lý Pentium 4 Prescoott, thêm 13 tập lệnh mới SIMD để phát triển thuật toán phức tạp, đồ họa, mã hóa video, đồng bộ hóa dãy. SSE3 cũng bao gồm tất cả tập lệnh MMX, SSE và SSE2 trước đó.

SSSE3 (bổ sung vào SSE3) được giới thiệu vào tháng 6 năm 2006 trong các bộ xử lý máy chủ dãy Xeon 5100 và tháng 7 năm 2006 với các bộ xử lý Core 2. SSSE3 thêm vào 32 tập lệnh SIMD mới vào SSE3.

SSSE4 (cũng được gọi là HD Boost bởi Intel) được giới thiệu vào tháng 1 năm 2008 trong các phiên bản của bộ xử lý Intel Core 2 (SSE4.1) và sau đó được cập nhật vào tháng 10 năm 2008 trong các bộ xử lý Core i7 (SSE4.2). SSE4 bao gồm tổng cộng 54 tập lệnh, với tập hợp con 47 tập lệnh bao gồm SSE4.1 và đầy đủ 54 tập lệnh trong SSE4.2.

Mặc dù AMD chấp nhận các tập lệnh Intel SSE3 và cũ hơn trong quá khứ, thay vì chấp nhận SSE4, AMD tạo ra một bộ chỉ bốn tập lệnh khác hẳn gọi là SSE4a. AMD cũng thông báo là đang vận hành bộ 170 tập lệnh mới gọi là SSE3, AMD đang lựa chọn 100% không tương thích với Intel, gây ra sự khó khăn cho những nahf lập trình trong tương lai.

Sự xếp đặt các mở rộng SIMD (SSE) bao gồm những chỉ lệnh mới, bộ dấu chấm động SIMD, số nguyên SIMD bổ sung và các chỉ lệnh điều khiển khả năng bộ nhớ truy cập. Một số công nghệ lấy lợi thế từ SSE bao gồm các ứng dụng advanced imaging, 3D video, streaming audio và video (DVD playback), các ứng dụng nhận giọng nói.

Các tập lệnh SSEx thì hữu ích đặc biệt với giải mã MPEG2, một trình ứng dụng tiêu chuẩn được sử dụng trên các đĩa video DVD. Bộ xử lý được trang bị SSE có khả năng giải mã MPEG2 trong phần mềm với tốc độ đủ mà không cần lắp thêm card giải mã MPEG2. Bộ xử lý được trang bị SSE tốt hơn, nhanh hơn các bộ xử lý trước khi có nhận diện giọng nói.

Một trong những ưu điểm của SSE qua nền MMX là nó hỗ trợ hoạt động bộ dấu chấm động SIMD chính xác, điều gây nên nghẽn cổ chai trong xử lý đồ họa 3D. Như với nền MMX, SIMD cho phép đa hoạt động để thực hiện cho mỗi chỉ lệnh bộ xử lý. Cụ thể SSE hỗ trợ lên đến 4 hoạt động dấu chấm động trong một chu kỳ, nghĩa là một tập lệnh có thể thao tác đồng thời trên 4 mẫu dữ liệu. Các tập lệnh dấu chấm động SSE cùng hỗ trợ dữ liệu nạp trước (prefetchinh), một cơ cấu đọc dữ liệu vào bộ nhớ đệm trước khi dữ liệu được gọi ra.

Chú ý rằng bất kỳ chỉ lệnh SSE nào có ích, chúng phải được mã hóa trong phần mềm bạn đang dùng, vì vậy những ứng dụng nhận ra SSE phải được sử dụng để nhận biết những lợi ích này. Phần lớn công ty phần mềm viết phần mềm liên quan đồ họa và âm thanh ngày nay phải cập nhật những ứng dụng này thành nhận biết SSE (SSE aware) và sử dụng những tính năng của SSE. Cho ví dụ, những ứng dụng đồ họa công suất cao như là Adobe Photoshop hỗ trợ các chỉ lệnh SSE cho sự thực thi cao hơn trong các bộ xử lý được trang bị SSE. Microsoft cũng bao gồm hỗ trợ cho SSE trong DirectX6.1, những trình ứng dụng video và âm thanh sau này của họ được bao hàm trong Window 98 và mới hơn. Mỗi bộ tập lệnh SIMD kế tiếp xây dựng trên bộ trước đó.

3Dnow! Công nghệ được gới thiệu đầu tiên như sự thay thế của AMD đối với các chỉ lệnh SSE trong bộ xử lý Intel. Thực sự 3Dnow! Được giới thiệu đầu tiên với dòng K6 trước khi Intel tung ra SSE trong Pentium IIII và kế tiếp AMD thêm Enhanced 3Dnow! vào bộ xử lý Athlon và Duron. Phiên bản mới professional 3Dnow! được ra mắt với bộ xử lý Athlon XP đầu tiên. AMD được cấp quyền sử dụng công nghệ MMX từ Intel và tất cả từ dòng K6 series, Athlon, Duron và những bộ xử lý sau này đều bao gồm hỗ trợ chỉ lệnh MMX đầy đủ.

Công nghệ 3Dnow! Công nghệ là bộ 21 tập lệnh sử dụng công nghệ SIMD để hoạt động trên mạng dữ liệu hơn là các thành phần đơn. Enhanced 3Dnow! thêm vào 24 tập lệnh nữa (19 SSE và 5 DSP/những tập lệnh giao tiếp), tổng cộng là 45 tập lệnh mới. Mặc dù 3Dnow! tương tự như SSE trong các bộ xử lý Pentium III and Celeron của Intel, chúng không tương thích mức tập lệnh nên phần mềm được viết dạng hỗ trợ SSE không thể hỗ trợ 3Dnow! và ngược lại.

3Dnow! Profession thêm 51 lệnh SSE vào Enhanced 3Dnow! Nghĩa là 3Dnow! Professional hỗ trở tất cả lệnh SSE. AMD thêm hỗ trợ SSE2 trong các bộ xử lý Athlon 64, Athlon 64FX, Opteron 64-bit và bao gồm SSE3 trong các phiên bản 0.09 micron của Athlon 64, tất cả phiên bản của dual-cỏe Athlon 64X2.

Đầu tiên được dùng trên bộ xử lý P6 (hay Pentium thế hệ thứ sáu), thực thi động cho phép bộ xử lý thực thi nhiều tập lệnh song hành và các công việc hoàn tất nhanh chóng. Sự cách tân công nghệ này bao gồm 3 yếu tố chính.

+ Dự đoán đa nhánh: dự đoán dòng chương trình thông qua vài nhánh.

+ Phân tích dòng dữ liệu: Biểu tập lệnh được thực thi khi đã sẵn sàng, độc lập với những lệnh trong chương trình gốc.

+ Thực hành suy đoán: Tăng tốc độ thực thi bởi duyệt trước chương trình và thực thi tập lệnh cần thiết.

Intel sse4.1 intel sse4.2 intel avx2 là gì

Dự đoán nhánh (Branch prediction) là một tính năng chỉ được thấy ở những bộ xử lý máy vi tính lớn dòng cao cấp (high-end mainframe processors). Nó cho phép bộ xử lý giữ đầy đường dẫn tập lệnh trong lúc chạy ở tốc độ cao. Một bộ tìm nạp/giải mã trong bộ xử lý dùng thuật toán dự đoán nhánh được tối ưu cao để dự đoán hướng và kết quả của tập lệnh được thực thi thông qua nhiều mức độ của nhanh, phát đi và quay về. Tương tự như người chơi cờ chơi nhiều thế trận bởi dự đoán đường đi của đối thủ. Do dự đoán trước được kết quả các tập lệnh được thực thi không phải chờ đợi.

Phân tích dòng dữ liệu (Dataflow analysis) nghiên cứu dòng dữ liệu qau bộ xử lý để phát hiện bất kỳ cơ hội cho sự thực thi tập lệnh ngoài trình tự (out –of order instruction execution). Một bộ phận gửi đi/thực thi trong bộ xử lý điều hành những tập lệnh này và có thể thực thi những tập lệnh này trong một lệnh tối ưu cho những bộ phận thực thi bận rộn thậm chí ngay trong tình trạng cache miss và những tập lệnh độc lập dữ liệu khác có thể bị chặn lại.

Thực hành suy đoán (Speculative execution) là khả năng của bộ xử lý thực thi những tập lệnh trước bộ đếm chương trình thực sự. Bộ phận gửi đi/thực thi của bộ xử lý dùng phân tích dữ liệu để thực hiện các tập lệnh trong hồ tập lệnh và lưu trữ kết quả trong những thanh tạm thời (registers). Kế tiếp một bộ phận lưu tìm trong hồ tập lệnh những tập lệnh hoàn tất mà không còn dữ liệu phụ thuộc vào những tập lệnh khác nữa để chạy hay không giải quyết lại dự đoán nhánh. Nếu bất kỳ tập lệnh hoàn tất nào được tìm thất, kết quả được đưa vào bộ nhớ bởi bộ phận lưu này hay kiến trúc Intel chuẩn thích hợp trong thứ tự mà chúng được xuất phát. Cuối cùng chúng được lui về hộ tập lệnh.

Thực thi động cơ bản chuyển dời sự ràng buộc và sự phụ thuộc trên sự sắp xếp tập lệnh tuyến. Do tăng cấp thực thi tập lệnh ngoài trình tự, những bộ tập lệnh được duy trì hoạt động hơn là chờ dợi dữ liệu từ bộ nhớ. Mặc dầu những tập lệnh có thể đoán trước và thực thi ngoài trình tự, những kết quả được xác nhận trong lệnh gốc nên không thể phá vỡ hay thay đổi dòng chương trình. Điều này cho phép bộ xử lý P6 chạy trên phần mềm kiến trúc Intel chính xác như bộ xử lý P5 và các bộ xử lý trước đã thực hiện như một tổng thể khá nhanh!

Kiến trúc tuyến độc lập đôi

Kiến trúc tuyến độc lập đôi (DIB: Dual Independent Bus) được thực thi đầu tiên ở các bộ xử lý thế hệ thứ sáu của Intel và AMD. DIB được chế tạo để phát triển dung lượng và tốc độ bus xử lý. Với hai bus I/O dữ liệu độc lập cho phép bộ xử lý truy cập dữ liệu từ các bus của nó đồng thời và song hành, hơn là trong cách tuần tự từng cái (như trong hệ thống bus đơn). Bus bộ xử lý chính (thường được gọi là front-side) là giao diện giữa bộ xử lý và bo mạch chủ hay chipset. Bus thứ hai (gọi là back-side) trong bộ xử lý với DIB được dùng cho bộ nhớ đệm L2, cho phép nó chạy ở tốc độ lớn hơn rất nhiều hơn nếu nó chia sẻ bus bộ xử lý chính.

Hai bus tạo nên kiến trúc DIB: Bus bộ nhớ đẹm L2 và bus CPU chính thường được gọi FSB (front-side bus). Những bộ xử lý lớp P6, từ Pentium Pro đến Core 2, cũng như Athlon 64 có thể sử dụng hai bus đồng thời, hạn chế được tình trạng nghẽn cổ chai. Kiến trúc hai bus cho phép bộ nhớ đệm L2 chạy tốc độ tối đa trong nhân bộ xử lý trên bus độc lập, còn bus cho phép bộ nhớ đệm L2 chạy tốc độ tối đa trong nhân bộ xử lý trên bus độc lập, còn bus CPU chính (FSB) quản lý dũ liệu bình thường vào ra con chip. Hai bus này có tốc độ khác nhau . FSB có tốc độ gắn với tốc độ bo mạch chủ, còn bus phía sau (back-side) hay bộ nhớ đệm L2 có tốc độ gắn với tốc độ nhân bộ xử lý. Ngay khi tần số bộ xử lý tăng thì tốc độ bộ nhớ đệm L2 cũng tăng.

Chìa khóa để thực thi DIB là chuyển dịch bộ nhớ đệm L2 ra khỏi bo mạch chủ và chuyển vào gói bộ xử lý. Bộ nhớ đệm L1 là phần trực tiếp của khuôn bộ xử lý, còn bộ nhớ đẹm L2 rộng hơn và cơ bản là ở ngoài. Bằng cách chuyển bộ nhớ đệm L2 vào bộ xử lý, bộ nhớ đệm L2 có tốc độ khá giống như bộ nhớ đệm L1, nhanh hơn bo mạch chủ hay bus bộ xử lý.

DIB cho phép bus hệ thống thực hiện nhiều giao dịch đồng thời (thay vì giao dịch tuần tự từng cái), tăng tốc dòng thông tin trong hệ thống và tăng tốc độ. Tổng quan cấu trúc DIB cho gấp ba lần tốc độ băng thông vượt qua bộ xử lý cấu trúc bus đơn.

Công nghệ siêu phân luồng

Công nghệ siêu phân luồn của Intel (HT:Hyper-Treading) cho phép một bộ xử lý đơn hay nhân bộ xử lý điều khiển hai bộ tập lệnh độc lập cùng một lúc. Về cơ bản, công nghệ HT biến đổi nhân bộ xử lý vật lý đơn thành hai bộ xử lý ảo.

Công nghệ HT được giới thiệu trên bộ xử lý lớp Workstaion Xeon với bus hệ thống 533MHz tháng 3 năm 2002, sau đó là các bộ xử lý PC để bàn tiêu chuẩn, với bộ xử lý Pentium 43.06GHz vào tháng 10 năm 2002. Công nghệ siêu phân luồng có trước các bộ xử lý đa nhân, nên những bộ xử lý có nhiều nhân vật lý, như là Core 2 và Core I Series, có thể và không thể hỗ trợ công nghệ này tùy thuộc phiên bản bộ xử lý cụ thể. Một bộ xử lý bốn nhân hỗ trợ công nghệ HT (như Core i Series) thể hiện như bộ xử lý tám nhân đối với hệ điều hành.

Công nghệ siêu phân luồng hoạt động như thế nào?

Bộ xử lý có khả năng siêu phân luồn có hai bộ thanh ghi đa năng, những thanh điều khiển và những thành phần kiến trúc khác, nhung hai bộ xử lý logic chia sẻ cùng bộ nhớ đệm, các bộ thực thi, các bus. Suốt quá trình hoạt động mỗi bộ xử lý điều khiển một chuỗi đơn xem Hình 3.2).

Intel sse4.1 intel sse4.2 intel avx2 là gì

Thread 1: màu đen; Thread 2: màu xám; CPU chuẩn” màu trắng

Hình 3.2: Một bộ xử lý siêu phân luồng có khả năng làm đầy thời gian chuẩn khác với bộ xử lý thứ hai, phát triển nhiều chức năng và hoạt động của những ứng dụng đơn đa luồng.

Dẫu cho có sự phân bổ của một số thành phần bộ xử lý nghĩa là tốc độ tổng thể của một hệ thống có khả năng siêu phân luồng không cao bằng hệ thống bộ xử lý hai nhân thực sự, tốc độ tăng 25% hay nhiều hơn là có thể khi đa ứng dụng hay ứng dụng đa chuỗi đơn được chạy.

Những yêu cầu của siêu phân luồng

Để lấy những ưu điểm công nghệ HT, bạn cần phần sau:

+ Một bộ xử lý hỗ trợ công nghệ HT – Điều này bao gồm nhiều bộ xử lý (nhưng không phải tất cả) Core i Series, Pentium 4, Xeon, và Atom. Kiểm tra những đặc điểm kỹ thuật bộ xử lý mẫu cụ thể để chắc chắn.

Một chipset tương thích – Một số chipset cũ hơn không hỗ trợ công nghệ HT.

BIOS hỗ trợ để bật/tắt công nghệ HT – Đảm bảo bạn cho phép công nghệ HT trong BIOS Setup.

Công nghệ HT được hệ điều hành chấp nhận – Windows XP và mới hơn hỗ trợ công nghệ HT. Các phân bố Linux trên nhân 2.4.18 hay cao hơn cũng hỗ trợ công nghệ HT.

Để xem công nghệ HT thực hiện chức năng chính xác thế nào, bạn kiểm tra Device Manager trong Windows để biết bao nhiêu bộ xử lý được nhận ra. Khi siêu phân luồn được hỗ trợ và bật, Windows Device Manager thể hiện gập đôi số bộ xử lý như có đủ các nhân bộ xử lý vật lý.

Mặc dầu Windows NT 4.0 và Windows 2000 được thiết kế để sử dụng nhiều bộ xử lý vật lý công nghệ HT yêu cầu những sự tối ưu hệ điều hành cụ thể để làm việc chính xác. Nếu hệ điều hành không hỗ trợ công nghệ HT (Thí dụ Windows 2000, 9x/Me và cũ hơn), Intel đề nghị bạn vô hiệu hóa tính năng này trong BIOS Setup.

Công nghệ siêu phân luồng mô phỏng hai bộ xử lý trong bộ vật lý đơn. Nếu hai bộ xử lý được mộ phỏng tốt thì có hai hay nhiều bộ xử lý thật sẽ tốt hơn. Bộ xử lý đa nhân, như tên hàm ý, thực sự chứa hai hay nhiều nhân bộ xử lý trong một gói bộ xử lý đơn. Từ vẻ bề ngoài nó vẫn giống như một bộ xử lý (và được xem xét cho những mục đích cấp phép của Windows) , nhưng bên trong có thể có hai, bốn hay thậm chí nhiều nhân bộ xử lý. Một bộ xử lý đa nhân cung cấp thật sự tất cả nhưng thuận lợi của việc có nhiều bộ xử lý vật lý riêng lẻ, chi phí thấp hơn.

Cả AMD và Intel đều giới thiệu bộ xử lý cho máy để bàn Dual-core tương thích x86 tháng 5 năm 2005. AMD khởi đầu là Athlon 64x2 trong khi lntel với bộ xử lý Dual-core đầu tiên: Pentium Extreme Edition 840 và Pentium D. Extreme Edition 840 cũng hỗ trợ công nghệ HT, cho phép nó xuất hiện như bộ xử lý quad-core đối với hệ điều hành. Những bộ xử lý này kết hợp khả năng tập lệnh 64 bit đi với hai nhân nội bộ, về thực chất hai bộ xử lý trong một đóng gói. Những chip này là sự bắt đầu cuộc cách mạng đa nhân, tiếp tục bằng cách thêm nhiều nhân đi với những phần mở rộng cộng vào bộ tập lệnh. Bộ xử lý Quad-core đầu tiên được Intel giới thiệu tháng l0 năm 2006, được gọi là Core 2 Extreme QX và Core 2 Quad. AMD sau đó ra mắt bộ xử lý PC để bàn Quad-core đầu tiên được gọi là Phenom tháng l0 năm 2007.

Có một số nhầm lẫn về Windows và các bộ xử lý đa nhân và/hay siêu phân luồng. Windows XP và các ấn bán Home sau này chi hỗ trợ một CPU vật lý, trong khi Windows Professional, Business, Enterprise hay Ultimate hỗ trợ hai CPU vật lý. Mặc dù các ấn bản Home chỉ hỗ trợ một CPU vật Iý, nếu chip này là bộ xử lý đa nhân với công nghệ siêu phân luồng, tất cả nhân vật lý và ảo sẽ được hỗ trợ. Cho ví dụ, nếu một hệ thống với bộ xử lý quad-core hỗ trợ công nghệ siêu phân luồng, các ấn bản Windows Home sẽ thấy nó như tám bộ xử lý và tất cả đều được hỗ trợ. Nếu bo mạch chủ được lắp đặt hai bộ xử lý, các ấn bản Windows Home sẽ thấy tám nhân vật Iý/ảo trên CPU thứ nhất, trong khi Professional, Business, Enterprise hay Ultimate sẽ thấy 16 nhân trên hai CPU.

Các bộ xử lý đa nhân được thiết kế cho người dùng chạy đa chương trình cùng lúc, hay dùng các ứng dụng đa phương. Một ứng dụng đa chuỗi có thể chạy nhiều phần của chương trình, được biết như “threads”, đồng thời trong cùng khoảng địa chỉ, chia sẻ mã và dữ lỉệu. Một chương trình đa phương chạy nhanh hơn trên bộ xử lý nhiều nhân hay bộ xử lý Intel với công nghệ HT hơn là bộ xử lý nhân đơn hay không HT.

Intel sse4.1 intel sse4.2 intel avx2 là gì

Hình 3.3 Minh họa cách bộ xử lý dual-core điều khiển đa ứng dụng cho tốc độ nhanh hơn

Điều quan trọng nên chú ý rằng bộ xử lý đa nhân không cải thiện tốc độ nhiệm vụ đơn nhiều. Nếu bạn chơi trò chơi không hỗ trợ đa luồng (Non—muntithreaded) nên máy tính, rất có vẻ như thấy rất ít thuận lợi của CPU da nhân hay siêu phân luồng. May mắn rất nhiều phần mềm (bao gồm trò chơi) được thiết kế đa luồng, tận dụng lợi thế của bộ xử lý đa nhân bằng cách tách chương trình thành nhiều luồng, mà có thể được phân chia trong số những nhân CPU sẵn có.