Nhưng hãy dừng lại một lát và so sánh, bạn nhận thấy điều gì?
Hãy gác vấn đề hiệu năng E-core vs. P-core qua một bên (chúng ta không nói chuyện đó ở đây), bạn có thấy “phần đất” E-core chiếm dụng là cực kỳ nhỏ (so với P-core)? Và nếu lôi hiệu năng vào, thì rõ ràng lượng IPC mà 4 nhân E-core giải quyết được chắc chắn nhiều hơn chỉ 1 nhân P-core. Có nghĩa nếu lôi “cơm áo gạo tiền” ra đong đếm, 4 nhân E-core vẫn có giá trị thực tế hơn 2 nhân P-core “thật/ảo”. Chi tiết này dẫn tới một thực tế khác – lượng silicon bỏ thêm ra (khoảng 10% theo Intel) để có thêm SMT có thực sự “đáng”? Hay bỏ thêm ít silicon nữa để được 4 nhân E-core thì hơn?
Đấy là một phần lý do Intel tạo ra 2 dòng sản phẩm Xeon khác biệt – Rapids chỉ có P-core cho hiệu năng cao và Forest với toàn E-core tập trung sức mạnh xử lý đa luồng. Nhân thật dù sao vẫn cho hiệu năng hơn nhân ảo.
Điều phối công việc trên kiến trúc Hybrid của Intel có tính phức tạp cao hơn một kiến trúc đơn nhất
Song nói vậy không có nghĩa SMT trở nên thừa thãi. Kiến trúc xử lý hỗn hợp (Hybrid) gồm P-core và E-core trong cùng một con chip có nhược điểm là do 2 loại nhân này khác kiến trúc, một số tính năng P-core có và E-core không có (ví dụ các tập lệnh cao cấp). Đặc trưng này dẫn tới việc khi kernel hệ điều hành gửi công việc cho từng nhân, nó phải nắm rõ nhân nào bị hạn chế tính năng và không bị hạn chế để chia việc cho phù hợp.
Ngoài ra, đôi khi luồng dữ liệu của nhân A được lấy ra từ nhân B/C/D, sự khác biệt về kiến trúc có thể dẫn tới tình trạng trì trệ không đáng có nếu nhân B/C/D không có tập lệnh phù hợp để xử lý dữ liệu nhanh chóng (chúng phải dùng tập lệnh cũ hơn và hiệu quả kém hơn). Ở tình huống này, luồng dữ liệu 1 trên nhân A có thể bị stall để chờ dữ liệu từ B/C/D gửi sang. Nếu không có SMT thì lúc này, nhân A sẽ “ngồi chơi” vì nó không thể xử lý thêm luồng 2 nữa.
Nguồn:Baochinhphu.vn