Nvidia Ada Lovelace và Geforce RTX 40-Series: Mọi thứ chúng ta biết | Phần cứng của Tom s, Asus Geforce RTX 40 Sê -ri Đồ họa

ASUS GEFORCE RTX 40 Sê -ri Đồ họa

Chúng tôi đã có hai năm hạn hán GPU và thẻ quá đắt cho thế hệ trước của NVIDIA. Cuối năm 2022 đánh dấu sự xuất hiện của GPU thế hệ tiếp theo đầu tiên, nhưng tất cả đều rất tốn kém, bắt đầu ở mức tối thiểu $ 800. 2023 trong khi đó đang định hình để trở nên tốt hơn cho những người muốn mua một bản nâng cấp chính thống.

Nvidia Ada Lovelace và Geforce RTX 40-series: Mọi thứ chúng ta biết

Kiến trúc ADA của NVIDIA và card đồ họa GeForce RTX 40-series lần đầu tiên bắt đầu vận chuyển vào ngày 12 tháng 10 năm 2022, bắt đầu với GEFORCE RTX 4090. GeForce RTX 4080 theo sau một tháng sau vào ngày 16 tháng 11 năm 2022, sau đó RTX 4070 Ti (trước đây là RTX 4080 12GB) ra mắt vào ngày 5 tháng 1 năm 2023 và gần đây nhất là RTX 4070 ra mắt vào ngày 13 tháng 4. Đó là hai năm sau Kiến trúc Nvidia Ampere và về cơ bản đúng theo lịch trình được đưa ra làm chậm (hoặc nếu bạn thích, cái chết) của luật của Moore ‘.’Đó cũng là một tin tuyệt vời vì các card đồ họa tốt nhất đang cần một số cuộc thi mới.

Với Nvidia hack Đầu năm 2022, chúng tôi đã có một lượng thông tin tốt về những gì mong đợi. Thẻ hiện đang vận chuyển và NVIDIA đã xác nhận thông số kỹ thuật về nhiều thẻ RTX 40-series. Chúng tôi đã thu thập mọi thứ vào trung tâm này chi tiết mọi thứ chúng tôi biết và mong đợi từ kiến ​​trúc ADA của NVIDIA và gia đình RTX 40-series.

Vẫn còn những tin đồn xoay quanh, chủ yếu liên quan đến các thẻ ADA Lovelace trong tương lai như Titan RTX ADA / RTX 4090 Ti trong tương lai, và các mô hình cấp thấp hơn như RTX 4060-Class và RTX 4050-và những GPU thông báo thấp hơn đã được vận chuyển trong NVIDIA Giải pháp di động RTX 40-series. Nhưng những con số mô hình mặc dù, bây giờ chúng ta có một ý tưởng tốt về những gì chúng ta có thể mong đợi từ kiến ​​trúc ADA Lovelace. Với whitepaper ADA hiện có sẵn cùng với GPU, chúng tôi đã cập nhật thông tin ở đây để trình bày chính xác thế hệ GPU mới cung cấp.

Thẻ salvo đầu tiên của thẻ RTX 40-series máy tính để bàn đã ra mắt. Nếu NVIDIA tuân theo lịch phát hành tương tự như trước đây, chúng ta có thể mong đợi phần còn lại của RTX 40-series sẽ vượt qua trong năm tới. RTX 4060 TI sẽ đến vào tháng 5, với các mẫu RTX 4060 TI 16GB và RTX 4060 thay thế vào tháng 7, và cuối cùng sẽ có (có thể sẽ (có thể?) là một 4050 vào mùa hè này. Hãy bắt đầu với tổng quan cấp cao về thông số kỹ thuật và thông số kỹ thuật được đồn đại cho loạt GPUS ADA.

Thông số kỹ thuật và đầu cơ của GeForce RTX 40-series

Vuốt để cuộn theo chiều ngang

Card đồ họa RTX 4090 TI / Titan? RTX 4090 RTX 4080 RTX 4070 Ti RTX 4070 RTX 4060 Ti RTX 4060 RTX 4050
Ngành kiến ​​​​trúc AD102 AD102 AD103 AD104 AD104 AD106 AD107 AD107
Công nghệ xử ký TSMC 4N TSMC 4N TSMC 4N TSMC 4N TSMC 4N TSMC 4N TSMC 4N TSMC 4N
Transitors (tỷ) 76.3 76.3 45.9 35.số 8 35.số 8 22.9 18.9 18.9
Kích thước chết (mm^2) 608.4 608.4 378.6 294.5 294.5 187.số 8 158.7 158.7
SMS / CUS / XE-CORES 142 128 76 60 46 34 24 18?
Lõi GPU (Shaders) 18176 16384 9728 7680 5888 4352 3072 2304?
Lõi tenor 568 512 304 240 184 136 96 72?
Ray theo dõi “lõi” 142 128 76 60 46 34 24 18?
Boost Clock (MHz) 2625? / 2520? 2520 2505 2610 2475 2535 2460 2500?
Tốc độ VRAM (GBPS) 24? 21 22.4 21 21 18 17 16?
VRAM (GB) 24/48 24 16 12 12 8/16 số 8 số 8?
Chiều rộng xe buýt VRAM 384 384 256 192 192 128 128 128?
Bộ đệm L2 96 72 64 48 36 32 24 24?
ROPS 192 176 112 80 64 48 48 48?
TMU 568 512 304 240 184 136 96 72?
TFLOPS FP32 (Boost) 95.4? / 91.6? 82.6 48.7 40.1 29.1 22.1 15.1 11.5?
TFLOPS FP16 (FP8) 763 (1527) / 733 (1466) 661 (1321) 390 (780) 321 (641) 233 (466) 177 (353) 121 (242) 92 (184)?
Băng thông (GBP) 1152 1008 717 504 504 288 272 256?
TDP (Watts) 600? / 800? 450 320 285 200 160 115 80?
Ngày ra mắt Tháng 4 ~ tháng 6? Tháng 10 năm 2022 Tháng 11 năm 2022 Tháng 1 năm 2023 Tháng Tư năm 2023 Tháng 5/tháng 7 năm 2023? Tháng 7 năm 2023? ~ Tháng 8 năm 2023?
Giá khởi động Nhiều $ 1,599 $ 1,199 $ 899 $ 599 $ 399/$ 499 $ 299 $ 249?

Mọi thứ thẻ ngoại trừ RTX 4050 hiện đã chính thức và thông số kỹ thuật hoàn toàn chính xác. Có những tin đồn cho RTX 4050, nhưng thông số kỹ thuật được phỏng đoán nhiều hơn dựa trên những gì chúng ta biết về RTX 4050 di động và máy tính để bàn RTX 4060. Nói cách khác, áp dụng muối một cách hào phóng trên thông tin RTX 4090 Ti và/hoặc Titan và 4050, vì chúng là suy đoán nhiều hơn bất cứ thứ gì cụ thể. NVIDIA chưa chính thức tiết lộ ngay cả sự tồn tại của các thẻ này và nó sẽ không cho đến khi chúng gần hơn để phát hành.

Cũng có khả năng sẽ có các thẻ bổ sung được công bố trong tương lai, để cập nhật chu kỳ giữa.e. Tương tự như 3080 TI và 3070 Ti, hoặc trước đó các mô hình siêu 2080/2070/2060).

Chắc chắn, có rất nhiều chỗ ở đầu cho một RTX 4090 T trong tương lai. Lưu ý rằng bộ đệm L2 tối đa bị cắt giảm trên 4090 (mười hai khối 6MB thay vì mười hai khối 16MB), ROPS được cắt tỉa một chút và NVIDIA chắc chắn có thể đẩy cao hơn trên đồng hồ và công suất. và giá cả. [Thở dài.] Nhưng trong khi những tin đồn đáng tin cậy về thẻ sáng lập 4 slot đã được lưu hành, hiện tại không có gì chính thức.

Chúng tôi biết rằng Nvidia đang đạt tốc độ đồng hồ là 2.5 trận2.6 GHz trên GPU RTX 40-series cho đến nay và chúng tôi mong đợi đồng hồ tương tự hoặc thậm chí cao hơn trên bất kỳ GPU nào trong tương lai trong đội hình. Tuy nhiên, các thông số kỹ thuật chính thức và đồng hồ trong thế giới thực không giống nhau, vì RTX 4070, ví dụ như liệt kê một chiếc đồng hồ tăng cường 2475 MHz trong khi thử nghiệm phiên bản RTX 4070 của RTX 4070 thường xuyên bị phá vỡ 2700 MHz. NVIDIA cũng đã ép thành công RTX 4090 đến 3.0ghz và hơn thế nữa. Chúng tôi đã đưa vào ước tính tốc độ xung nhịp dự kiến ​​là 2.5 GHz trên GPU 4050 không báo trước.

Sáu (bảy nếu bạn đếm 4060 Ti 16GB là một thẻ riêng biệt) Các mô hình được phát hành/công bố đã sử dụng năm GPU khác nhau, đây là một sự thay đổi từ các lần ra mắt trước đó. RTX 4090 sử dụng việc triển khai AD102 được cắt giảm đáng kể (89% lõi, 75% bộ đệm). Trong khi đó, RTX 4080 sử dụng chip AD103 “gần như hoàn chỉnh” (95% lõi và tất cả bộ đệm), RTX 4070 TI sử dụng chip AD104 được bật hoàn toàn và RTX 4070 sử dụng 77% chip AD104. RTX 4060 TI sử dụng hầu hết AD106 (94%), trong khi RTX 4060 sử dụng toàn bộ chip AD107. Một lần nữa, chúng ta có thể mong đợi các biến thể được thu hoạch hoặc được kích hoạt đầy đủ hơn của mỗi GPU tại một số điểm.

NVIDIA “đã đi lớn” với GPU AD102 và nó có kích thước và số lượng bóng bán dẫn gần hơn với H100 so với GA102 là GA100. Thành thật mà nói, đó là một con quái vật, với hiệu suất và giá cả để phù hợp. Nó đóng gói trong nhiều SMS và các lõi liên quan hơn bất kỳ GPU ampe nào, nó có đồng hồ GPU cao hơn nhiều và nó cũng chứa một số cải tiến kiến ​​trúc để tăng thêm hiệu suất. NVIDIA tuyên bố rằng RTX 4090 nhanh hơn 2x 4X so với RTX 3090 Ti đi, mặc dù các cảnh báo áp dụng cho các điểm chuẩn đó.

Thử nghiệm riêng của chúng tôi đặt hiệu suất ở mức nhanh hơn 60% so với tổng hợp so với thế hệ trước RTX 3090 TI. Đó là ở 4k và tối đa các cài đặt, không có DLSS 2 hoặc DLSS 3. Nhưng như chúng tôi đã lưu ý trong các đánh giá của mình, trong khi thế hệ khung 3 có thể tăng tốc độ khung. Cũng đáng chú ý là nếu bạn hiện đang chạy bộ xử lý khiêm tốn hơn chứ không phải là một trong những CPU tốt nhất tuyệt đối để chơi game, thì bạn rất có thể kết thúc CPU Limited ngay cả tại 1440p Ultra với 4090. Một bản nâng cấp hệ thống lớn hơn có thể sẽ là cần thiết để tận dụng tối đa GPU ADA nhanh nhất.

TSMC 4N: “4NM NVIDIA”

NVIDIA sử dụng quy trình 4N của TSMC – “4NM NVIDIA” – trên tất cả GPU ADA, từ AD102 lớn và Hopper H100 xuống AD107 nhỏ nhất. Nút 4N của TSMC là một biến thể được điều chỉnh và tinh chế trên nút N5 của TSMC được sử dụng rộng rãi trong các chip khác và cũng được sử dụng cho Zen 4 và RDNA của AMD. Chúng tôi không nghĩ rằng Samsung sẽ có một sự thay thế hấp dẫn mà không yêu cầu thiết kế lại kiến ​​trúc cốt lõi, vì vậy cả gia đình sẽ ở cùng một nút.

TSMC N4 cung cấp một số cải tiến lớn so với Samsung 8N (“8NM NVIDIA”) được sử dụng trên ampe. Cụ thể, nó có các tính năng nhỏ hơn nhiều, có nghĩa là NVIDIA có thể đóng gói nhiều bóng bán dẫn hơn trong một khu vực tương tự hoặc nhỏ hơn. Ví dụ, AD102 có 76.3 tỷ bóng bán dẫn trong kích thước chết 608mm^2, hoặc trung bình khoảng 125 triệu bóng bán dẫn trên mỗi milimet vuông (Mtrans/mm^2). AD103/106/107 cung cấp mật độ 119 ~ 121 tương tự, trong khi AD104 là chip dày đặc nhất với “chỉ” 109 mtrans/mm^2. GPU AMPERE GA102/104/106 bằng cách so sánh được đóng gói khoảng 43 ~ 45 mtrans/mm^2.

Nút quy trình N4 cũng cho phép sử dụng năng lượng thấp hơn và hiệu quả cải thiện. Có, RTX 4090 có ngân sách lớn 450W TGP (tổng công suất đồ họa). Các trò chơi đòi hỏi nhất có thể kéo 450W, trong khi những trò chơi khác chỉ cần khoảng 300 ~ 325 watts. Và đó là ví dụ tồi tệ nhất từ ​​ADA; RTX 4080, 4070 TI và 4070 đều đứng đầu số liệu hiệu quả của chúng tôi, về FPS trên mỗi watt.

Cuối cùng, như đã lưu ý ở trên, tốc độ đồng hồ cao hơn nhiều với ADA so với ampe. Đồng hồ chính thức đã tăng từ 1.665 Mạnh1,860 MHz với ampe (tùy thuộc vào mô hình), đến phạm vi 2.475 Nott2,610 MHz với ADA. Đó là trung bình đồng hồ cao hơn từ 40 đến 50 phần trăm, mặc dù đồng hồ trong thế giới thực cho cả Ampere và ADA có xu hướng cao hơn khoảng 200 MHz so với đồng hồ tăng cường chính thức.

ADA ồ ạt tăng hiệu suất tính toán

Với tổng quan cấp cao, chúng ta hãy tham gia vào các chi tiết cụ thể. Sự thay đổi đáng chú ý nhất với GPU ADA sẽ là số lượng SMS so với thế hệ ampe hiện tại. Ở trên cùng, AD102 có khả năng đóng gói nhiều SMS hơn 71% so với GA102. Ngay cả khi không có gì khác thay đổi đáng kể trong kiến ​​trúc, chúng tôi vẫn hy vọng rằng sẽ mang lại sự gia tăng lớn về hiệu suất.

Điều đó sẽ không chỉ áp dụng cho đồ họa mà còn cho các yếu tố khác. Hầu hết các tính toán không thay đổi so với ampe, mặc dù các lõi tenor hiện hỗ trợ fp8 (có độ thưa) để tăng gấp đôi hiệu suất FP16. Mỗi lõi tenor thế hệ thứ 4 có thể thực hiện 256 tính toán fp16 cho mỗi đồng hồ, tăng gấp đôi với độ thưa và gấp đôi một lần nữa với FP8 và độ thưa. RTX 4090 có học tập sâu/AI lý thuyết lên tới 661 teraflops trong FP16 và 1.321 teraflops của FP8 – và chip AD102 được kích hoạt hoàn toàn có thể đạt 1.4 petaflops ở đồng hồ tương tự.

GA102 đầy đủ trong RTX 3090 TI bằng cách so sánh đầu vào khoảng 321 TFLOPS FP16 (một lần nữa, sử dụng tính năng thưa thớt của Nvidia). Điều đó có nghĩa là RTX 4090 mang lại mức tăng 107% lý thuyết, dựa trên số lượng lõi và tốc độ đồng hồ. Cùng một sự tăng cường lý thuyết trong hiệu suất cũng áp dụng cho phần cứng theo dõi shader và tia, ngoại trừ những thứ cũng đang thay đổi.

Các lõi của GPU Shader sẽ có tính năng thực thi Shader mới (SER) mà NVIDIA tuyên bố sẽ cải thiện hiệu suất chung lên 25%và có thể cải thiện các hoạt động theo dõi tia lên tới 200%. Thật không may, hỗ trợ cho SER sẽ yêu cầu các nhà phát triển sử dụng các phần mở rộng NVIDIA độc quyền, vì vậy các trò chơi hiện tại sẽ không nhất thiết phải có lợi.

Các lõi RT trong khi đó đã tăng gấp đôi phần cứng giao lộ Ray/Tam giác (hoặc ít nhất là thông lượng trên mỗi lõi), cộng với chúng có thêm một vài thủ thuật mới. Động cơ Micro-Map (OMM) Opacity cho phép truy tìm tia nhanh hơn đáng kể cho các bề mặt trong suốt như tán lá, hạt và hàng rào. Mặt khác, công cụ lưới micro (DMM) bị dịch chuyển tối ưu hóa cấu trúc phân cấp âm lượng giới hạn (BVH) và NVIDIA tuyên bố nó có thể tạo BVH nhanh hơn tới 10 lần trong khi sử dụng bộ nhớ ít hơn 20 lần (5%) cho bộ nhớ BVH. Một lần nữa, những điều này yêu cầu các nhà phát triển sử dụng các tính năng mới, vì vậy các trò chơi theo dõi tia hiện có sẽ không có lợi nếu không có bản vá.

Cùng nhau, những cải tiến kiến ​​trúc này sẽ cho phép ADA Lovelace GPU cung cấp một bước nhảy vọt lớn về hiệu suất. Ngoại trừ nó sẽ tùy thuộc vào các nhà phát triển để cho phép hầu hết trong số họ, vì vậy sự hấp thu có thể bị giảm.

Ada Lovelace ROPS

Số lượng ROP của ADA đang tăng lên khá nhiều trong một số trường hợp, đặc biệt là mô hình hàng đầu (hiện tại) RTX 4090. Như với ampe, nvidia gắn các ROPS vào GPC, các cụm xử lý đồ họa, nhưng một số trong số này vẫn có thể bị vô hiệu hóa. Mỗi GPC thường nhận được 16 ROPS.

AD102 có tối đa 144 sms với 12 gpcs 12 sms mỗi. Mang lại 192 ROPS là tối đa, mặc dù số cuối cùng trên RTX 4090 là 11 GPC và 176 ROPS. RTX 4080 GAS Seven GPC, giống như GA102, mặc dù trong một sự thay đổi kỳ lạ về tốc độ, nó xuất hiện một trong các cụm GPC chỉ có 8 SMS trong khi sáu người còn lại có tối đa 12 SMS. Bất kể, tất cả bảy được kích hoạt trên RTX 4080 và nó có 112 ROPS. AD104 trong RTX 4070 Ti và 4070 sử dụng năm GPC của 12 SMS, với 80 ROPS.

Hiện tại, các thẻ còn lại nên được coi là một dự đoán tốt nhất. Chúng tôi không biết chắc chắn GPU sẽ được sử dụng gì hoặc có bao nhiêu GPC sẽ hoạt động. Chúng tôi sẽ điền vào chỗ trống khi có thêm thông tin trong những tháng tới, một khi GPU ADA khác đã ra mắt.

Hệ thống con bộ nhớ: GDDR6X cưỡi lại

Năm ngoái, Micron tuyên bố có các lộ trình cho Bộ nhớ gddr6x chạy ở tốc độ lên tới 24Gbps. RTX 3090 TI mới nhất chỉ sử dụng bộ nhớ 21Gbps và NVIDIA hiện là công ty duy nhất sử dụng GDDR6X cho bất cứ điều gì. Điều đó ngay lập tức đặt ra câu hỏi về những gì sẽ sử dụng 24Gbps GDDR6X và câu trả lời hợp lý duy nhất dường như là NVIDIA ADA. GPU cấp thấp hơn có nhiều khả năng gắn bó với GDDR6 tiêu chuẩn hơn là GDDR6X, điều này đã tăng ở mức 20Gbps và được sử dụng trong thẻ RX 7900 XTX/XT của AMD của AMD.

Chính thức, RTX 4090, 4070 TI và 4070 đều sử dụng chip 2GB được đánh giá cho 21Gbps. RTX 4080 là ngoại lệ, có các chip 2GB được đánh giá cho 22.4Gbps. Ngoại trừ, micron không tạo ra 22.Chip 4Gbps, vì vậy chúng thực sự là 24Gbps chip được đồng hồ bảo thủ hơn. Về mặt giai thoại, trong việc tháo gỡ nhiều GPU RTX 40-series của chúng tôi, chúng tôi nhận thấy rằng một số thẻ “21Gbps” có bộ nhớ chạy mát hơn và ép xung tốt hơn, đạt tới 25Gbps. Chúng tôi cho rằng Micron chỉ đang giảm một số chip và mang lại bộ nhớ 24Gbps bây giờ khá tốt.

Có cùng băng thông cực đại như RTX 3090 TI thể hiện một chút vấn đề, vì GPU thường cần tính toán và băng thông để mở rộng theo tỷ lệ để nhận ra số lượng hiệu suất được hứa hẹn. Ví dụ, RTX 3090 Ti có tính toán nhiều hơn 12% so với 3090 và bộ nhớ đồng hồ cao hơn cung cấp băng thông cao hơn 8%. Dựa trên các chi tiết tính toán được hiển thị ở trên, có một sự ngắt kết nối lớn. RTX 4090 có tính toán gấp đôi so với RTX 3090 Ti, nhưng nó cung cấp cùng 1008 GB/s của băng thông – 24Gbps cho RTX 4090 Ti cuối cùng, bất kỳ ai?

Có nhiều chỗ hơn để băng thông phát triển trên GPU cấp thấp hơn, giả sử mức tiêu thụ năng lượng GDDR6X có thể được kiểm soát trong kiểm tra. Tất cả RTX 3050 đến RTX 3070 hiện tại đều sử dụng bộ nhớ GDDR6 tiêu chuẩn, có tốc độ 14. Chúng ta đã biết GDDR6 chạy ở tốc độ 20Gbps có sẵn, vì vậy RTX 4050 giả thuyết với GDDR6 18Gbps phải dễ dàng theo kịp sự gia tăng sức mạnh tính toán GPU GPU. Nếu NVIDIA vẫn cần nhiều băng thông hơn, nó cũng có thể nhấn GDDR6X cho GPU cấp thấp hơn.

Điều hấp dẫn là nvidia không nhu cầu Sự gia tăng lớn trong băng thông bộ nhớ thuần túy, bởi vì thay vào đó nó đã làm lại kiến ​​trúc, tương tự như những gì chúng ta đã thấy AMD làm với rDNA 2 so với kiến ​​trúc rDNA ban đầu. Cụ thể, nó sẽ đóng gói trong bộ nhớ cache L2 hơn rất nhiều để giảm bớt các yêu cầu trên hệ thống con bộ nhớ.

Ada rút tiền trên bộ nhớ cache L2

Một cách tuyệt vời để giảm nhu cầu về băng thông bộ nhớ thô hơn là điều đã được biết đến và sử dụng trong nhiều thập kỷ. Tát nhiều bộ nhớ cache hơn trên chip và bạn nhận được nhiều lần truy cập bộ nhớ cache hơn và mỗi lần truy cập bộ nhớ cache có nghĩa là GPU không cần phải lấy dữ liệu từ bộ nhớ GDDR6/GDDR6X. Bộ đệm lớn có thể đặc biệt hữu ích cho hiệu suất chơi game. Bộ đệm vô cực của AMD cho phép các chip RDNA 2 về cơ bản làm nhiều hơn với băng thông thô hơn và NVIDIA ADA L2 Cache cho thấy Nvidia đã thực hiện một cách tiếp cận tương tự.

AMD sử dụng bộ đệm L3 khổng lồ lên tới 128MB trên GPU Navi 21, với 96MB trên Navi 22, 32MB trên Navi 23 và chỉ 16MB trên Navi 24. AMD cũng có bộ đệm L3 96MB trên Navi 31 mới. Đáng ngạc nhiên, ngay cả bộ nhớ cache 16MB nhỏ hơn cũng kỳ diệu cho hệ thống con bộ nhớ. Chúng tôi không nghĩ Radeon RX 6500 XT tổng thể là một thẻ tuyệt vời, nhưng về cơ bản nó theo kịp với các thẻ có gần gấp đôi băng thông bộ nhớ.

Kiến trúc ADA kết hợp bộ đệm 8MB L2 với mỗi bộ điều khiển bộ nhớ 32 bit hoặc 16MB trên bộ điều khiển 64 bit. Điều đó có nghĩa là các thẻ có giao diện bộ nhớ 128 bit sẽ nhận được 32MB tổng số bộ đệm L2 và giao diện 384 bit trên AD102 có tới 96MB bộ đệm L2. Ngoại trừ, một phần của các khối bộ đệm L2 cũng có thể bị tắt.

Mặc dù ít hơn bộ đệm vô cực của AMD 2 của AMD trong nhiều trường hợp, AMD cũng giảm xuống còn 96MB Cache tổng số L3 cho RX 7900 XTX hàng đầu của nó. Chúng tôi cũng không biết độ trễ hoặc các khía cạnh khác của thiết kế. Bộ đệm L2 có xu hướng có độ trễ thấp hơn so với L3 Cache, do đó L2 nhỏ hơn một chút chắc chắn có thể theo kịp bộ đệm L3 lớn hơn nhưng chậm hơn và như chúng ta đã thấy với GPU RDNA 2, thậm chí là bộ đệm vô cực 16MB hoặc 32MB đã giúp.

Nếu chúng ta xem ví dụ: RX 6700 XT của AMD. Nó có tính toán nhiều hơn khoảng 35% so với thế hệ RX 5700 XT trước đó. Hiệu suất trong của chúng tôi Điểm chuẩn GPU phân cấp Trong khi đó cao hơn khoảng 32% ở mức 1440p Ultra, do đó, hiệu suất tổng thể được tỷ lệ khá phù hợp với tính toán. Ngoại trừ, 6700 XT có giao diện 192 bit và chỉ 384 GB/s. Điều đó có nghĩa là bộ đệm vô cực lớn đã cho AMD tăng ít nhất 50% cho băng thông hiệu quả.

Nói chung, có vẻ như NVIDIA có kết quả tương tự với ADA và ngay cả khi không có giao diện bộ nhớ rộng hơn, GPU ADA vẫn nên có nhiều băng thông hiệu quả. Cũng đáng nói rằng các kỹ thuật nén bộ nhớ của Nvidia trong các kiến ​​trúc trong quá khứ đã được chứng minh có khả năng, vì vậy bộ nhớ cache nhỏ hơn một chút so với AMD có thể không quan trọng chút nào.

RTX 40-series được DLSS 3

Một trong những thông báo lớn với RTX 40-series và ADA Lovelace là DLSS 3, sẽ chỉ một Làm việc với card đồ họa RTX 40-series. Trong đó DLSS 1 và DLSS 2 hoạt động trên cả thẻ RTX 20 và 30-series và cũng sẽ hoạt động trên ADA GPU, DLSS 3 thay đổi cơ bản một số thứ trong thuật toán và dường như yêu cầu cập nhật kiến ​​trúc mới mới.

Các đầu vào cho thuật toán DLSS 3 hầu như giống như trước đây, nhưng bây giờ có một bộ tăng tốc dòng quang được cập nhật (OFA) mất hai khung trước và tạo thêm các vectơ chuyển động mà có thể cung cấp. Kết hợp với nâng cấp chế độ hiệu suất DLSS, tạo khung có nghĩa là GPU có khả năng chỉ phải thực sự hiển thị 1/8 pixel được gửi đến màn hình.

Ngẫu nhiên, OFA là không Mới với ADA. Turing và ampere cũng có một chức năng cố định của khối, chỉ có nó không hoạt động hoặc có khả năng. Các trường hợp sử dụng điển hình cho OFA trong quá khứ bao gồm giảm độ trễ trong thực tế tăng cường và ảo, cải thiện độ mịn của phát lại video, tăng cường hiệu quả nén video và cho phép ổn định camera video. Nó cũng được sử dụng với điều hướng ô tô và robot, và phân tích và hiểu video.

Thế hệ ampe đã nâng cấp OFA lên đơn vị chức năng cố định 126 teraops (INT8) và hiện ADA đã tăng tới 305 Teraops. Hiệu suất được thêm vào và các cải tiến khác cho phép nó được sử dụng để tạo trường dòng quang mà một phần của tạo khung DLSS 3. Mặc dù hiệu suất và khả năng cao hơn của ADA OFA hiện đang được yêu cầu cho DLSS 3, nhưng có một chút phòng ngọ nguậy. NVIDIA Lừa Bryan Catanzaro, VP của nghiên cứu học tập sâu Ứng dụng, đã tweet rằng đó là về mặt lý thuyết có thể đối với DLSS 3 để cuối cùng làm việc trên GPUS. Tuy nhiên, nó có thể sẽ chạy ở mức chất lượng và hiệu suất thấp hơn và nó có thể không bao giờ thực sự xảy ra.

Bây giờ chúng tôi đã có cơ hội để xem DLSS 3 trông như thế nào và cảm thấy trong hành động. Nó không hoàn toàn tuyệt vời như tuyên bố của Nvidia. Vì không có đầu vào người dùng bổ sung được tính vào các khung được tính toán, cộng với hai khung độ trễ (liên quan đến tốc độ khung hình được tạo), DLSS 3 có thể trông đẹp hơn cảm giác. Lấy một trò chơi như Một câu chuyện bệnh dịch: Requiem Chạy ở tốc độ 100 khung hình / giây với DLSS 2, và việc tạo khung có thể tăng lên 140 FPS150 FPS. Nhưng nó cảm thấy giống như có thể là 110 FP120 FPS tốt nhất, theo ý kiến ​​của chúng tôi. Ở các khung hình trước khung thấp hơn, như nói 30 khung hình / giây, bạn có thể nhận được hiệu suất gấp đôi lên 60 khung hình / giây, nhưng nó vẫn sẽ cảm thấy như 30 khung hình / giây.

DLSS 3 hiện yêu cầu thẻ RTX 40-series để chạy, ít nhất là với bật khung. Đó sẽ là một cài đặt bổ sung Người dùng có thể chọn để bật; Không có điều đó, DLSS 3 vẫn hỗ trợ thuật toán nâng cấp Core DLSS 2 và cũng yêu cầu các nhà phát triển sử dụng NVIDIA Reflex, vì vậy các nhà phát triển đã chọn cho DLSS 3 hỗ trợ RTX 40-series cũng như thẻ RTX Series trước đây.

Ada được mã hóa AV1, lần hai

GeForce RTX 4090, 4080 và 4070 TI của NVIDIA. Đối với các mô hình RTX 4070 và thấp hơn, chỉ có một đơn vị NVENC. Chúng cũng sẽ có hỗ trợ cho mã hóa AV1, tương tự như Intel Arc – ngoại trừ có hai thay vì chỉ một. Gần đây chúng tôi đã tiến hành thử nghiệm chuyên sâu về hiệu suất và chất lượng mã hóa video, so sánh GPU mới nhất với các thế hệ trước.

Mã hóa AV1 cải thiện hiệu quả 40% theo NVIDIA, nhưng điều đó dường như được so sánh với H.264 (nó chủ yếu tương tự về bitrates và hiệu quả với HEVC/H.265). Điều đó có nghĩa là bất kỳ livestream nào hỗ trợ codec sẽ trông như thể chúng có tỷ lệ bit cao hơn 40% so với h hiện tại.264 luồng. Tất nhiên, dịch vụ phát trực tuyến sẽ cần hỗ trợ AV1 cho vấn đề này.

Hai bộ mã hóa có thể phân chia công việc giữa chúng, do đó, hiệu suất mã hóa có khả năng tăng gấp đôi cho bất kỳ khối lượng công việc nào, ngay cả khi GPU chỉ mã hóa một luồng duy nhất. Hoặc ít nhất đó là lý thuyết; Trong thực tế, chúng tôi đã không thấy bất kỳ thay đổi lớn nào khi sử dụng FFMPEG so với tốc độ NVENC trước đó. Các biên tập viên video có thể được hưởng lợi từ việc tăng hiệu suất và NVIDIA đã làm việc với Davinci Resolve, Handbrake, Voukoder và Jianying để hỗ trợ.

Trải nghiệm GeForce và Shadowplay cũng sẽ sử dụng phần cứng mới, cho phép các game thủ bắt kịp trò chơi ở mức tối đa 8k và 60 khung hình / giây trong HDR. Hoàn hảo cho 0.01% những người có thể xem nội dung 8K bản địa! (Nếu bạn xây dựng nó, họ sẽ đến. ) Ngoài ra, các đơn vị NVENC vẫn có thể xử lý h.264, HEVC và các định dạng khác tốt.

Tiêu thụ năng lượng ADA

Các báo cáo ban đầu của 600W và cao hơn TBPS (tổng công suất bảng) cho ADA dường như không có cơ sở, ít nhất là trên các mô hình sáng lập được công bố. Trên thực tế, sau khi thử nghiệm sáu thẻ RTX 4090 khác nhau, ngay cả với việc ép xung thủ công, chúng tôi đã không liên tục phá vỡ 600W. RTX 4090 có cùng 450W TGP như RTX 3090 Ti đi, trong khi RTX 4080 giảm xuống chỉ còn 320W, RTX 4070 TI có TGP 285W và RTX 4070 ở 200W ở 200W. Đó là cho thẩm quyền giải quyết Mô hình phiên bản sáng lập, tuy nhiên.

Như chúng ta đã thấy với RTX 3090 TI và các GPU AMPERE khác, một số đối tác AIB (BOOK-IN BOOK) rất hạnh phúc khi có sức mạnh sức mạnh cao hơn đáng kể để theo đuổi mỗi ounce cuối cùng của hiệu suất cuối cùng. Thẻ tùy chỉnh RTX 4090 rút tới 600W chắc chắn không phải là câu hỏi và một RTX 4090 T trong tương lai có thể đẩy nó cao hơn nữa.

Tất cả trở lại đến cuối Dennard Scaling, ngay với cái chết của luật Moore. Nói một cách đơn giản, tỷ lệ Dennard – còn được gọi là tỷ lệ MOSFET – quan sát thấy rằng với mọi thế hệ, kích thước có thể được thu nhỏ lại khoảng 30%. Giảm 50% diện tích tổng thể (tỷ lệ theo cả chiều dài và chiều rộng), điện áp giảm 30% và độ trễ mạch cũng sẽ giảm 30%. Hơn nữa, tần số sẽ tăng khoảng 40% và tổng mức tiêu thụ điện năng sẽ giảm 50%.

Nếu tất cả điều đó nghe có vẻ quá tốt, thì đó là vì Dennard mở rộng hiệu quả vào khoảng năm 2007. Giống như luật của Moore, nó không hoàn toàn thất bại, nhưng lợi nhuận trở nên ít được phát âm hơn. Tốc độ đồng hồ trong các mạch tích hợp chỉ tăng từ tối đa khoảng 3.7GHz vào năm 2004 với phiên bản Pentium 4 Extreme đến tối đa 5 ngày nay là 5.5GHz trong lõi i9-12900ks. Điều đó vẫn tăng gần 50% tần số, nhưng nó đã kết thúc Sáu thế hệ (hoặc nhiều hơn, tùy thuộc vào cách bạn muốn đếm) của các cải tiến nút quy trình. Nói cách khác, nếu Dennard Scaling không chết, CPU hiện đại sẽ đồng hồ lên tới 28GHz. RIP, Dennard Scale, bạn sẽ bị bỏ lỡ.

Nó không chỉ là tỷ lệ tần số đã chết, mà còn là quy mô điện áp và điện áp. Ngày nay, một nút quy trình mới có thể cải thiện mật độ bóng bán dẫn, nhưng điện áp và tần số cần được cân bằng. Nếu bạn muốn một con chip nhanh gấp đôi, bạn có thể cần sử dụng năng lượng gần gấp đôi. Ngoài ra, bạn có thể xây dựng một con chip hiệu quả hơn, nhưng nó sẽ không nhanh hơn. NVIDIA dường như đang đi sau hiệu suất nhiều hơn với ADA, mặc dù nó chưa hoàn toàn đưa ra những lo ngại về hiệu quả ra ngoài cửa sổ.

Chỉ cần xem RTX 4070 Ti làm ví dụ. Thử nghiệm của chúng tôi cho thấy rằng nó gần với hiệu suất của RTX 3090 TI thế hệ trước, trong khi thu được năng lượng ít hơn 37%. Trong một số trường hợp, như với khối lượng công việc RT DLSS 3 và RT nặng, nó thậm chí có thể tăng gấp đôi hiệu suất trong khi vẫn sử dụng ít năng lượng hơn. RTX 4070 trong khi đó là GPU hiệu quả nhất mà chúng tôi đã thử nghiệm cho đến nay.

Giá RTX 40-series

GPU RTX 40-series sẽ có giá bao nhiêu? Câu trả lời ngắn gọn và ĐÚNG VẬY Trả lời, là họ sẽ có giá cao như NVIDIA và các nhà bán lẻ có thể thoát khỏi việc tính phí. NVIDIA đã ra mắt ampe với một bộ mô hình tài chính và những người được chứng minh là hoàn toàn sai đối với thời đại đại dịch Covid. Giá cả trong thế giới thực tăng lên và người da đầu bị lợi, và đó là trước Công ty khai thác tiền điện tử bắt đầu trả hai đến ba lần so với giá khuyến nghị chính thức.

Tin tốt là Giá GPU đã đi xuống, và khai thác Ethereum đã kết thúc. Điều đó đến lượt nó đã hoàn toàn giết chết lợi nhuận GPU để khai thác, với hầu hết các thẻ hiện có giá cao hơn để chạy hơn so với họ có thể tạo ra nỗ lực. Thật tuyệt khi nghe, nhưng nó vẫn không đảm bảo giá cả hợp lý.

Bạn sẽ làm gì khi có một loạt các thẻ hiện có để bán? Bạn làm cho các thẻ mới có giá cao hơn. Chúng ta thấy rằng với giá khởi động trên các mẫu RTX 4090, 4080, 4070 TI và 4070. 4090 là $ 1,599, nhiều hơn 100 đô la so với giá ra mắt 3090 và ngoài tầm với của hầu hết các game thủ. RTX 4080 không tốt hơn nhiều ở mức 1.199 đô la và RTX 4070 TI có giá 799 đô la, nhiều hơn 100 đô la so với RTX 3080 10GB ra mắt MSRP và nhiều hơn 200 đô la so với RTX 3070 TI đi ra – và đến cuối năm 2022 mà chúng tôi thậm chí đã thấy Thẻ 30-series được bán tại bán lẻ gần với MSRP của họ!

Có vẻ như NVIDIA đã xoay sở để xóa đủ hàng tồn kho RTX 30-series hiện có và thẻ RTX 40-series đang duy trì giá cao của họ. Hầu hết hiện có sẵn bắt đầu từ MSRP, hoặc ít nhất là gần với nó, mặc dù RTX 4090 vẫn có thể chỉ huy một phí bảo hiểm. Đó có thể là vì nó cũng được chọn cho công việc chuyên nghiệp, bao gồm AI và nghiên cứu học tập sâu. RTX 4060 TI và 4060 mới ít nhất đang đưa ADA xuống mức giá tương tự như người tiền nhiệm của họ.

Nhìn chung, giá GPU thế hệ đã tăng lên với ADA và RTX 40-series (4060-series là ngoại lệ). NVIDIA cũng phải cạnh tranh với AMD và GPU Radeon RX 7000 và RDNA 3, nhưng đó cũng rất đắt. NVIDIA đã chậm hơn khi đẩy các GPU bổ sung như RTX 4070 trở xuống, mặc dù dòng chính 4060 Ti trở lên đã trở lại tương đương với giá với người tiền nhiệm của họ. Hy vọng rằng các mô hình trong tương lai (đặc biệt là RTX 4050) sẽ tiếp tục xu hướng đi xuống và đạt được mức chi phí hợp lý hơn mà không có hiệu suất hoàn toàn.

Thay đổi thiết kế phiên bản người sáng lập

NVIDIA đã đưa ra rất nhiều tuyên bố về thiết kế thẻ Phiên bản Người sáng lập mới của mình khi ra mắt RTX 3080 và 3090. Mặc dù các thẻ thường hoạt động tốt, nhưng những gì chúng tôi đã phát hiện ra trong hai năm qua là các thẻ làm mát trục truyền thống từ các đối tác AIC của bên thứ ba có xu hướng làm mát tốt hơn và chạy yên tĩnh hơn, ngay cả khi sử dụng nhiều năng lượng hơn. Các Geforce RTX 3080 TI sáng lập phiên bản là một ví dụ đặc biệt nghiêm trọng về cách nhiệt độ và tốc độ quạt không thể theo kịp với GPU chạy nóng hơn.

Thủ phạm chính dường như là bộ nhớ gddr6x và nvidia sẽ không đóng gói hơn Gddr6x vào ADA so với trong ampe, ít nhất là về tổng số chip. Tuy nhiên, NVIDIA lưu ý rằng họ đã làm việc với Micron (nhà sản xuất độc quyền của GDDR6X) để giảm mức tiêu thụ điện từ các chip thế hệ mới nhất. Điều đó chắc chắn sẽ giúp ích cho vấn đề, và trong khi micron tạo ra 24Gbps gddr6x, cho đến nay NVIDIA không cao như vậy trên đồng hồ bộ nhớ.

RTX 4090 sẽ có mười hai chip 2GB, giống như 3090 Ti, trong khi 4080 cắt giảm xuống tám chip và 4070 TI chỉ phải làm mát sáu chip. Với một quá trình thu nhỏ từ micron trên chip gddr6x, cộng với các miếng đệm nhiệt tốt hơn, chúng tôi nhận được thẻ RTX 40-series thường không chạy gần như nóng như các mẫu trước đó. NVIDIA cũng giảm độ dày miếng nhiệt với RTX 40-series để hỗ trợ truyền nhiệt tốt hơn từ bộ nhớ sang tản nhiệt.

Thật thú vị khi lưu ý rằng trong số sáu thẻ RTX 4090 mà chúng tôi đã thử nghiệm, khoảng một nửa đi kèm với một lớp bộ nhớ GDDR6X khác. Những thẻ này có xu hướng hiển thị nhiệt độ VRAM đạt đỉnh ở mức 65 độ70 độ C. Giả định của chúng tôi là các thẻ nhiệt độ thấp hơn thực sự đang sử dụng các chip 24Gbps của Micron với nút quy trình được cải thiện, chỉ được đánh dấu và bán là 21Gbps. RTX 4080 cho đến nay là thẻ duy nhất yêu cầu chip nhanh hơn và các thẻ đó Mà còn có xu hướng đánh

Đối với các thiết kế thẻ, ngay cả RTX 4080 cũng tham gia vào hành động ba trận đấu này, đó là một sự thay đổi thú vị về tốc độ. Đó là ‘chỉ’ một TBP 320W, nhưng sau đó là 3080 Fe và 3080 ti Fe luôn chạy nhiều hơn một chút. TBP 285W trên 4070 TI có thể được điều trị hai trận từ một số đối tác AIB, nhưng NVIDIA sẽ không tạo ra phiên bản 4070 TI Founders-GPU đặc biệt đó sẽ chỉ đến từ thẻ của bên thứ ba. RTX 4070 có phiên bản sáng lập và RTX 4060 TI 8GB cũng sẽ có phiên bản sáng lập. RTX 4060 TI 16GB và RTX 4060 sẽ chỉ được cung cấp dưới dạng thẻ tùy chỉnh từ AIB Partners của NVIDIA.

Ngày phát hành GPU ADA

Bây giờ, các lần ra mắt lớn và ban đầu đã kết thúc, chúng tôi biết rằng RTX 4090 đã đến vào ngày 12 tháng 10, RTX 4080 ra mắt vào ngày 16 tháng 11 và RTX 4070 TI đã đến vào ngày 5 tháng 1 (sau khi đổi tên từ RTX 4080 12GB và giảm MSRP $ 100). RTX 4070 đã hạ cánh vào ngày 13 tháng 4 và RTX 4060 TI 8GB sẽ ra mắt vào ngày 24 tháng 5. Chúng tôi biết RTX 4060 TI 16GB và RTX 4060 sẽ đến vào tháng 7, nhưng chúng tôi chưa có ngày chính xác. RTX 4050 cho máy tính để bàn có thể đầu cơ vào tháng 8. Cũng có thể có những card đồ họa ADA khác.

NVIDIA đã ra mắt RTX 3080 và RTX 3090 vào tháng 9 năm 2020, RTX 3070 đã đến một tháng sau đó, sau đó RTX 3060 TI đã đến chỉ hơn một tháng sau đó. RTX 3060 đã không ra mắt cho đến cuối tháng 2 năm 2021, sau đó NVIDIA đã làm mới loạt phim với RTX 3080 TI và RTX 3070 TI vào tháng 6 năm 2021. RTX 3050 thân thiện với ngân sách đã không đến cho đến tháng 1 năm 2022 và cuối cùng là RTX 3090 TI ra mắt vào cuối tháng 3 năm 2022.

NVIDIA đã chọn ra một lần ra mắt so le cho các thẻ ADA, đã trì hoãn một chút trên một số mô hình để cho phép tình huống vượt trội mà Nvidia phải đối mặt trên các bộ phận RTX 30-series vào năm 2022 để điều chỉnh. Bây giờ đã kết thúc và được thực hiện theo như chúng ta có thể nói, và chúng tôi chỉ đang chờ các mô hình cuối cùng xuất hiện.

Chúng tôi vẫn cần các dịch vụ ngân sách thực sự để tiếp quản GTX 16-series. Chúng ta có thể nhận được một loạt GTX mới hoặc thẻ RTX ngân sách thực sự với giá dưới 200 đô la? Điều đó là có thể, nhưng không tin tưởng vào nó, vì Nvidia dường như có nội dung để AMD và Intel chiến đấu với nó trong phạm vi dưới 200 đô la. Tốt nhất, RTX 3050 có thể giảm xuống còn 200 đô la trong những tháng tới, nhưng chúng tôi sẽ không ngạc nhiên khi thấy Nvidia hoàn toàn từ bỏ thị trường đồ họa dưới 200 đô la. Chúng tôi nghi ngờ RTX 4050, bất cứ khi nào nếu đến, sẽ đảm nhận mức giá $ 250.

Thường có một GPU mới khoảng một năm sau khi ra mắt ban đầu và chúng tôi đang tiến gần đến điểm đó bây giờ. Cho dù những người cuối cùng là mô hình “TI” hay các mô hình “siêu” hay thứ gì khác là bất cứ ai đoán được, nhưng bạn có thể đánh dấu nó trên lịch của mình. GeForce RTX 40-series làm mới, đến vào mùa thu năm 2023.

Cạnh tranh trong không gian GPU

Nvidia đã là người chơi thống trị trong không gian card đồ họa trong một vài thập kỷ nay. Nó kiểm soát khoảng 80% tổng thị trường GPU và 90% trở lên thị trường chuyên nghiệp, điều này phần lớn cho phép nó ra lệnh cho việc tạo ra và áp dụng các công nghệ mới như Ray Truy tìm và DLSS. Tuy nhiên, với sự gia tăng liên tục về tầm quan trọng của AI và tính toán cho nghiên cứu khoa học và khối lượng công việc tính toán khác, và sự phụ thuộc của họ vào các bộ xử lý giống như GPU, nhiều công ty khác đang tìm cách đột nhập vào ngành.

Intel đã không thực hiện một nỗ lực thích hợp tại một card đồ họa chuyên dụng kể từ cuối những năm 90, trừ khi bạn đếm Larrabee bị bỏ hoang. Lần này, nhà giả kim intel arc dường như là thỏa thuận thực sự – hoặc ít nhất là bàn chân trong cửa. Intel cung cấp khả năng truyền thông tốt và hiệu suất tính toán trò chơi và tính toán chung của ARC là tốt, nhưng chắc chắn chúng không đủ để cạnh tranh với thẻ AMD và NVIDIA cao cấp. Thay vào đó, Intel đang đi theo lĩnh vực ngân sách chính thống. Bây giờ.

Nhưng nhà giả kim ARC chỉ là người đầu tiên trong một nhịp điệu thường xuyên của các kiến ​​trúc GPU mà Intel đã lên kế hoạch. Battlemage có thể dễ dàng tăng gấp đôi khả năng của nhà giả kim và nếu Intel có thể thoát khỏi điều đó sớm hơn sau này, nó có thể bắt đầu ăn vào thị phần của Nvidia, đặc biệt là trong không gian máy tính xách tay chơi game. JPR cho thấy ARC đạt được 6% thị trường bán hàng toàn cầu vào cuối năm 2023, nhưng giá giảm cho thấy việc bán hết cho ARC không cao.

AMD cũng sẽ không đứng yên, và nó đã ra mắt thành công kiến ​​trúc RDNA 3 vào tháng 12 năm 2022. AMD đã chuyển sang nút N5 của TSMC cho các chiplet GPU, nhưng nó cũng sẽ sử dụng nút N6 cho các chiplets bộ nhớ. AMD vẫn từ chối đưa bất kỳ số lượng phần cứng học tập sâu nào vào GPU tiêu dùng của mình (không giống như loạt MI200 của nó), tuy nhiên, cho phép nó tập trung vào việc cung cấp hiệu suất mà không phải lo lắng về việc nâng cấp – mặc dù FSR 2.0 cũng bao gồm điều đó và hoạt động trên tất cả các GPU. Nhưng trong không gian AI, điều đó có nghĩa là GPU tiêu dùng của AMD đang bị tụt lại phía sau.

AMD cũng có RX 7600 sắp ra mắt, sử dụng TSMC N6 – không phải là bản cập nhật lớn từ thế hệ trước, nói cách khác. Cho đến nay, AMD chỉ công bố hoặc phát hành các biến thể di động của GPU RX 7700 và 7800.

Cũng không có câu hỏi rằng NVIDIA hiện cung cấp hiệu suất theo dõi tia vượt trội hơn nhiều so với thẻ RX 7000- và 6000-series của AMD. AMD gần như không có tiếng nói về phần cứng theo dõi tia hoặc nhu cầu về các hiệu ứng RT trong trò chơi. Intel cho phần của nó mang lại hiệu suất RT (chính) tốt, nhưng chỉ lên đến cấp độ của RTX 3060, cho hoặc nhận. Nhưng miễn là hầu hết các trò chơi tiếp tục chạy nhanh hơn và trông đẹp mà không có hiệu ứng RT, đó là một trận chiến khó khăn thuyết phục mọi người nâng cấp card đồ họa của họ.

Nvidia rtx 40 sê-ri đóng cửa suy nghĩ

Chúng tôi đã có hai năm hạn hán GPU và thẻ quá đắt cho thế hệ trước của NVIDIA. Cuối năm 2022 đánh dấu sự xuất hiện của GPU thế hệ tiếp theo đầu tiên, nhưng tất cả đều rất tốn kém, bắt đầu ở mức tối thiểu $ 800. 2023 trong khi đó đang định hình để trở nên tốt hơn cho những người muốn mua một bản nâng cấp chính thống.

Hy vọng rằng vòng này sẽ chứng kiến ​​sự sẵn có và giá cả tốt hơn nhiều. Nó khó có thể tồi tệ hơn những gì chúng ta đã thấy vào năm 2020.

Đọc các đánh giá đầy đủ của chúng tôi về thẻ RTX 40-series để kiểm tra và kết quả bổ sung:

Asus Geforce RTX 40 Series

ASUS khai thác sức mạnh ngoại vi của GPU NVIDIA GEFORCE RTX ™ 40 Sê -ri để cung cấp card đồ họa với vô số công nghệ tiên tiến, đột phá hiệu suất và vẻ ngoài cao cấp mà bạn đã giành được ở bất cứ nơi nào khác. Từ Ma trận làm mát bằng chất lỏng RTX 4090 với đồng hồ tăng cường ngoài hộp cao nhất trên thị trường, đến các thẻ tập trung vào người tạo ra tối giản, người dùng của mỗi dải sẽ tìm thấy một cái gì đó từ ASUS vượt quá mong đợi. Quạt công nghệ Axial, làm mát bằng buồng hơi, thiết kế nhỏ gọn thông minh, ứng dụng GPU TWEAK III, Full Nvidia Studio Hỗ trợ.

Biên tập viên HKEPC

Lựa chọn của biên tập viên HKEPC

Rog Strix Geforce RTX 4090 OC Edition đã điều chỉnh 3 mới nhất.5 quạt công nghệ trục có tính năng làm mát mạnh mẽ

8,5 trên 10

số 8.5 trên 10

Nó có mọi thứ bạn có thể muốn từ một thẻ tùy chỉnh, chẳng hạn như ép xung nhà máy, một máy làm mát rất có khả năng và yên tĩnh, và một thiết kế hấp dẫn. Cái nhìn mới của nó là một sự khởi đầu mới mẻ từ các thẻ Rog Strix trước đây, và ánh sáng RGB khiêm tốn làm cho một thẩm mỹ trang nhã và bị khuất phục hơn.

2023 Thiết kế sản phẩm Red Dot

2023 Thiết kế sản phẩm Red Dot

Rog Strix Geforce RTX 40 Sê-ri đã giành giải thưởng Thiết kế sản phẩm Red Dot năm 2023, Giải thưởng Thiết kế nổi tiếng thế giới.

Biên tập viên

Lựa chọn của người biên tập

ASUS RTX 4090 OC của Cộng hòa Asus (ROG) mới đại diện cho việc triển khai thiết kế tùy chỉnh làm mát bằng không khí tốt nhất của hàng đầu NVIDIA mới mà ASUS cung cấp và chúng tôi đang xem xét nó ngày hôm nay.

Một ví dụ tuyệt vời về chất lượng xây dựng

Một ví dụ tuyệt vời về chất lượng xây dựng

Đây là phiên bản cho máy ép xung, nhờ vào việc làm mát tuyệt vời và sản xuất tiếng ồn thấp.

93/100

93/100

ASUS ROG Strix RTX4090 OC cũng có một cái nhìn rất tuyệt, với vỏ bọc tròn bán vòng và lưới tản nhiệt phát sáng RGB ở phía sau cho thiết kế cấp công nghiệp Cyberpunk, cũng như hiệu suất làm mát tốt. Nếu bạn nghĩ đến việc nâng cấp card đồ họa cũ của mình, thì đây chắc chắn là một lựa chọn tuyệt vời.

TWEAKTOWN

91%

Asus đình công với ROG Strix Geforce RTX 4090 OC phiên bản của nó. Bạn sẽ không rời mắt khỏi thẻ này, vì nó có phong cách siêu độc lập, bước ra khỏi thẩm mỹ theo phong cách thông thường mà công ty đã sử dụng trong các card đồ họa Rog Strix trước đây.

Hiệu suất đầu tiên

Hiệu suất đầu tiên

Lần này, NVIDIA đã ra mắt một card đồ họa mới của RTX 40 Series và ASUS cũng đã ra mắt Card đồ họa ROG Strix GeForce RTX 4090 OC hàng đầu. Để đáp ứng RTX 4090 lõi cao cấp mới, bộ tản nhiệt mới được thiết kế có kích thước lớn hơn và đồng hồ Boost đạt đến 2640 MHz khi điều chỉnh, tạo ra hiệu suất càng nhiều càng tốt cho các game thủ.

Giải thưởng Thiết kế Red Dot

Giải thưởng thiết kế Red Dot: TUF Gaming GeForce RTX 40 Series

TUF Gaming Geforce RTX 40 Sê-ri đã giành giải thưởng Thiết kế sản phẩm Red Dot năm 2023, Giải thưởng Thiết kế nổi tiếng thế giới.

ASUS GEFORCE RTX 4070 Đánh giá kép – Giá trị & Kết luận | TechPowerup

ASUS Dual nổi bật nhờ tiếng ồn cực thấp, BIOS kép và yếu tố hình thức ngắn.

Video

Ma trận Rog Geforce RTX 4090 Card đồ họa - Hiệu suất Pinnacle

Asus Proart có NVIDIA Studio

Asus Rog có Nvidia DLSS 3 – tốt hơn. Nhanh hơn. Mạnh mẽ hơn.

Rog Strix Geforce RTX 4090 & Nvidia DLSS 3

Asus Rog có phản xạ NVIDIA

Trao quyền cho sự sáng tạo với Asus Proart | Modsbyben

ASUS TUF Gaming Geforce RTX 4070 – Ungboxing chính thức

ASUS TUF Gaming Geforce RTX 4060 TI – unboxing chính thức

ASUS GEFORCE RTX ™ 4080 Noctua Edition | Cái nhìn đầu tiên

Nâng cấp công nghệ trục

Lớn hơn và tốt hơn. Quạt công nghệ trục quay trên vòng bi bóng kép và đã được mở rộng để đẩy mạnh hơn 23% không khí thông qua thẻ, đặt giai đoạn cho nhiệt độ thấp hơn, ít tiếng ồn hơn và hiệu suất cao hơn.

Xoay ngược và công nghệ 0dB

Hai người hâm mộ bên quay ngược chiều kim đồng hồ để giảm thiểu nhiễu loạn và tối đa hóa sự phân tán không khí thông qua tản nhiệt. Cả ba người hâm mộ đều đứng yên khi GPU Temps dưới 50 Celsius, cho phép bạn chơi các trò chơi ít yêu cầu hơn hoặc thực hiện các công việc nhẹ trong sự im lặng tương đối. Người hâm mộ khởi động lại khi nhiệt độ trên 55 C, tham chiếu một đường cong tốc độ cân bằng hiệu suất và âm học cho công việc hoặc chơi.

Cung cấp điện cao cấp

Kiểm soát công suất kỹ thuật số, một loạt các giai đoạn năng lượng hiện tại cao và một đội hình 15K đảm bảo dự trữ lớn để đẩy các ranh giới hiệu suất đáng tin cậy.

PCB nhỏ gọn

Bố cục thành phần và dấu vết đã được tối ưu hóa Một PCB ngắn để giảm tổn thất điện năng và để nhiệt thoát qua một lỗ thông hơi ốp lưng lớn.

Đi với dòng chảy

Tất cả kết hợp với nhau để dễ dàng thúc đẩy hiệu suất GeForce RTX 4090 đến mức tối đa.

ASUS GPU TWEAK III

ASUS GPU TWEAK III (Tải xuống) trực quan và giàu tính năng hơn bao giờ hết. Giao diện được tân trang cung cấp khả năng truy cập cao hơn bằng cách tích hợp các hàm lõi vào bảng điều khiển tập trung và bộ điều chỉnh tần số điện áp của chúng tôi đã được đại tu để làm cho việc ép xung thậm chí dễ dàng hơn nữa. Các tính năng bổ sung như công nghệ fan 0db, hoán đổi cấu hình tự động, khả năng đăng nhập và hiển thị trên màn hình hoàn toàn có thể tùy chỉnh.

Bảo vệ thực tế và đánh giá 40 loạt. (Đọc / Thảo luận dài)

Thực sự thảo luận, TLDR thẳng thắn, vì vậy nếu không muốn đọc để giết thời gian, chỉ cần vượt qua, đừng TLDR vì bạn không có gì khác để làm, sẽ được đánh giá cao.

Ý tôi là, quá khứ để trình bày . Bạn có thẻ chơi game 1K đầu tiên, 2080ti, không nhận được nhiều thứ như vậy khi là 1199, (ý tôi là không bị xoắn, có một số tiếng la hét) nhưng không giống như tiếng la hét trên 40 loạt. Nhưng tất cả những gì đã bị lu mờ bởi Titan RTX “$ 2499” nhưng điều đó không được đề xuất cho các game thủ mặc dù nó đánh bại (lúa mạch) một 2080ti trong trò chơi. Bất cứ ai 75% mọi người phàn nàn, chết tiệt, 1k cho năm 2080ti nhưng vẫn tiết kiệm để có được một!

Tiến về phía trước, Nvidia nói, hey, chúng tôi sẽ cung cấp cho bạn một thẻ thậm chí còn mạnh hơn với một nửa giá! Yay!, Nhưng không ai thấy trước tiền điện tử b.S. sẽ đẩy 700 đô la 3080 đô la lên tới 2 nghìn đô la, và nó đã xảy ra một bài học “, khi điều này nên được thực hiện khi 3070 đang đẩy $ 1500 và 3090 đẩy $ 3k.

Hãy giải quyết nó xuống, từ quan điểm của công ty, HRRMM, cho phép phát hành 3090 TI ở mức $ 2k và xem điều gì sẽ xảy ra. HỌ BÁN.. Vì vậy, nếu “Tôi” là nvidia, vâng, thưa ngài, Demonic 4090 (Fe) này là một thỏa thuận helluva nếu bạn hút 3090ti ở mức 2k và mua 3070 ở mức 1k để làm việc, tại sao tôi không đẩy thời gian thẻ tốt nhất tại 1599. Ý tôi là, bạn nhận được thẻ Lớp Titan với giá dưới 2K, luôn luôn là giá cả lớp Titan của chúng tôi.

Di chuyển, 3080 TI được phát hành và được chấp nhận 50%, bởi vì này, về cơ bản là 3090 cho cách ít hơn, chỉ thiếu một nửa VRAM, vì vậy bây giờ là 4080 (về cơ bản là giá 3080 ti này nhưng hiệu suất của Wayyyy) rất nhiều ghét. Hrmm. Không có ý nghĩa.

4070 TI là một kẻ giết người quái thú 2080ti và rẻ hơn vì vậy tôi cảm thấy nhiều hơn vì vậy mọi người phàn nàn về lớp “80” của thẻ là 1200 đô la so với thực tế là 80 thẻ lớp là trạng thái Titan. Nếu 4080 ít mạnh hơn hoặc bằng 3090 vì chu kỳ luôn luôn luôn và 4080 có giá 100 đô la hơn 3080, thì đó sẽ là chu kỳ bình thường hàng năm của các sự kiện, nhưng về cơ bản 40 loạt đã ném Titan+ Power trong 80/ 90 thẻ lớp và tăng giá như vậy. Nhưng tất cả những gì chúng ta thấy là “80” hoặc “90” và với 1.Thẻ giá 2k mà ​​80 lớp không nên.

Vì vậy, họ đã thử nghiệm thị trường với 2080 Ti, mọi người đã mua nó, quy mô chỉ cho họ thấy, Welp, nghèo như ppl, họ vẫn trả những giá đó, vì vậy 799, 1299 và 1599 là tốt, cộng với việc tăng sức mạnh. Tôi cảm thấy Nvidia đã làm chính xác những gì một công ty nên làm.

Nhưng khi điện thoại di động đạt 1k, và ở lại, # duy nhất đẩy qua 1k cho điện thoại là bộ nhớ lao nhiều hơn, nhưng cơ bản là 1K cho một chiếc điện thoại hàng đầu. Tôi cảm thấy GPU nên giống nhau, có nghĩa là 1K nên là tối đa nhưng nếu bạn cần thêm RAM (đối với ppl thực sự làm việc với GPU) trả 1200 cho 16GB, 1400 cho 24GB, nhưng bất kể, tất cả đều là 4090 hoặc bất cứ điều gì. Giá GPU quá cao, nhưng đó là kinh doanh, không thích nó, hãy tạo GPU của riêng bạn.

2080 TI $ 1200 – Được chấp nhận bởi 80% người dân, 3080 $ 700, được chấp nhận bởi 100% người dân, nhưng từ khi ra mắt, cổ phiếu thấp đã kiếm được 1000 đô la và 75% người vẫn mua. Crypto khai thác nó đạt 1600-1800 đô la và 50% người vẫn mua nó, vì vậy ai là lỗi? Chắc chắn không có nvidia, nhưng những kẻ ngu ngốc của chúng tôi (không phải bạn hoặc tôi) mà là chúng tôi là người tiêu dùng nói chung.

Những gì chúng ta đang làm với 4080 bây giờ, chúng ta nên làm với 30 sê -ri “năm”, nhưng không phải là một năm chết tiệt, mọi người đã trả giá kỳ quặc, vì vậy không có gì lạ.

Đây là “đầy đủ về thảo luận” có nghĩa là được đọc, và suy ngẫm, những câu trả lời thực sự và những bình luận/suy nghĩ dài. Hãy đến tận cùng của nó!

Suy nghĩ cá nhân của tôi: Giá 4080 quá cao, nhưng công bằng từ Nvidia View, và chúng tôi có thể có 999 4080 có rất nhiều người không trả giá ERA da đầu theo thường xuyên.

Liked Liked