HOME-Au
HOME-Au
24h
24h
USA
USA
GOP
GOP
Phim Bộ
Phim Bộ
Videoauto
VIDEO-Au
Home Classic
Home Classic
Donation
Donation
News Book
News Book
News 50
News 50
worldautoscroll
WORLD-Au
Breaking
Breaking
 

Go Back   VietBF > Others (Closed Forums) > Archive - Old News 2012 (closed)

 
 
Thread Tools
Default [Phân tích] Kiến trúc đồ hoạ của card GeForce GTX 680
Old 03-27-2012   #1
Romano
R11 Tuyệt Thế Thiên Hạ
 
Romano's Avatar
 
Join Date: May 2007
Posts: 138,816
Thanks: 9
Thanked 6,560 Times in 5,506 Posts
Mentioned: 3 Post(s)
Tagged: 0 Thread(s)
Quoted: 38 Post(s)
Rep Power: 174
Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10
Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10
Cuối tháng 3 là giai đoạn thế giới chuyển qua cung Bạch Dương (Aries), cung hoàng đạo tiên phong trong 12 cung. Tháng 3 năm nay, giới công nghệ phần cứng chứng kiến sự xuất hiện của card đồ hoạ GTX 680 từ NVIDIA. Cũng như cung Bạch Dương, GTX 680 đánh dấu một bước tiến mới về năng lực đồ hoạ dành cho game. Nhưng điều ǵ làm nên sức mạnh đấy? Chúng ta sẽ t́m hiểu ở bài phân tích sau.



Với hàng tá kết quả benchmark từ nhiều site phần cứng trên thế giới, không có ǵ để nghi ngờ năng lực gaming dẫn đầu của GTX 680. Dĩ nhiên vẫn có một số trường hợp GTX 680 kém hơn HD 7970, song số lượng ấy không đáng kể. GTX 680 là trường hợp đặc biệt sau nhiều năm, các testlab hoàn toàn có đủ tự tin để nói rằng : "hăy mua nó nếu bạn muốn chiếc card đơn nhân mạnh nhất hiện nay". Hai chi tiết thuyết phục khác : giá đề nghị của GTX 680 hiện thấp hơn 50 USD so với HD 7970 và chiếc GeForce dùng ít điện hơn đối thủ Radeon !
Nhưng làm sao một con chip đồ hoạ (GPU) với 3,54 tỷ transistor (GTX 680) lại có thể tốt hơn con chip 4,31 tỷ trans (HD 7970) ? Và làm sao con chip 3,54 tỷ trans này lại mạnh gấp 1,5 lần con chip 3 tỷ trans (GTX 580) cũng của chính NVIDIA ? Làm sao NVIDIA có thể "nhét" 1536 nhân đồ hoạ (SP / CUDA Core) vào 3,54 tỷ trans trong khi "chỉ được" 512 SP vào 3 tỷ trans ? Câu trả lời : Kiến trúc!
Điểm lại kiến trúc Ferm
Các fan của AMD và NVIDIA hẳn không lạ với cái tên Fermi. Đấy là kiến trúc đồ hoạ của ḍng card GeForce 400 & 500. Tuy vậy, kiến trúc Fermi thực ra có 2 phiên bản : Fermi GF100 (hoặc GF110) và Fermi GF104 (hoặc GF114). Khác biệt ? Ở Fermi GF100, một SM có 32 SP. Ở Fermi GF104, một SM có 48 SP. Điều này có nghĩa "mật độ" SP trên GF104 cao hơn so với GF100. Hay nói cách khác, một SM GF104 có thể xử lư được nhiều luồng dữ liệu hơn so với một SM GF100 tại cùng mức xung.

Sơ đồ khối của GF114.
Nhưng bạn đặt câu hỏi : tại sao NVIDIA không thiết kế SM của GF100 cũng nhiều SP như của GF104 ? Khác nhau để làm ǵ ? Trả lời : v́ GF104 để nhắm vào game, c̣n GF100 nhắm vào GPGPU / HPC. GPGPU / HPC là các ứng dụng khai thác GPU để thực hiện tính toán thay cho CPU, ví dụ như các siêu máy tính (SC). Top 10 SC hiện nay có 3 hệ thống (thứ 2, thứ 4 và thứ 5) hiện đang dùng GPU của NVIDIA. Trong đó 2 hệ thống đứng thứ 2 và thứ 4 dùng chip GF100 (C2050). Danh sách các card Tesla (cho HPC) của NVIDIA hiện không có model nào dùng chip GF104.
Tuy vậy, GF104 lại là con chip khá mạnh phổ biến trong ḍng card GeForce (cho game) hiện tại của NVIDIA.
SP nhiều gấp 4, hiệu năng gấp đôi
bài preview trước, tôi có đề cập vấn đề số SP của GTX 680 (hay GK104) gấp 3 lần GTX 580 (GF110) hoặc 4 lần GTX 560 Ti (GF114) nhưng hiệu năng chỉ gấp 1,5 lần GTX 580 hoặc 2 lần GTX 560 Ti. V́ sao có điều "kỳ lạ" này ? Đấy là chưa tính xung nhịp của GTX 680 lên đến 1 GHz c̣n GTX 580 chỉ có 772 MHz và GTX 560 Ti là 822 MHz !
Vấn đề nằm ở chỗ : NVIDIA đă thực hiện một thay đổi có thể xem là đáng kể nhất từ GeForce 8000 : loại bỏ xung shader. Thực ra, không hẳn "bỏ", mà xung shader của GK104 lúc này bằng đúng xung GPU. Nếu bạn lật lại những thế hệ card GeForce trước đây của NVIDIA, bạn sẽ thấy xung shader từ GeForce 8000 luôn cao hơn rất nhiều so với xung GPU. Đặc biệt với thế hệ Fermi, xung shader luôn gấp đôi xung GPU. Có nghĩa nếu GTX 580 có xung GPU 772 MHz th́ các shader của nó lại đang chạy ở mức 1.544 MHz ! Rất cao phải không nào?
Cấu tạo SMX của GK104.

Do vậy, mặc dù GK104 có đến 1536 SP, gấp 4 lần con số 384 SP của GF114, nhưng hiệu năng của nó chỉ gấp đôi con chip này (v́ xung shader GK104 bằng xung GPU, c̣n xung shader GF114 gấp đôi xung GPU). Và điều này cũng góp phần giải thích tại sao card NVIDIA vốn có ít SP hơn card AMD : v́ xung shader bên AMD cũng bằng xung GPU.
Đến đây, bạn đang tự hỏi : tại sao NVIDIA phải làm như thế ? Phải chăng NVIDIA đang "tiến lùi" ? "Nhồi" ít SP hơn th́ đỡ tốn silicon / transistor hơn chứ ? Và lời giải đáp có thể sẽ khiến bạn bất ngờ ...
Nhiều SP hơn nhưng die nhỏ hơn

Bạn đang đọc nhầm? Không! Bạn đọc đúng từng chữ đấy! GK104 có nhiều SP hơn nhưng die lại nhỏ hơn GF104 lẫn GF100. Dĩ nhiên không thể bỏ qua "công lao" của tiến tŕnh bán dẫn 28nm của TSMC so với tiến tŕnh 40nm: cùng lượng transistor một die 28nm chỉ bự bằng 1/2 die 40nm (28nm x 28nm = 40nm x 40nm / 2). Die GK104 có kích thước 294mm2 @ 28nm. Trong trường hợp được sản xuất trên tiến tŕnh 40nm, kích thước của nó có thể vào 600mm2 ! Cho bạn tiện tham khảo, die GF100 có kích thước 520mm2.

Nhưng ngay cả khi GK104 được sản xuất trên node 40nm, bạn vẫn khó ḷng h́nh dung được làm sao NVIDIA có thể "nhét" 1536 SP vào trong một diện tích vốn chỉ "vừa" với khoảng 600 SP ? "Ma thuật" ǵ ở đây?

Die chip GK104 có kích thước 294mm2.
"Ma thuật" ở chỗ: có rất nhiều thứ trên tấm silicon không dùng để làm SP. Một trong các lư do chúng ta nhắc lại kiến trúc Fermi ở trên là : nó sinh ra cho GPGPU. Đối với GPGPU, một trong các thành phần quan trọng nhất là các bộ điều lịch (scheduler)năng lực dấu phẩy động 64-bit (FP64). Vai tṛ của scheduler có thể so sánh với các quản lư viên (supervisor) trong một công ty, nhà máy: bạn có thể có nhiều nhân công (worker) nhưng thiếu các quản lư có tŕnh độ th́ hiệu suất sử dụng lao động sẽ không cao. C̣n FP64 có ư nghĩa trong việc tính toán chính xác (nghiên cứu khoa học, xây dựng mô h́nh ...), hầu hết game không cần năng lực này.

Trong GPGPU, rất dễ có sự xuất hiện bất ngờ các tiến tŕnh ngoại biên (thực chất GPGPU rất giống với các thuật toán trên CPU - general computing). Một số tiến tŕnh bị lệ thuộc toán tử vào các tiến tŕnh phái sinh khác. Điều này khiến cho tốc độ xử lư GPGPU nhanh hay chậm sẽ lệ thuộc scheduler. C̣n với gaming, hầu như các tiến tŕnh có thể dự đoán được v́ các studio làm game có quan hệ sâu sắc với NVIDIA lẫn AMD. Nhờ mối quan hệ này mà hiệu năng game thường được cải thiện dần sau mỗi lần phát hành driver (software) mới. Nhưng với GPGPU, chỉ có các scheduler vật lư (hardware) mới thực sự hiệu quả.

Kepler dùng cơ chế điều lịch đơn giản hơn các thế hệ trước.
Bao nhiêu silicon được dành cho scheduler vật lư thực sự chúng ta không rơ. Song bạn có thể nh́n qua kiến trúc GCN của AMD làm ví dụ. Từ Cayman (HD 6970) chuyển lên Tahiti (HD 7970) là sự chênh lệch giữa 2,64 và 4,3 tỷ transistor (60%), nhưng chỉ là giữa 1536 và 2048 SP (33%). Rất nhiều silicon đă AMD đầu tư vào scheduler vật lư. Và điều này tạo ra một con chip cực mạnh về GPGPU như bạn từng thấy.
Cấu tạo CU trong kiến trúc GCN của AMD.
Vậy là câu trả lời "ma thuật" đă rơ : NVIDIA cắt giảm một lượng lớn silicon dành cho scheduler vật lư và FP64 trên GK104 (cùng với một số thành phần liên quan khác). Kết quả là một con chip chỉ "tốn" 3,54 tỷ trans nhưng lượng SP lên đến 1536 !
Và ít hao điện hơn
Đặc tính này không chỉ do node 28nm (tất nhiên vẫn có). Nó có nguyên nhân "sâu xa" hơn ở yếu tố "xung shader". Như đề cập ở trên, từ GeForce 8000 cho đến GeForce 500, NVIDIA áp dụng mức xung shader cao hơn GPU rất nhiều. Một quy luật đơn giản: muốn đạt xung cao th́ điện áp đầu vào transistor phải lớn (và ngược lại). Các shader trước đây của NVIDIA đều có mức xung khi fullload trên 1 GHz, và cần rất nhiều điện. Đây cũng là nguyên nhân khiến cho card NVIDIA vẫn thường bị chê ở khoản hao điện (so với card AMD).


Xung thấp hơn, ít tiêu thụ điện hơn.

Việc NVIDIA cho xung shader bằng với nhân GPU trên GK104 đă loại bỏ điều trên. Chi tiết này đồng thời cho phép nhân GPU đạt được xung cao hơn (do không bị hạn chế bởi xung shader). Nếu trước đây GTX 580 chỉ có thể ép xung (OC) lên 1,5 GHz th́ chỉ trong ngày ra mắt, GTX 680 đă có thể OC lên 1,9 GHz !

Dĩ nhiên, không có ǵ "miễn phí" mà không phải "đánh đổi". NVIDIA phải nhồi gấp 4 lần lượng SP so với GF104 để có được hiệu năng gấp đôi. Và NVIDIA phải cắt giảm lượng silicon cho scheduler vật lư. Chi tiết này khiến GK104 trở nên rất yếu kém trong GPGPU. Trong nhiều phép benchmark GPGPU, GTX 680 thậm chí kém cả GTX 580. Điều này đặt ra nghi hoặc cho giới HPC: con chip Kepler tiếp theo của NVIDIA sẽ như thế nào? NVIDIA hiện đang có một chỗ đứng lớn trong làng HPC. Các khách hàng của NVIDIA đang mong đợi Kepler đạt được hiệu năng (GPGPU) cao hơn Fermi. GK110 - con chip Kepler tiếp theo - sẽ là một chủ đề thú vị, song chúng ta sẽ không bàn ở đây.

Tŕnh điều khiển nhớ tốt hơn

NVIDIA có thể làm ra những GPU rất mạnh, nhưng họ vẫn thường theo sau AMD về các chip nhớ DRAM. Trong cộng đồng công nghệ, AMD thường được biết đến như hăng tiên phong về các chuẩn nhớ đồ hoạ mới. Không quá thậm xưng khi nói rằng GDDR5 do chính AMD làm ra. Khi NVIDIA vẫn loay hoay với GDDR3 th́ AMD đă có kinh nghiệm với GDDR4 & 5. Ngay cả khi tiến lên sử dụng GDDR5, tốc độ các chip DRAM mà NVIDIA khai thác được thường thấp hơn nhiều so với AMD. Một trong các lư do khiến hiệu năng GeForce sụt đi so với Radeon khi tiến lên độ phân giải cao cũng đến từ đây : hụt băng thông nhớ.
Nhưng đến với Kepler, NVIDIA đặt ra mục tiêu : cải thiện tŕnh điều khiển nhớ (IMC) trong lần đầu tiên và vượt qua đối thủ ở lần tiếp theo. Kết quả là một khối IMC khá lớn và hiệu quả cực kỳ ấn tượng : chỉ với giao tiếp 256-bit nhưng GK104 đạt được băng thông nhớ tương đương với GF100 vốn có giao tiếp nhớ 384-bit. Không chỉ thế, các kết quả OC mới nhất cho thấy IMC của GTX 680 cực kỳ mạnh mẽ : vượt trên 7 GHz !
Turbo, eh ... GPU Boost
Người dùng CPU Intel và AMD hẳn từng có nghe qua Turbo Boost / CORE (gọi tắt turbo). Tính năng OC tự động này sẽ giúp CPU của bạn đạt được mức xung cao hơn mặc định trong trường hợp ứng dụng không tận dụng hết hiệu quả đa luồng. Do không dùng "hết" hiệu quả này, có một phần TDP của chip không được khai thác mà cả AMD và Intel đều thấy "phí". NVIDIA cũng nhanh chóng bắt lấy ư tưởng này và họ sinh ra GPU Boost (bên GPU AMD cũng có tính năng tương tự là Power Tune, song Power Tune không "tự động" như turbo hay GPU Boost).

Romano_is_offline  
Attached Thumbnails
Click image for larger version

Name:	GeForceGTX680DieShot_489c6.jpg
Views:	10
Size:	91.4 KB
ID:	369354  
Old 03-27-2012   #2
Romano
R11 Tuyệt Thế Thiên Hạ
 
Romano's Avatar
 
Join Date: May 2007
Posts: 138,816
Thanks: 9
Thanked 6,560 Times in 5,506 Posts
Mentioned: 3 Post(s)
Tagged: 0 Thread(s)
Quoted: 38 Post(s)
Rep Power: 174
Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10
Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10
Default

Cách thức hoạt động như đă nêu: khi xử lư các game có hiệu suất khai thác GPU thấp, phần TDP "thừa" sẽ được các bộ điều khiển (controller) VRM tính toán và tự động tăng điện áp (Vcore, Vdd) để GPU có thể đạt mức xung cao hơn, từ đó cải thiện hiệu năng game (thông qua lượng fps). Dưới đây là bảng một số mức xung và điện áp mà AnandTech ghi nhận được khi benchmark GTX 680:



Mặc dù vậy, GPU Boost có vẻ không hiệu quả khi gaming là bao. Kết quả so sánh giữa khi không bật (-16%) và có bật (Stock) của AnandTech cho thấy bạn hầu như không nhận ra được khác biệt nào giữa chúng. Kể cả khi bạn khai thác GPU Boost ở mức tối đa th́ chênh lệch này cũng chỉ vài %:


Tại sao GPU Boost phát huy kém ? Có 2 lư do :

- Kiến trúc chip : một kiến trúc với hiệu năng trên từng MHz cao sẽ tăng lượng fps nhiều hơn
- Hiệu quả khai thác chip của game : những game vốn đă khai thác tốt GPU th́ lượng TDP "thừa" rất ít. Nếu quan hệ giữa game studio và nhà sản xuất GPU vốn đă tốt th́ gần như không có khoảng "thừa" nào để tận dụng tiếp
Những tính năng khác

Những thứ liệt kê sau đây thực ra không liên quan đến kiến trúc của Kepler. Song v́ chúng xuất hiện cùng lúc với sự ra mắt của GTX 680 nên chúng ta điểm qua để hiểu thêm xem ngoài năng lực game, NVIDIA c̣n đem đến cho người dùng những ǵ khác.

Adaptive V-Sync
Hầu hết các FPS gamer có thể từng nghe qua V-Sync, một tính năng giúp "ổn định" mức fps khi chơi. Các benchmark thường chỉ nêu ra mức fps trung b́nh (avg) mà card đạt được. Nhưng điều ảnh hưởng đến đôi mắt của gamer lại là 2 giá trị tối đa (max) và tối thiểu (min), nếu chênh lệch giữa min và max quá lớn sẽ gây ra hiện tượng xé h́nh (tear) khiến gamer thấy rất khó chịu.



V-Sync sinh ra với mục đích giới hạn lại mức chênh lệch trên, thường vào giữa 30 và 60 fps (với điều kiện card phải có khả năng đạt min > 30 fps và max > 60 fps). Song nó vẫn có nhược điểm : khi card chỉ xuất được < 60 fps th́ V-Sync lập tức "kéo" xuống c̣n 30 fps. Đặc điểm này phần nào vẫn gây bực bội cho gamer (nhưng vẫn ít hơn so với hiện tượng xé h́nh). Và NVIDIA khắc phục nốt vấn đề này bằng cách loại giới hạn "min" : ví dụ card xuất ra 52 fps th́ thứ được hiển thị trên màn h́nh vẫn là 52 fps. Tính năng này về căn bản là một phần của driver, không thuộc bản chất kiến trúc GPU.



FXAA & TXAA


Khử răng cưa (AA) và lọc đẳng hướng (AF) là 2 phương pháp truyền thống nhằm nâng cao chất lượng h́nh ảnh trong game. Tuy vậy không có ǵ "miễn phí" : mức fps sẽ bị giảm đi khi áp dụng các thuật toán này. Trong nhiều năm, cả AMD lẫn NVIDIA vẫn luôn nghiên cứu ra các thuật toán mới (chủ yếu là AA) nhằm vẫn giữ chất lượng h́nh ảnh ở mức cao mà chỉ "hao hụt" một ít hiệu năng đồ hoạ. Đến với lần này, NVIDIA giới thiệu 2 cơ chế AA mới : FXAA và TXAA.


Từ trên xuống : AA off, MSAA 4x, FXAA.

TXAA thực ra không phải hoàn toàn mới, nó là sự kết hợp của nhiều cơ chế AA trước đây. Kết quả là một cơ chế cho hiệu năng tương đương (TXAA1) với MSAA 8x hoặc cao hơn (TXAA2), nhưng mức "hao hụt" hiệu năng chỉ ngang với MSAA 2x hoặc 4x. Trong khi đó FXAA mang lại chất lượng h́nh ảnh tốt hơn MSAA 4x, tuy nhiên "cái giá phải trả" về hiệu năng là bao nhiêu th́ chúng ta không được rơ, chỉ biết rằng : wow, rất tuyệt !

Từ trên xuống : AA off, MSAA 4x, TXAA.
Một vấn đề "nhỏ" của FXAA và TXAA là hiện chưa có game nào khai thác được chúng. Sẽ cần nhiều thời gian để NVIDIA làm việc với các game studio và tích hợp chúng trong các bản driver mới.
Bindless Textures

Nếu lúc ra mắt HD 7970, AMD công bố về Partially Resident Textures (PRT) như là một phương pháp để tiết kiệm băng thông nhớ đối với nhu cầu về texture th́ nay với GTX 680, NVIDIA cũng có đ̣n đáp trả. Tuy về bản chất đều làm tăng tốc độ nạp texture, nhưng cách thức thực hiện hoàn toàn khác nhau.

Cách thức hoạt động của PRT.

Với AMD, ứng dụng đồ hoạ sẽ "băm" một khối texture lớn (megatexture) ra nhiều mảnh (64 KB). Sau đấy chọn ra các mảnh thực sự cần thiết đối với luồng xử lư và nạp vào các shader, giúp tiết kiệm đáng kể băng thông nhớ (v́ không nạp các mảnh thừa). Với NVIDIA, theo "truyền thống", shader sẽ truy cập đến texture thông qua một bảng tra cứu (binding table). Điều này làm hạn chế số lượng texture mà các shader có thể cùng truy cập trong một lúc (128 mẫu với các thế hệ trước). Tiến lên Kepler, NVIDIA bỏ qua bước tra cứu này và truy cập trực tiếp vào bộ nhớ để đọc texture. Nhờ đó, về lư thuyết các shader Kepler có thể đọc được cùng lúc > 1 triệu mẫu texture.

Bindless Texture của NVIDIA.
Hiển thị đa màn h́nh

Việc một GPU có thể xuất tín hiệu ra 2 màn h́nh khác nhau vốn đă có từ lâu. Song dường như nhiều nhà sản xuất "quên" rằng người dùng có thể sẽ cần nhiều màn h́nh hơn nên họ hầu như không thay đổi năng lực này của GPU (chỉ trừ một số card đồ hoạ chuyên dụng mới có tính năng này). Rồi AMD thực sự gây "shock" cho rất nhiều khách mời khi lần đầu tiên ra mắt ḍng card HD 5000 cách đây 3 năm : Eyefinity. Lần đầu tiên một chiếc card chơi game có thể xuất tối thiểu cùng lúc tín hiệu ra 3 màn h́nh khác nhau. Với một số phiên bản khác, AMD có thể đẩy con số này lên 6 hoặc thậm chí là 12 màn h́nh cùng lúc!

Trong 3 năm qua, NVIDIA không có ǵ đáp trả lại Eyefinity. Họ vẫn có thể xuất ra 3 màn h́nh nhưng lại cần đến 2 card GeForce hoạt động ở chế độ SLI mới làm được. Ngoài ra NVIDIA chỉ dừng được đến 3 màn h́nh, không hơn. Và hôm nay, thế hệ card Kepler đă khắc phục điểm yếu đó của NVIDIA : 4 màn h́nh cùng lúc. Mặc dù con số này vẫn kém phiên bản Eyefinity 6 và 12 của AMD, song "muộn c̣n hơn không". Với bước đi này của NVIDIA, cùng với thiết kế GPU trên Ivy Bridge sắp tới của Intel, hy vọng trong thời gian tới việc chơi trên nhiều màn h́nh sẽ trở nên phổ biến hơn và các gamer sẽ có cảm giác "không gian như thật" nhờ góc nh́n trong game được cải thiện đáng kể.


Tổng hợp thông số kỹ thuật

Bàn luận dông dài như thế, đă đến lúc chúng ta cần "ráp nối" các thành phần lại để ra một con chip hoàn chỉnh.




Thành phần cơ bản nhất của GK104 là SMX như đă nói ở phần trước (là sự ghép nối của nhiều SM từ kiến trúc Fermi). 1 SMX gồm 192 SP (hoặc nhân CUDA), 16 bộ Load / Store, 16 SFU, 1 PolyMorph Engine, 4 Warp Scheduler, 8 Dispatch Unit, L1 Cache 64 KB và 8 TMU. Lên cấp độ cao hơn, chúng ta có GPC : gồm 2 SMX và 1 Raster Engine. Mỗi GPC liên kết với 1 tŕnh điều khiển nhớ (MC) 64-bit và 8 ROP. Ở cấp độ toàn con chip, GK104 có 4 GPC và từ đấy có đên 4 MC 64-bit tạo thành giao tiếp nhớ 256-bit, 4 nhóm ROP tạo thành tổng 32 ROP có chung L2 Cache 512 KB. Tất cả dữ liệu ra vào 4 GPC, 4 MC và 32 ROP lẫn L2 Cache được phân phối bởi GigaThread Engine và giao tiếp PCI Express (PCIe) 3.0.



Từ đây, chúng ta có thể dự đoán phiên bản Kepler cấp thấp hơn (giả định GK106) sẽ có thông số như nào. Nhiều khả năng GK106 sẽ có 2 GPC với 4 SMX và 2 MC tạo thành giao tiếp nhớ 128-bit, lượng ROP c̣n 16 đơn vị và L2 Cache chỉ c̣n 256 KB. Tất nhiên GK106 vẫn cần một GigaThread Engine (nhỏ hơn) và giao tiếp PCIe 3.0 để "nói chuyện" với CPU.
Ở đây, chúng ta sẽ mượn lại kết quả benchmark từ AnandTech để thấy được hiệu năng của GTX 680:

Kết quả benchmark game
Không quá khó để thấy GTX 680 hầu như dẫn đầu trong mọi chiếc card đơn nhân hiện có (trừ một số kém HD 7970). Tuy vậy nếu bạn để ư kỹ hơn, sức mạnh của GTX 680 hầu như chỉ bằng 2,3 lần (hoặc thấp hơn) GTX 560 Ti. C̣n nhớ phần "SP gấp 4, hiệu năng gấp 2" chứ ? Kết hợp với chênh lệch về xung 1006 / 822 = 1,22, về lư thuyết GTX 680 sẽ nhanh hơn GTX 560 Ti 2,45 lần. Và chỉ cần thế GK104 trở thành GPU mạnh mẽ nhất cho game trong số các GPU hiện tại.

Crysis Warhead


Metro 2033




Dirt 3


Romano_is_offline  
Old 03-27-2012   #3
Romano
R11 Tuyệt Thế Thiên Hạ
 
Romano's Avatar
 
Join Date: May 2007
Posts: 138,816
Thanks: 9
Thanked 6,560 Times in 5,506 Posts
Mentioned: 3 Post(s)
Tagged: 0 Thread(s)
Quoted: 38 Post(s)
Rep Power: 174
Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10
Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10
Default



Total War - Shogun 2




Batman - Arkham City




Portal 2



Battlefield 3



StarCraft II





The Elder Scrolls V - Skyrim



Civilization V



Năng lực điện toán


Mặc dù card đồ hoạ vốn ban đầu sinh ra để cho game 3D. Song theo thời gian sức mạnh của chúng ngày càng đáng kể, vượt xa cả những CPU x86 mạnh nhất cùng thời. Chỉ chơi game có phần nào lăng phí nguồn sức mạnh to lớn ấy. Do vậy mà cả AMD lẫn NVIDIA đều đang cổ suư cho GPGPU, một h́nh thức điện toán dựa trên các GPU, nhằm tăng tốc quá tŕnh xử lư thay cho việc dùng CPU truyền thống. Và câu hỏi được đặt ra ở đây : hiệu năng game của GTX 680 có tương đương với năng lực điện toán ?



Câu trả lời dường như khá rơ : GTX 680 không mạnh ở GPGPU, nó thậm chí kém cả GTX 580. Và lư do khá đơn giản : NVIDIA không định hướng cho nó thành một sản phẩm mạnh về GPGPU, rất nhiều thành phần cần thiết cho GPGPU bị cắt giảm đi khi thiết kế GK104, chúng được thay bằng lượng SP khổng lồ chỉ để tăng năng lực gaming lên mức tối đa, như chúng ta đă phân tích ở trên.

Nhiệt độ, độ ồn, tiêu thụ điện


Bằng việc bỏ đi xung shader so với các thế hệ GPU trước, giờ đây NVIDIA hoàn toàn có khả năng làm ra những chiếc card có mức tiêu thụ điện tương đương với AMD. Ít transistor hơn Tahiti nhưng dùng chung node 28nm, không có ǵ ngạc nhiên khi GK104 mát hơn, dùng ít điện hơn và nhờ đấy hoạt động êm ái hơn (do quạt không phải quay nhiều).



Kết luận


Nếu bạn là một gamer, qua hết thảy những ǵ nêu trên, bạn gần như tự trả lời được nên chọn mua chiếc card nào giữa GTX 680 và HD 7970. Một chi tiết thú vị hơn: NVIDIA chào giá GTX 680 thấp hơn 50 USD so với HD 7970. Nghe rất tuyệt phải không ? Song có một điều khiến bạn chưa hài ḷng: hiện chẳng c̣n chiếc GTX 680 nào cho bạn xách về nhà, kể cả đặt hàng online từ Mỹ. Lư do là TSMC (hăng gia công chip) không cung cấp đủ lượng GK104 cho NVIDIA. Do vậy rất có thể 2 thậm chí 3 tháng tới, Việt Nam chúng ta mới có GTX 680 và giá có thể cao hơn rất nhiều so với giá gốc (v́ nguồn cung rất hạn chế).



Ngoài ra, nói đi cũng phải nói lại, dù HD 7970 kém hiệu năng game hơn GTX 680, song đấy vẫn là chiếc card mạnh ... thứ 2 hiện nay. Không phủ nhận được rằng ngoài GTX 680 th́ chẳng c̣n model đơn nhân nào mạnh hơn HD 7970. Nhược điểm duy nhất của chiếc card Radeon là giá thành của nó. Hy vọng với sự ra mắt của GTX 680, AMD sẽ nhanh chóng hạ giá các model HD 7900 trong thời gian sắp tới. Bên cạnh đó, năng lực GPGPU là một điểm mạnh cho sản phẩm của AMD. Chúng ta có thể nói gọn: GTX 680 - cực đỉnh về game, HD 7970 - tuyệt về game, tuyệt cả GPGPU.
cnet
Romano_is_offline  
 
User Tag List

Thread Tools

Trump dọa áp thuế để “lấy” Greenland: Châu Âu nổi giận, dân đảo mất ngủ Giám đốc CIA gặp Delcy Rodríguez ở Caracas: Washington nói chuyện “làm ăn”, Trump khen Machado nhưng vẫn chưa trao ghế Bóng đen Berlin-Lichtenberg: Dao rựa, buôn người và “luật im lặng” của một thế giới ngầm Việt Cộng
ICE bắt giữ nữ tỷ phú Trung Quốc ở Saipan: “bóng ma” casino tai tiếng Imperial Pacific lại dậy sóng V́ sao Trump “nghe răm rắp” một bà thầy phong thủy gốc Hồng Kông? Nhờ Người gốc Việt mà VN chưa lọt vào danh sách đen ăn welfare và bị siết visa như 75 quốc gia khác
Minneapolis lại bùng nổ: 2 vụ nổ súng trong 1 tuần, Trump dọa tung “Insurrection Act” Món quà Nobel và chiếc túi quà có chữ kư: Hai người đàn bà, một chiếc ghế Caracas và cái gật đầu của Trump Đồng minh Mỹ “xoay trục” giữa cơn địa chấn địa chính trị: Canada bắt tay Trung Quốc, Nhật–Philippines siết pḥng thủ, Nhật–Hàn…
Sốc : Hai người gốc Việt chết v́ tai nạn - Đêm Giáng Sinh tang thương trên I-495: bà Su Nguyễn và cô bé 15 tuổi ra đi sau cú tông hơn 100 mph Một phút im lặng cho 40 linh hồn nhỏ bé: Thụy Sĩ ch́m trong quốc tang 9/1/2026 Chân dung đặc vụ ICE nổ súng ở Minneapolis: cựu chiến binh Iraq - Gia đ́nh lên tiếng về Jonathan Ross: “người chồng, người cha tận tụy” giữa tâm b
Nhà Mỹ gốc Việt tan tành sau khi cho dân da đen thuê Khi chợ búa nổi dậy, chế độ rung chuyển: Iran trong bóng tối liên lạc: biểu t́nh lan hơn 100 thành phố và lời cảnh cáo lạnh người từ Trump Video “cận chiến” từ điện thoại ICE ṛ rỉ: Minneapolis sôi sục, điều tra bị nghi che chắn
Trump muốn “tự tay chọn” hăng dầu vào Venezuela: Big Oil lắc đầu, Caracas thả tù nhân lấy đường sống Venezuela mở “kênh ngoại giao thăm ḍ” với Mỹ: vừa thả tù chính trị, vừa đón phái đoàn Bộ Ngoại giao Mỹ vào Caracas Từ Minneapolis lan khắp nước Mỹ: biểu t́nh chống ICE, điều tra bị nghi “khóa cửa”, trường học hoảng loạn
Tổng thống Donald Trump kể phút ‘xông cửa thép’ bắt Maduro: xem trực tiếp như phim Delta Force ra tay bắt Maduro: Trump xem trực tiếp ở Mar-a-Lago, USS Iwo Jima chở về New York, DOJ chuẩn bị cáo trạng mới Gia Lạp Gia Tư (Caracas) nín thở sau tin Maduro bị bắt: người hy vọng đổi đời, cộng đồng hải ngoại mở hội
Machado ra ‘thư hiệu triệu’: Đă đến lúc chủ quyền nhân dân lên tiếng, mời Edmundo González tiếp quản Venezuela “Săn” theo nếp sinh hoạt: CIA theo dơi, Delta ra tay, FBI HRT yểm trợ – Maduro đối mặt cáo trạng ma túy 15 năm Sau đêm bắt Maduro: Trump nói Mỹ sẽ điều hành Venezuela “đến khi chuyển tiếp an toàn”, tính giao dầu khí cho các tập đoàn Mỹ
Operation Absolute Resolve: Bắt Maduro giữa đêm, ghé Guantanamo rồi đưa thẳng về New York H́nh ảnh mới nhất về trùm Cộng Sản bị bắt, Bondi nói Maduro sẽ ra ṭa Mỹ nhận án tử h́nh ! Ṭa phúc thẩm Mỹ ‘tuưt c̣i’ California: Lệnh cấm mang súng lộ thiên bị phán vi hiến
Bài học Liên Xô cho con đường dân chủ của người Việt Du khách Trung Cộng đăng ảnh thăm Hồ Lăng với cờ 5 sao, dắt chó 1 sao khiến Việt Cộng nổi điên Bức ảnh người Mỹ đấm thẳng mặt vào lũ 3 que, đu càng và sự thật được trả lại cho VNCH
5 cạm bẫy khiến Việt Kiều hạ cánh xuống phi trường là mất sạch tiền Hàng triệu người Việt tẩy chay Zalo v́ app này làm điều khó chấp nhận Ông Trump lại chết v́ người đẹp salon
Hỗn loạn tại Trung Cộng v́ một lư do không thể tin nổi Hàng triệu Việt Kiều nguy cơ bị hốt ví ngay khi vừa đặt chân xuống Việt Nam Việt Cộng xây sân vận động to ở Hưng Yên để làm cái ǵ?
“Siêu đẹp” bí mật trong Himalaya: Dân Việt Nam sẽ chết không c̣n chỗ chôn? Ngoại trưởng trẻ nhất Trung Quốc và cú rơi không lời giải: Thăng như tên lửa, mất tích như bóng ma Hơn trăm người nhập viện bị ngộ độc, không biết là v́ lư do ǵ, hoá ra là ....
“Bóp nghẹt không tiếng súng”: Việt Nam đang thua v́ Trung Quốc quá mạnh, hay v́ ta tự làm ḿnh yếu? 10 khác biệt “đinh” giữa người Mỹ & người Việt Cộng: đọc th́ cười, ngẫm lại… chạnh ḷng “Mùa đỏ” của Cộng Sản bị loại khỏi giải Oscar
Thanh niên Việt mới sang Mỹ 9 tháng và một câu hỏi nhói ḷng: “Bám trụ hay quay về?” Sony rút khỏi Huệ Châu, TQ, 30.000 người mất việc: khi “đèn nhà máy tắt” kéo cả một thành phố chao đảo Thảm sát Bondi Beach: hai cha con bị nghi theo ISIS, chuyến đi Mindanao và câu hỏi nhức nhối về “lỗ hổng” an ninh Úc
Hà Nội đang rất mệt – nhưng tôi vẫn không đành rời đi Chuyện giang hồ Á Châu và những cú sốc văn hoá Người Đàn Bà Gánh Sứ Mệnh Đến Hơi Thở Cuối Cùng
Putin Sụp Kiểu Liên Xô Hay Chỉ Là Giấc Mơ Của Phương Tây? “Con kiến kiện củ khoai”: Dân Phú Yên có thật sự kiện được thủy điện xả lũ? Trump Đánh Thuế, Chuỗi Cung Ứng Đại Di Cư: Việt Nam Đang Lên Đời Hay Chỉ Là Trạm Trung Chuyển Rẻ Tiền?
VIỆT NAM SẮP HÓNG HAY ĐANG ẢO GIÁC TẬP THỂ? Macron dọa đánh thuế hàng Trung Quốc: Châu Âu giật ḿnh trước thâm hụt 300 tỷ euro Chiến lược An ninh Quốc gia mới của Trump: Khi ‘Nước Mỹ trên hết’ hóa thành bản tuyên ngôn cá nhân
V́ sao ngày xưa vua miễn thuế khi băo lụt, c̣n ngày nay th́ không? Phép tính lạnh lùng của quyền lực Lindsey Halligan: 63 Ngày Hỗn Loạn Ở Viện Công Tố Virginia Việt Cộng sẽ tịch thu toàn bộ tiền của Việt kiều gửi trong ngân hàng?
Từ ‘Sổ Sinh Tử’ Đến Những Tấm Bưu Thiếp Tự Do: Lời Kêu Gọi Từ Buổi Tưởng Niệm 50 Năm Quốc Nạn 1975–2025 Paris By Night Lặng Im: Khi Đế Chế Giải Trí Chạm Đáy Khủng Hoảng Địa Ngục Lửa Trên Cao Ốc: Thảm Họa Wang Fuk Court Rúng Động Hồng Kông, ít nhất 146 người chết, khoảng 40 người vẫn c̣n mất tích
Ván Cờ Ḥa B́nh Của Trump: Ukraine Giữa Thể Diện Dân Tộc, Bom Đạn Và Lính Đánh Thuê Toàn Cầu Thảm Sát Trong Tiệc Sinh Nhật Ở California: Khi Bữa Tiệc Gia Đ́nh Hóa Chiến Trường Đẫm Máu V́ sao Paris By Night và nghệ sĩ hải ngoại đồng loạt im lặng trước chuyện chống Cộng?
Nghề nail người Việt giữa cơn băo 2025: khi ghế trống nhiều hơn khách Giáng sinh kiểu Mỹ 2025: Rạp phim cháy vé, gấu bông biết nói nhảm và nỗi băn khoăn “có nên cho con tiền lúc ḿnh c̣n sống?” Bitcoin lao dốc, vàng – bạc lập kỷ lục: cơn “sốc Nhật Bản” đang dọa thổi bay cú rally cuối năm của Phố Wall
Black Friday 2025: Người Mỹ mua nhiều mà được ít – thuế Trump và “K-đồ thị” xé đôi túi tiền Chống tham nhũng làm nghẽn “cỗ máy chiến tranh”: Doanh thu quốc pḥng Trung Quốc bất ngờ lao dốc Cựu tiếp viên hàng không và “luật ngầm” 4 triệu – 7 triệu: đường dây mại dâm Tài Nguyên Fortuner II lộ sáng
Quân Lực VNCH – Ai c̣n nhớ, ai đă quên: TQLC Phúc Yên Nguyễn Xuân Phúc và một “tổn thất” của Khóa 16 Kinh tế Trung Quốc đang tan ră từ bên trong: “phép màu” chỉ là một phim trường khổng lồ Giữa Nước Mỹ Chia Rẽ: Tâm Sự Của Một Người Nhập Cư
Thuế quan “giấu mặt” gơ cửa mùa lễ: Mua hàng ngoại xong… nhận thêm hóa đơn “Đừng gọi tôi Việt kiều”: từ một chữ Kiều đến vết xước trong ḷng người xa xứ “Bỏ thuế nhà đất” và cơn băo tranh luận: Mơ ước của chủ nhà, nỗi lo của trường học
Không cuồng Cộng Ḥa, không cuồng Dân Chủ: chỉ đau với nước Mỹ hôm nay David Hoàng Nguyễn (26 tuổi) – Hạ sĩ quan Không quân Hoa Kỳ gốc Việt qua đời Ông Phan Văn Giang điều động hàng chục ngàn bộ đội đặc công nhằm lật đổ phe cánh ông Tô Lâm
Thất nghiệp tràn lan tại Thành Hồ, dắt chó t́m việc 3 ngày không thành Việt kiều dởm làm màu và Việt kiều “chân chính”: khác nhau ở cái nh́n, không ở hộ chiếu Ông Trump quyết trục xuất 20 triệu người khỏi Mỹ trong năm tới, liệu có thành công?
Chiến lược an ninh mới của Trump: Hạ giọng với Trung Quốc, đặt cược tất tay vào kinh tế và lá bài Đài Loan Kho ảnh mới từ dinh thự Jeffrey Epstein: Bóng dáng giới quyền lực và cuộc đấu Trump – Quốc hội Mỹ Cây chổi cho Donald Trump
Nước Mỹ Trump đang kéo châu Âu đi đâu? Nền kinh tế chữ K: 79 ngàn tỷ đô bị “ăn cắp” khỏi túi người lao động Mỹ Khi Trump “đại tu” FEMA và tấn công các cơ quan độc lập
Ukraine đánh thẳng vào “cây ATM năng lượng” của Nga, NATO cảnh báo: chiến tranh đă ở ngay trước cửa Tyler Robinson lần đầu trực tiếp xuất hiện trước ṭa: Vụ ám sát Charlie Kirk và câu hỏi về thù hận chính trị ở nước Mỹ Chính quyền Trump chính thức mở trang mạng để bán "thẻ vàng định cư"
Ba người Việt bị ICE bắt ở New Orleans: Từ giấc mơ Mỹ đến nguy cơ bị trục xuất Hai anh em sinh đôi trở về Việt Nam t́m mẹ ruột sau 24 năm và người mẹ Mỹ mang trái tim Bồ Tát Cuối năm phố tắt đèn: Cơn sóng trả mặt bằng và tiếng thở dài của tiểu thương
Tin đồn ông Nguyễn Xuân Phúc xin qua Mỹ định cư: Tấm thẻ đảng và cánh cửa di trú Hoa Kỳ Netflix tung đ̣n 28 USD/cổ phiếu: Trận quyết đấu cuối cùng của ‘chiến tranh streaming’? Cơn sốc 50.000 USD: Mua xe mới ở Mỹ sắp thành xa xỉ phẩm?
Làn sóng hủy show Nhật Bản ở Trung Quốc: Khi chính trị tắt đèn sân khấu Măn kinh – chương đời bị bỏ quên của một nửa nhân loại Cuộc họp nội các thật hỗn loạn của ông Trump

 
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

iPad Videos Portal Autoscroll

VietBF Music Portal Autoscroll

iPad News Portal Autoscroll

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

USA News Autoscroll Portall

VietBF WORLD Autoscroll Portal

Home Classic

Super Widescreen

iPad World Portal Autoscroll

iPad USA Portal Autoscroll

Phim Bộ Online

Tin nóng nhất 24h qua

Tin nóng nhất 3 ngày qua

Tin nóng nhất 7 ngày qua

Tin nóng nhất 30 ngày qua

Albums

Total Videos Online
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Tranh luận sôi nổi nhất 7 ngày qua

Tranh luận sôi nổi nhất 14 ngày qua

Tranh luận sôi nổi nhất 30 ngày qua

10.000 Tin mới nhất

Tin tức Hoa Kỳ

Tin tức Công nghệ
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Super News

School Cooking Traveling Portal

Enter Portal

Series Shows and Movies Online

Home Classic Master Page

Donation Ủng hộ $3 cho VietBF
Lên đầu Xuống dưới Lên 3000px Xuống 3000px
Diễn Đàn Người Việt Hải Ngoại. Tự do ngôn luận, an toàn và uy tín. V́ một tương lai tươi đẹp cho các thế hệ Việt Nam hăy ghé thăm chúng tôi, hăy tâm sự với chúng tôi mỗi ngày, mỗi giờ và mỗi giây phút có thể. VietBF.Com Xin cám ơn các bạn, chúc tất cả các bạn vui vẻ và gặp nhiều may mắn.
Welcome to Vietnamese American Community, Vietnamese European, Canadian, Australian Forum, Vietnamese Overseas Forum. Freedom of speech, safety and prestige. For a beautiful future for Vietnamese generations, please visit us, talk to us every day, every hour and every moment possible. VietBF.Com Thank you all and good luck.

Lên đầu Xuống dưới Lên 3000px Xuống 3000px

All times are GMT. The time now is 17:42.
VietBF - Vietnamese Best Forum Copyright ©2005 - 2026
User Alert System provided by Advanced User Tagging (Pro) - vBulletin Mods & Addons Copyright © 2026 DragonByte Technologies Ltd.
Log Out Unregistered

Page generated in 0.15013 seconds with 15 queries