giovedì 8 settembre 2011

AMD Radeon HD 6990...UN MOSTRO TECNOLOGICO

                                        AMD RADEON HD 6990

Introduzione

La fascia enthusiast del mercato delle schede video ha sempre fatto da sfondo ad epiche battaglie, combattute all'ultimo fps. Avere lo scettro delle prestazioni è uno storico traguardo sia per AMD sia per NVIDIA, non tanto per vera e reale utilità, ma per poter mostrare al grande pubblico i muscoli. Con questo primato in mano, le due aziende cercano, di fatto alternandosi, di promuovere l'intera gamma delle proprie soluzioni video. L'arrivo sul mercato delle CPU con grafica integrata, capaci di portare importanti e sensibili miglioramenti rispetto ai normali controller grafici inseriti all'interno dei chipset delle schede madri, rappresenta a oggi un diretto pericolo per il mercato delle schede grafiche.
Il perché è presto detto.
La possibilità di poter fare affidamento su di un unico componente in grado di fornire non solo una normale CPU ma anche un controller video integrato capace di garantire prestazioni sufficienti in un utilizzo normale, va ad erodere in modo diretto il mercato delle schede grafiche di fascia entry-level, segmento che, storicamente, fa registrare i volumi di vendita più elevati. I più recenti dati sulle vendite di schede video discrete rilasciati da Jon Peddie Research evidenziano del resto come nel corso del 2010 siano state vendute meno schede discrete che nel 2009, anno quest'ultimo caratterizzato dalla crisi economica internazionale.
Ecco allora che il segmento più alto del mercato torna ad acquistare importanza: AMD da una parte e NVIDIA dall'altra intendono recuperare le quote perse nella fascia bassa andando a presentare soluzioni per gli utenti enthusiast più interessanti. Le schede video top di gamma sono quelle proposte ai prezzi più alti, tali da assicurare i margini migliori oltre che trainare, con efficaci operazioni marketing, le schede della stessa famiglia posizionate in fasce di prezzo maggiormente accessibili.
AMD Radeon HD 6990, la scheda oggetto della review odierna, va proprio a collocarsi nella fascia più alta del mercato. Con il nuovo modello AMD ripresenta al grande pubblico un approccio che avevamo già avuto modo di vedere in passato e che da oramai 3 generazioni caratterizza le proposte top di gamma: Radeon HD 6990 è infatti una scheda dual-GPU, meglio nota con il nome in codice di Antilles.
La scelta di portare due GPU sullo stesso PCB è uno sviluppo che consente al produttore di poter sfruttare chip già prodotti e rodati, utilizzati su schede di fascia altissima: andando a contenere i consumi, principalmente riducendo le frequenze di funzionamento, è possibile raggiungere livelli prestazionali ancora più elevati, senza dover ingegnerizzare GPU ad hoc.
Le performance dipendono, ovviamente, dal livello di ottimizzazione che AMD o NVIDIA hanno apportato alle rispettive tecnologie Multi-GPU: non tutti i giochi, infatti, sono in grado di sfruttare appieno la presenza di due GPU in parallelo. Ecco allora che il lavoro dei due colossi, in questo caso, dipende direttamente dal livello di scalabilità che le tecnologie multi-GPU sono in grado di garantire, con una forte dipendenza dall'ottimizzazione sviluppata da lato driver.
La possibilità di veder incrementare in modo sensibile le prestazioni semplicemente aggiungendo una seconda GPU, non è però esente da effetti collaterali: come riflessi diretti si hanno, infatti, un maggior assorbimento energetico della soluzione e una maggiore quantità di calore prodotta da dover dissipare in modo efficiente. Ma non solo.
Per capire quali altri tipi di effetti collaterali una soluzione multi-GPU comporti dobbiamo innanzitutto analizzare, brevemente, la tecnologia che viene impiegata per il rendering delle scene video. In presenza di due GPU i frame vengono elaborati in modo alternato: la prima GPU si farà carico dei frame dispari la seconda di quelli pari. Questa tecnologia è denominata AFR (Alternate Frame Rendering). Proprio la necessità di alternare il rendering dei frame comporta uno dei problemi più discussi del mondo multi-GPU: il micro stuttering. Questo termine anglofono indica un ritardo irregolare tra un frame e l'altro, con un conseguente calo del frame rate istantaneo. Questo problema, effetto diretto della tecnologia Multi-GPU e dell'ottimizzazione dei driver, potrebbe comportare in alcuni casi un'esperienza di utilizzo decisamente inferiore alle aspettative.
Della nuova nata Radeon HD 6990, delle sue caratteristiche tecniche e della sua scalabilità andremo a parlare nella pagine a seguire.


Radeon HD 6990, le caratteristiche tecniche

Che ci si trovi di fronte ad una scheda video destinata alla fascia più alta del mercato appare evidente anche solo osservando le dimensioni, identiche a quelle del modello Radeon HD 5970 che di fatto va a sostituire. Se le soluzioni Radeon HD 6950 e 6970, proposte per la fascia medio/alta a alta del mercato risultano particolarmente ingombranti, con Radeon HD 6990 questa caratteristica diventa ancora più problematica. La scheda è ovviamente stata sviluppata con layout a doppio slot e necessita di due connettori da 8 pin per essere alimentata correttamente. Prima di procedere oltre, andiamo ad analizzare le caratteristiche tecniche con cui AMD ha deciso di configurare Radeon HD 6990.

Radeon HD 6950
Radeon HD 6970
Radeon HD 6990
processo produttivo
40nm
40nm
40nm
tipo GPU
Cayman
Cayman
Antilles
clock GPU
800 MHz
880 MHz
830 MHz

numero GPU
1
1
2
numero stream processors
1408
1536
2x1536
clock stream processors
800 MHz
880 MHz
830 MHz

ROPs
32
32
2x32

TMU
88
96
2x96
quantitativo memoria
1.024 - 2.048 MB
2.048 MB
2 x 2.048 MB
tipologia memoria
GDDR5
GDDR5
GDDR5
clock memoria
5.000 MHz
5.500 MHz
5.000 MHz
interfaccia memoria
256bit
256bit
2 x 256bit
connettori alimentazione
2x6pin
1x6pin - 1x8pin
2x8pin
Con lo sviluppo della nuova proposta AMD è partita dalla GPU Cayman utilizzata nella produzione di Radeon HD 6970. L'approccio scelto da AMD è stato quello di mantenere uguale il numero di stream processor, diminunendo però le frequenze di funzionamento. Il motivo di questa scelta è da ricercarsi, ovviamente, nel miglior bilanciamento prestazioni/consumi: per garantire il più elevato livello prestazionale, a parità di consumi, è quindi preferibile aumentare il numero di stream processor piuttosto che spingere le frequenze di funzionamento.
Ecco allora che il computo complessivo degli stream processor sale a 3072 (1536 x 2) ma la frequenza operativa scende da 880MHz a 830MHz per la GPU e da 5500MHz a 5000MHz per le memorie. Invariati invece il quantitativo di memoria e le dimensioni del bus, sempre rispettivamente di 2GB e di 256bit per GPU. Di fatto le specifiche di Radeon HD 6990, considerando una singola GPU, sono a metà strada tra quelle di Radeon HD 6970 e Radeon HD 6950: della seconda troviamo bus memoria e frequenza di clock dei moduli DDR5, mentre della prima il numero di stream processors integrati con una frequenza di clock a metà strada tra le due proposte.
Sfruttando la funzionalità dual-BIOS introdotta con i due ultimi modelli di schede video Radeon HD 6950 e HD 6970, AMD ha deciso di rendere le operazioni di overclocking ancora più semplici di quanto già non lo siano. Di fatto, lo switch che permette di passare da una versione Bios all'altra, inizialmente introdotto per permettere agli utenti appassionati di tornare alla versione di Bios originale in caso di malfunzionamenti dopo aver cambiato le impostazioni, diventa ora una sorta di "pulsante turbo".
AMD ha infatti impostato sul secondo Bios delle frequenze di funzionamento più elevete, che permettono, laddove lo scenario lo richieda, di garantire prestazioni ancora più elevate. In tabella le differenze in termini di MHz:

Radeon HD 6990
Radeon HD 6990 OC
clock GPU
830 MHz
880 MHz
clock stream processors
830 MHz
880 MHz
tensione GPU
1.12V
1.175V
clock memoria
5.000 MHz
5.000 MHz
Consumo massimo
375 W
450 W
L'incremento delle frequenze di funzionamento riguarda solo quella della GPU: si passa dagli 830 agli 880MHz del secondo BIOS, pareggiando in questo le specifiche della scheda Radeon HD 6970 dal versante GPU. Ad un incremento della frequenza di clock di 50 MHz per ciascuna delle due GPU corrisponde un aumento del consumo massimo della scheda, che passa da 375 Watt a 450 Watt. Quest'ultimo valore è, quantomeno teoricamente, il picco massimo della scheda: ogni connettore di alimentazione PCI Express a 8 pin fornisce infatti 150 Watt quale massimo, che si vanno a sommare ai 150 Watt assicurati dallo slot PCI Expresss 16x Gen 2 con il quale la scheda è collegata alla motherboard.
Nel corso dei test abbiamo testato la scheda con entrambe le configurazioni del bios; AMD non ha fornito informazioni chiare e univoche a riguardo ma riteniamo che l'impostazione OC, con frequenza di clock della GPU portata a 880 MHz, sia considerata un overclock di default e pertanto all'interno dei limiti della garanzia fornita dal produttore e dai partner commerciali. Il livello di consumo massimo in configurazione overclock, come abbiamo segnalato, raggiunge i 450 Watt ed è teoricamente compatibile solo con schede madri che siano dotate di connessione PCI Express 16x di tipo Gen 2; nel caso dell'impostazione standard i 375 Watt di consumo massimo sono compatibili, sempre teoricamente, con configurazioni PCI Express Gen 1 capaci di fornire un massimo di 75 Watt per l'alimentazione della scheda. E' evidente come con questa configurazione AMD si sia spinta al limite massimo, approccio che crediamo verrà seguito da NVIDIA con la propria proposta dual GPU concorrente, modello GeForce GTX 590.

Radeon HD 6990 vista da vicino

Radeon HD 6990 è una soluzione dual-GPU e come tale si trova a dover fronteggiare un problema su tutti: la grande produzione di calore durante il funzionamento. Ecco allora che il layout studiato da AMD mira principalmente a garantire la massima e migliore areazione possibile alle due GPU posizionate sul PCB.
Osservando la scheda frontalmente è possibile notare come, nonostante il design ricordi direttamente le classi che soluzioni AMD, la ventola sia stata spostata dalla parte posteriore al centro. Il motivo è legato, ovviamente, alla posizione delle due GPU sul PCB: in questo modo la ventola è in grado di spostare aria fredda su entrambi i processori, migliorando il raffreddamento. L'aria viene spostata consì in entrambe le direzioni, uscendo sia dalla griglia posizionata frontalmente, sia dal lato posteriore della scheda. Montando una scheda di questo tipo all'interno di uno chassis diventa fondamentale controllare che l'intera areazione del sistema sia ottimizzata: parte dell'aria calda rientra nello chassis, spostandosi nella sua parte superiore.
Le connessioni video messe a disposizione dalla soluzione Radeon HD 6990 sono cinque: oltre al classico DVI Dual link è possibile notare quattro uscite mini DisplayPort 1.2. Le connessioni sono state disposte sulla sola parte bassa della staffa di montaggio per un semplice motivo: garantire la massima estrazione di aria calda dal radiatore della scheda. Grazie al parco connessioni la nuova soluzione di AMD permette di poter pilotare fino a 5 monitor in abbinamento alla tecnologia Eyefinity.
Il sistema di raffreddamento adottato da AMD si compone di diversi elementi, ben evidenziati nello schema sopra proposto. Identificato dal numero 1 troviamo la placca posteriore, che si occupa non solo di andare a raffreddare passivamente il PCB ma anche i moduli di memoria. Il secondo elemento prevede nuova pasta termoconduttiva tra GPU, memorie e placca di dissipazione, in grado di risultare l'8% più performante rispetto alle precedenti soluzioni reference sviluppate da AMD stessa. Al terzo punto invece troviamo una doppia vapor chamber: questa tecnologia, da tempo sfruttata daSapphire per la creazione della propria famiglia VaporX, si rivela fondamentale per favorire un corretto raffreddamento delle GPU. Il quarto e ultimo punto mette in evidenza invece come, nonostante il form factor sia lo stesso utilizzato per lo sviluppo di Radeon HD 5970, il flusso d'aria sia invece superiore del 20%.

Radeon HD 6990, le peculiarità

Durante lo sviluppo di Radeon HD 6990 AMD ha mantenuto una delle tecnologie introdotte con le GPU Cayman (Radeon HD 6950 e 6970): PowerTune. Con questo nome viene identificata la funzionalità che permette di ottimizzare il livello consumo complessivo in funzione del tipo di applicazione utilizzata e del carico lavoro cui la scheda è sottoposta.
Dal punto di vista pratico la tecnologia PowerTune blocca il TDP della scheda grafica ad un valore predeterminato: una logica dedicata si occupa di analizzare in tempo reale la GPU, scandagliando il carico di lavoro. Attraverso un algoritmo dedicato si calcola il livello di consumo complessivo della scheda, in modo che questo rimanga entro la soglia massima di TDP selezionato.
Ogni singola applicazione genera un livello di consumo sulla scheda video che può essere molto differente, a seconda del tipo di risorse che vengono utilizzate; da questo un consumo istantaneo che può essere ben inferiore rispetto a quello massimo assicurato dalla soglia di TDP predefinita per la specifica scheda. E' stato proprio alla luce di questo principio che AMD ha sviluppato PowerTune, potendo sia sfruttare i margini a disposizione della scheda nell'esecuzione di una specifica applicazione prima che questa raggiunga il proprio TDP massimo sia contenendo le frequenze di clock in presenza di un'applicazione che porti il consumo complessivo oltre la soglia di TDP.
Applicata su Radeon HD 6990 PowerTune consente di avere una scheda grafica con TDP superiore ai 300W ma capace di risultare particolarmente efficiente in scenari videoludici.
struttura.jpg (47761 bytes)
L'immagine sopra riportata mostra l'approccio costruttivo che AMD ha deciso di applicare durante lo sviluppo di Radeon HD 6990. Le due GPU, posizionate ai lati del PCB sono facilmente identificabili e vengono evidenziate dai due rombi gialli. Al centro è invece possibile identificare la nuova circuiteria di alimentazione introdotta con Radeon HD 6990: si tratta di due circuiti di alimentazione Volterra capace di gestire fino a 450W, risultando però più efficienti e con temperatura di funzionamento inferiore rispetto a quanto implementato in precedenza in Radeon HD 5970.
Immediatamente sopra lo slot PCI Express, accanto alla GPU di sinistra, possiamo notare il bridge PCI Express PLX, responsabile del bilanciamento del segnale PCI Express tra le due GPU e del collegamento tra queste ultime e la scheda madre via slot 16x.


Per analizzare le prestazioni delle schede video in prova abbiamo utilizzato una piattaforma basata su processore Intel Core i7 975 Extreme, con frequenza di clock di default pari a 3,33 GHz portata a 3,73 GHz via incremento del moltiplicatore di frequenza. La tecnologia Turbo Boost è stata disabilitata, facendo quindi in modo che la frequenza di clock della CPU sia sempre fissa sui 3,73 GHz preimpostati da bios.
Di seguito il dettaglio dei componenti utilizzati per i test:
  • Processore: Intel Core i7 975 Extreme, frequenza di clock portata a 3,73 GHz via incremento del moltiplicatore di frequenza sino a 28x;
  • memoria RAM: 3x2 Gbytes Corsair TR3X6G1600C8D; frequenza di clock 1.600 MHz con timings pari a 9-9-9-20 1T;
  • Hard disk: Western Digital WD7500AAKS, 750 Gbytes SATA 7.200 rpm;
  • Scheda madre: MSI Eclipse SLI, chipset Intel X58;
  • Sistema operativo: Windows 7 Ultimate 64bit, con tutti i più recenti fix rilasciati da Microsoft;
  • Driver video NVIDIA: Forceware 266.66 - 266.58
  • Driver video AMD: Catayst 11.1 - 11.2_cap3;
  • Alimentatore: ToPower 1.100 Watt.
Di seguito le schede video utilizzate nella recensione:
  • SLI NVIDIA GeForce GTX 580: clock GPU 772 MHz; 512 stream processors @ 1.544 MHz; 1.536 Mbytes memoria GDDR5 @ 4.008 MHz su bus a 384bit
  • NVIDIA GeForce GTX 580: clock GPU 772 MHz; 512 stream processors @ 1.544 MHz; 1.536 Mbytes memoria GDDR5 @ 4.008 MHz su bus a 384bit
  • SLI NVIDIA GeForce GTX 570: clock GPU 732 MHz; 480 stream processors @ 1.464 MHz; 1.280 Mbytes memoria GDDR5 @ 3.800 MHz su bus a 320bit
  • NVIDIA GeForce GTX 570: clock GPU 732 MHz; 480 stream processors @ 1.464 MHz; 1.280 Mbytes memoria GDDR5 @ 3.800 MHz su bus a 320bit
  • NVIDIA GeForce GTX 560 Ti: clock GPU 822 MHz; 384 stream processors @ 1.644 MHz; 1.024 Mbytes memoria GDDR5 @ 4.008 MHz su bus a 256bit
  • NVIDIA GeForce GTX 460: clock GPU 675 MHz; 336 stream processors @ 1.350 MHz; 1.024 Mbytes memoria GDDR5 @ 3.600 MHz su bus a 256bit
  • AMD Radeon HD 6990 OC: clock GPU 880 MHz; 3072 stream processors @ 880 MHz; 4 Gbytes memoria GDDR5 @ 5.000 MHz su bus a 256bit
  • AMD Radeon HD 6990: clock GPU 830 MHz; 3072 stream processors @ 830 MHz; 4 Gbytes memoria GDDR5 @ 5.000 MHz su bus a 256bit
  • CrossFire AMD Radeon HD 6970: clock GPU 880 MHz; 1536 stream processors @ 880 MHz; 2 Gbytes memoria GDDR5 @ 5.500 MHz su bus a 256bit
  • AMD Radeon HD 6970: clock GPU 880 MHz; 1536 stream processors @ 880 MHz; 2 Gbytes memoria GDDR5 @ 5.500 MHz su bus a 256bit
  • CrossFire AMD Radeon HD 6950: clock GPU 800 MHz; 1408 stream processors @ 800 MHz; 2 Gbytes memoria GDDR5 @ 5.000 MHz su bus a 256bit
  • AMD Radeon HD 6950: clock GPU 800 MHz; 1408 stream processors @ 800 MHz; 2 Gbytes memoria GDDR5 @ 5.000 MHz su bus a 256bit
  • AMD Radeon HD 6950: clock GPU 800 MHz; 1408 stream processors @ 800 MHz; 1 Gbyte memoria GDDR5 @ 5.000 MHz su bus a 256bit
  • AMD Radeon HD 6870: clock GPU 900 MHz; 1120 stream processors @ 900 MHz; 1 Gbyte memoria GDDR5 @ 4.200 MHz su bus a 256bit
Questi i titoli inseriti in questo confronto, con le differenti configurazioni utilizzate:
  • Far Cry 2Test eseguiti con impostazioni qualitative in very high, per tutte le voci, utilizzando le API DirectX 10, con anti aliasing 4x e 8x.
  • Tom's Clancy HAWX 2 Benchmark integrato nel gioco, utilizzato in versione demo, eseguito selezionando tutte le impostazioni qualitative su high. I test sono stati eseguiti con API DirectX 10.1 con anti aliasing 4x e 8x abilitato.
  • Just Cause 2Abbiamo utilizzato il benchmark chaos integrato nella versione demo nel gioco, selezionando anti aliasing 4x, filtro anisotropico 16x. Le impostazioni qualitative selezionate sono state tutte portate su high, fatta eccezione per il SSAO che è stato disabilitato.
  • Mafia 2Per questo titolo è stata utilizzata la versione demo, selezionando il benchmark integrato con la qualità grafica più elevata. L'anti aliasing non funziona correttamente e per questo motivo è stato disabilitato.
  • Alien Vs PredatorIl benchmark che sfrutta l'engine di questo gioco è stato eseguito selezionando impostazione high per qualità delle texture e delle ombre, filtro anisotropico 16x, anti aliasing 2x e anti aliasing 4x, tessellation abilitata, advanced shadow sampling e SSAO disabilitati; API DirectX 11.
  • Metro 2033E' stato utilizzato il benchmark integrato, abilitando le API DX11, impostazioni qualitative tutte su livello high; anti aliasing disattiva e a 4x, anis 16x e DOF off.
  • F1 2010
    Il popolare e recente simulatore di guida è stato eseguito impostanto tutti i parametri di configurazione alla qualità massima, attivando i filtri anti aliasing 4x
I grafici sono stati generati ordinando i risultati dal più alto al più basso, prendendo quale riferimento la risoluzione di 1920x1200 pixel salvo diversamente specificato. Il limitato numero di schede inserite è legato a due motivi: il primo, una semplice scelta redazionale al fine di rendere più chiara e comprensibile possibile la comparativa, il secondo legato invece ai cambiamenti effettuati alla piattaforma di test e alle impostazioni dei benchmark eseguiti.
Abbiamo inserito nel confronto anche alcune configurazioni multi GPU con due schede. Ci siamo limitati alle configurazioni SLI e CrossFireX che è stato possibile avere a disposizione in redazione in tempo utile per la pubblicazione in questo articolo: la scheda Radeon HD 5970, vecchia proposta dual-GPU di AMD non è stata inserita nell'analisi perché è stato impossibile riuscire a recuperarne un esemplare. Aneddoto dietro le quinte: la scheda fornitaci a suo tempo da AMD ha smesso di funzionare da tempo e non è stato possibile trovarne una sostitutiva in tempo utile.


HwUpgrade

Nessun commento:

Posta un commento