Intel Sandy Bridge-E, esplorando Core i7-3960X

Dopo tre anni Intel propone un aggiornamento per la piattaforma high-end estremizzando l'architettura Sandy Bridge. Le CPU che ne derivano continuano ad essere troppo costose, ma comunque senza rivali
Dopo tre anni Intel propone un aggiornamento per la piattaforma high-end estremizzando l'architettura Sandy Bridge. Le CPU che ne derivano continuano ad essere troppo costose, ma comunque senza rivali

Dopo circa tre anni di onorato servizio delle piattaforme socket LGA 1366, Intel manda in pensione le CPU Core i7 basate su architettura Nehalem per sostituirle le nuove soluzioni Sandy Bridge-E delle quali oggi vengono svelati i primi due modelli.

A differenza dell’architettura delle CPU Core i7 Nehalem presentate alla fine del 2008 (Bloomfield), quella di Sandy Bridge-E rappresenta poco più di un’evoluzione della famiglia Sandy Bridge che ben conosciamo ormai da un anno e sulla quale Intel ha realizzato le sue ultime CPU di fascia media. I piani iniziali del produttore erano un po’ più ambiziosi di quanto poi lo stesso sia riuscito davvero a proporre: i meglio informati non hanno tardato a definire quelli che vedremo oggi solo un primo assaggio della nuova famiglia high-end mentre le “vere CPU Sandy Bridge-E” arriveranno solo nel 2012.

Fatte salve le congetture, quello che è certo è che la piattaforma attuale, composta da una scheda madre con chipset X79 e da una CPU Sandy Bridge-E, prevede ancora un cambio di socket sottolineando, se ce ne fosse il bisogno, una duplice volontà di Intel: in primo luogo quella di offrire un sistema che in nessun modo debba scendere a compromessi dove la scheda madre è capace di trarre il massimo dalla CPU ed in secondo luogo quella di tenere ben distinti i modelli di fascia alta da quelli di fascia media e bassa.


Sandy Bridge-E è nella stessa casella di Sandy Bridge

Altra differenza importante con chi l’ha preceduta è da ricercare nel maggior grado di integrazione di Sandy Bridge-E e nel processo produttivo. Oltre alla logica di CPU, Nehalem è stata la prima architettura di Intel ad integrare un memory controller. Sandy Bridge-E si spinge oltre rispettando quello che la sua stirpe impone e, oltre ad un più avanzato supporto alle memorie, prevede un controller PCI Express e tutta l’elettronica solitamente appannaggio del chip northbridge. Questo porta ad una piattaforma dual chip ove i principali componenti sono rappresentati dalla CPU e dal southbridge, diversa da quella a tre chip di Nehalem con scheda madre costruita su uno schema tradizionale con northbridge e southbridge.


Intel Core i7 LGA 2011

Come avrete intuito oggi è anche la giornata della consacrazione del chipset X79 e di conseguenza di tutta una serie di nuove schede madri proposte dai maggiori produttori taiwanesi e dalla stessa Intel. Nelle settimane passate fra annunci ufficiali e notizie ufficiose delle nuove schede madri possiamo dire di conoscere praticamente tutto, in barba a qualunque accordo di non divulgazione (tanto per la cronaca, da noi firmato in duplice copia). Ma ormai appare chiaro che la strategia di tutti i player del mercato high-tech sia quella di restare sempre sulla cresta dell’onda ed il fornire ogni tanto qualche bocconcino all’affamato pubblico – talvolta anche per mettere riparo alla fuga involontaria di notizie – garantisce che il proprio nome non venga dimenticato.


La confezione della scheda madre Intel DX79SI (Siler)

L’offerta appare come sempre molto allettante ma i prezzi a cui vengono proposte le nuove CPU di fascia alta non sono da meno. 990 dollari per il modello “non plus ultra” e 555 dollari per quello giusto un gradino al di sotto. Sandy Bridge-E deriva la sua architettura direttamente da quella di Sandy Bridge così come il processo produttivo (per questo vi rimandiamo ad un nostro precedente articolo ). In tal senso dunque le novità non sono molte seppure non mancano interessanti spunti.

Le nuove CPU high-end saranno disponibili con architettura a 4 e 6 core , capaci di gestire fino ad 8 o 12 thread grazie alla tecnologia Intel Hyper-Threading che già ben conosciamo. Nota è anche la tecnologia Intel Turbo Boost 2.0 sulla quale non ci sono stati interventi particolari mentre un’interessante upgrade è stato operato nei confronti del sistema delle cache e delle memorie. Nel primo caso introducendo modelli con cache L3 fino a 15MB , nel secondo utilizzando controller quad-channel compatibile (ufficialmente) con memorie DDR3 fino a 1600MHz (le schede madri di tutti i produttori che abbiamo visto offrono tutte supporto per memorie almeno fino 2133MHz).

Altra novità è nel supporto integrato alle linee PCI Express: non che questo non fosse già presente nell’architettura Sandy Bridge ma con le nuove CPU Intel riesce a fornire 40 linee compatibili con lo standard PCI Express 3.0 : diciamolo comunque sottovoce perché Intel ancora non se la sente di ufficializzare appieno tale supporto in quanto non ha ancora potuto effettuare test esaustivi per mancanza di periferiche compatibili.


Novità di Sandy Bridge-E, PCIe 3.0 solo sussurrato

Come da tradizione Intel non poteva mancare il supporto specifico per le istruzioni AVX ed AES ed ai set SSE4.1 ed SSE4.2. Il socket LGA 2011, come già detto, è un’ulteriore novità che in questo caso è ulteriormente giustificata dalla necessità di avere a disposizione un elevato numero di pin per il routing dei segnali che arrivano dai connettori delle memorie.

Infine Intel ha lavorato molto anche per soddisfare le necessità di gli utenti che hanno la passione dell’overclock con modelli dotati di moltiplicatore sbloccato, maggiore flessibilità nella gestione delle memorie e, finalmente, una prima soluzione alle refrattarietà alla modifica della frequenza di bus di tutte le piattaforme Sandy Bridge, compresa quella basata su chipset Z68.


Specifiche tecniche


Specifiche CPU Sandy Bridge-E Core i7-3960X


Specifiche cache della CPU Sandy Bridge-E Core i7-3960X

Effettuando un confronto diretto con alcune CPU rappresentative possiamo osservare come Sandy Bridge-E, almeno nella sua declinazione a 6 core, necessiti di un numero di transistor decisamente elevato. Gulftown, soluzione anch’essa a 6 core capace di gestire fino a 12 thread indipendenti, ne utilizza appena 1,17 miliardi, lo stesso numero delle CPU Sandy Bridge (che però sono modelli quad-core). Solo AMD con le sue soluzioni Bulldozer a 8 core è posizionata sugli stessi numeri.

Lo stesso possiamo dire anche dell’area occupata dal die che risulta essere pari a 435 mm quadrati per SBE, all’incirca il doppio di quella occupata da Sandy Bridge e da Gulftown.


Diagramma a blocchi del die delle CPU Sandy Bridge-E

Numeri così importanti stupiscono soprattutto se confrontati con quelli delle CPU Gulftown che all’esterno appaiono non troppo dissimili da quella di Sandy Bridge-E. Certo la cache L3 più corposa influisce e non poco (basti vedere il diagramma a blocchi per capire quanto spazio è dedicato ad essa), ma dai 12MB di Gulftown ai 15MB di SBE c’è solo un 25 percento in più che complessivamente potrebbe tradursi in un aumento del numero di transistor pari al 7-10 percento). Un’altra parte la potremmo imputare al controller delle memorie ma crediamo si possa parlare di pochi punti percentuali, gli stessi che possiamo attribuire anche alla presenza di un controller PCI Express (questo manca del tutto in Gulftown e più in generale in tutte le architetture Nehalem). Insomma, volendo semplicemente parlare di ordini di grandezza sarebbe ragionevole pensare ad un incremento massimo del numero di transistor del 50 percento rispetto a Gulftown, non di più.

Possiamo provare a partire da altri punti fermi e vedere dove ci porta questo ragionamento. Visto che Sandy Bridge-E deriva esattamente da Sandy Bridge, vediamo quali sono le differenze sostanziali che implicano un aumento del numero di transistor. La cache L3 passa da 8MB a 15MB il che potrebbe influire per un 20 percento circa sul numero di transistor. Il controller delle memorie ed il controller PCI Express più complessi possono portare ulteriori incrementi del 10 percento mentre la presenza di due core in più può influire per un altro 20 percento. A tutto questo dobbiamo però sottrarre lo spazio occupato dal controller grafico che non è presente su Sandy Bridge-E mentre lo troviamo su Sandy Bridge.

Intel ha sbagliato a fare i conti o c’è qualcosa che dovremmo sapere? Guardando il diagramma a blocchi, in effetti, non passano inosservati un paio di core dormienti : Sandy Bridge-E è dunque un’architettura a 8 core, usata con un massimo di 6 core e frequenze di funzionamento elevate nel caso di sistemi desktop ed in configurazione con un massimo di 8 core nelle sue versioni server dove le frequenze risultano essere più contenute. Tutto questo “solo” per rimare all’interno di un adeguato valore di TDP. Le nuove CPU saranno indicate dal marchio Core i7 3xxx con una lettera finale che ne rappresenta la variante. Vediamo un esempio di come è stato costruito il nome.


Nomenclatura CPU Sandy Bridge-E

  • Core i7 : rappresenta la famiglia ed in questo caso indica modelli high-end
  • 3 : indica la generazione seppure in questo caso c’è una anomalia. Sandy Bridge-E non è la terza generazione di CPU Core bensì la seconda (vi ricordo che essa è solo un’evoluzione di Sandy Bridge)
  • 960 : indica il modello all’interno di una determinata generazione. Più alto è tale numero, maggiori sono le prestazioni che ci si aspetta dalla CPU
  • X : la lettera alla fine rappresenta la variante ed indica esattamente quali sono le feature di cui quel determinato modello dispone. Queste sono le tre possibilità:
    • X : sta per Extreme Edition ed indica soluzioni top di gamma completamente sbloccate in termini di moltiplicatori e feature legate all’overclock
    • K : pur rimanendo in linea con l’anima da overclocker dei fratelli con la X, deve rinunciare a qualcosa come ad esempio l’ampia dotazione di memoria cache
    • Nessuna lettera : si tratta di modelli che offrono limitate possibilità di modifica in quanto a overclock (moltiplicatori bloccati) oltre alla mancanza di alcune feature accessorie


Elenco processori

I modelli Sandy Bridge-E che Intel mostra oggi sono due ed entrambi sono basati su architettura a 6 core: si tratta del Core i7-3960X e del Core i7-3930K . Inizialmente erano previsti tre modelli salvo poi spostare agli inizi del 2012 la soluzione quad-core Core i7-3820 .

Le loro caratteristiche prevedono l’utilizzo del socket LGA 2011, la presenza delle tecnologie Hyper Threading e Turbo Boost, un controller delle memorie quad-channel compatibile con moduli DDR3 1066, 1333 e 1600 funzionanti a 1,5V ed un controller PCI Express 3.0. In comune i tre nuovi Core i7 hanno anche il TDP pari a 130W.

Il modello di punta 3960X (990 dollari), lo stesso che abbiamo a disposizione per i nostri test, ha una frequenza di funzionamento 3,3GHz che può salire fino a 3,9GHz (quando sono utilizzati uno o due core) grazie alla tecnologia Turbo. La cache L3 è di ben 15MB ed il moltiplicatore è completamente sbloccato. Il modello immediatamente successivo, Core i7 3930K (555 dollari), ha una frequenza di 3,2GHz, frequenza massima in modalità Turbo di 3,8GHz ed una cache L3 ridotta a 12MB. Moltiplicatori sbloccati anche in questo caso.

Infine, il Core i7-3820 che fa capo ad un’architettura quad-core e prevede una frequenza nominale più elevata degli altri due modelli, pari a 3,6GHz, frequenza Turbo di 3,9GHz, 10MB di cache L3 e moltiplicatori solo parzialmente sbloccati (probabilmente questo significa poter agire sui moltiplicatori solo attraverso la tecnologia Turbo Boost).


La CPU Core i7-3960X

Con queste CPU Intel mantiene fede alle scelte di dissipazione e packaging fatte in precedenza. Molte sono le somiglianze con le soluzioni della famiglia Core di seconda generazione, tranne le dimensioni.


La CPU Core i7-3960X vista da sotto

Guardando la CPU dal lato dei pin notiamo ancora molte somiglianze: i contatti sono di forma allungata e presenti solo in un’ampia zona periferica lasciando così spazio al centro (ove è posizionato il die) per alcuni componenti passivi.


CPU a confronto

Le dimensioni della nuova CPU Intel sono davvero notevoli, superiori sia a quelle dei modelli Sandy Bridge socket LGA 1155 che a quelle delle CPU AMD AM3+, compresi i modelli Bulldozer. A supporto delle CPU Sandy Bridge-E, Intel ha rilasciato il nuovo chipset X79 che per ora resta l’unico compatibile. Il chipset è stato già preso come base per la realizzazione di numerosi modelli di schede madri tanto da parte dei produttori first tier che di quelli meno importanti.


Il chipset Intel X79

Il chipset X79 deve occuparsi solo ed esclusivamente dei tipici compiti affidati al tradizionalmente al southbridge visto che la CPU integra già tutto il necessario per rispondere alle richieste di gestione delle memorie e dei dispositivi PCI Express.

Dal diagramma a blocchi del chipset X79 emerge che lo stesso è in grado di gestire 14 porte USB 2.0, una connessione Gigabit LAN, audio Intel HDA e sei porte per dispositivi di storage di cui due Serial ATA 3.0 e quattro Serial ATA 2.0. Opzionalmente i produttori di schede madri possono integrare il supporto alla Intel Rapid Storage Technology (RAID) mentre è compreso il supporto per la tecnologia Extreme Tuning che permette di overcloccare il sistema direttamente da Windows. La connessione fra CPU e chipset avviene mediante un bus DMI (Direct Media Interface) di seconda generazione che supporta un link PCI Express 1.0 o 2.0 a quattro linee per una banda complessiva massima di 20Gbit/s.


Il chipset

Così presentato il chipset X79 è esattamente identico al modello Z68 già impiegato nelle piattaforme LGA 1155. Nessuna novità sul fronte USB 3.0 e manca ancora un supporto esteso allo standard Serial ATA 3.0 (solo due delle sei porte SATA sono compatibili con lo standard di ultima generazione). Da questo punto di vista le proposte di AMD sono decisamente superiori.

Per quel che concerne il supporto PCI Express le nuove CPU integrano un controller a 40 linee compatibile con la revisione 3.0 dello standard, il che significa il poter raggiungere una banda di 8GT/s per linea. Le 8 linee aggiuntive supportate dal chipset sono invece compatibili con lo standard 2.0.

La scheda madre proposta da Intel a supporto delle CPU Sandy Bridge-E prende il nome di DX79SI o Siler e funge, oltre che da prodotto finale disponibile sul mercato, anche da punto di riferimento per gli altri produttori.


La scheda madre Intel DX79SI

Come la CPU, il socket LGA 2011 che la ospita ha un ingombro molto elevato. Viste le dimensioni Intel è stata costretta ad ideare un sistema di fissaggio che non lasciasse spazio a possibili falsi contatti fra i pad della CPU ed i pin del socket. Per questo sono presenti due leve contrapposte che permettono alla CPU di restare perfettamente in linea con il piano della scheda madre.


Il socket LGA 2011

La disponibilità di un controller quad-channel apre le porte a schede madri dotate di 8 slot per memorie DDR3 (due slot per ogni canale). Intel ha fatto proprio una scelta simile per la scheda madre DX79SI ma come vedete dalla foto gli slot sono posizionati per metà a destra e per metà a sinistra del socket. La motivazione non è certamente da ricercare nella volontà di garantire una qualche sorta di par condicio , bensì nel ridurre al minimo possibile il percorso dei dati che dalle memorie viaggiano verso la CPU e di conseguenza tenere basse le latenze (posizionando tutti gli slot su un singolo lato la lunghezza dei percorsi fra il primo e l’ottavo sarebbe talmente elevata da non poter garantire in maniera semplice il raggiungimento delle stesse prestazioni).

Allo stesso principio si sono ispirati anche tutti gli atri produttori di schede madri. Alcuni hanno però scelto di integrare solo 4 slot a garanzia di uno spazio maggiore attorno al socket che permettesse di installare anche dissipatori ad aria o a liquido di una certa dimensione.


Il socket e gli slot di memoria

Una così buona disponibilità di linee PCI Express non si era mai vista per una piattaforma Intel. Quelle basate su CPU Sandy Bridge-E con chipset X79 possono contare ben 48 linee e questo permette di realizzare configurazioni a due o più VGA. In particolare la scheda madre DX79SI prevede tre slot PCI Express 3.0 x16, di cui i primi due dotati di 16 linee ciascuno ed il terzo di 8 linee (ricordiamo che a parità di numero di linee rispetto allo standard PCI Express 2.0 la banda dati del PCI Express 3.0 è doppia).


Gli slot di espansione

Per eseguire i test sulle CPU abbiamo rispettato le seguenti regole:

  • Sulla scheda sono stati installati solo i componenti necessari: CPU, Memoria, Scheda video e Hard disk.
  • L’hard disk è stato formattato, sono stati poi installati il sistema operativo, i driver per le periferiche e, quando necessario, sono state installate patch e aggiornamenti.
  • Ogni test è stato ripetuto per tre volte e, se i risultati di qualche test si mostrano troppo lontani dalla media (elevata varianza), il test stesso è stato di nuovo ripetuto, scartando il risultato non corretto.
  • Alla fine di ogni sessione di prova l’hard disk è stato formattato.

In merito ai sistemi di prova, ci siamo serviti di differenti piattaforme a seconda del tipo di CPU. Ciò è stato necessario per ottenere un sistema funzionante per ogni tipo di Socket che le CPU utilizzate per la nostra comparazione utilizzano. Ovviamente si è cercato di realizzare i sistemi con componenti simili, quando possibile, uguali.


Sistemi di prova

I test eseguiti sono descritti qui di seguito:

Benchmark sintetici

  • Fritz Chess Benchmark : questo è un tool che misura la potenza del processore di sistema utilizzando il motore per la creazione di giochi di scacchi “Fritz 9 engine”. Il risultato del test è espresso in nodi per secondo medi. Il software è fortemente ottimizzato per girare in ambienti multicore ed è capace di attivare fino ad 8 thread contemporaneamente.
  • ScienceMark 2.0 : grazie a ScienceMark è possibile misurare le prestazioni del sistema in ambiente di calcolo spinto. Inoltre il software misura le prestazioni della memoria di sistema e della cache integrata nella CPU.
  • SiSoft SANDRA 2010 : questa suite di benchmark sintetici ci offre un quadro specifico delle prestazioni di ogni componente disponibile all’interno della piattaforma di test come memorie, CPU, disco fisso e così via.

Grafica 3D

  • 3DMark06 (versione 1.1.0 Professional) : ci permette di valutare le prestazioni grafiche 3D offerte dal sistema. Nel suo computo sono inclusi, in particolare, la CPU, la memoria di sistema ed il controller grafico.
  • World In Conflict (RTS): si tratta di uno strategico in tempo reale, che unisce a questo tipo di giochi una visuale simile a quella degli sparatutto in prima persona e che fa degli effetti particellari e della fisica le sue armi migliori.
  • Crysis: uno dei più indicativi titoli 3D DirectX 10 per effetti grafici e per l´utilizzo della fisica.

Utilizzo generico

  • PovRay (versione 3.6) : il tool Persistence of Vision Raytracer (PovRay) permette di creare grafica tridimensionale di elevata qualità. Al suo interno troviamo una scena standard creata proprio per effettuare benchmark sulla CPU che sfrutta la maggior parte delle feature disponibili con questo software. Per rendere ripetibili i nostri test utilizziamo sempre le impostazioni di default del file.ini .
  • Cinebench (versione 10 e versione 11) : suite di test multi-piattaforma basato sul software di animazione CINEMA 4D ampiamente utilizzato da studi e case di produzione per la creazione di contenuti 3D. Grazie ad esso possiamo valutare le performance del sottosistema CPU seppure l’influenza di chipset, memorie e scheda grafica installate nel sistema non può essere trascurata. Il software esegue un test di rendering capace di sollecitare uno o tutti i core del processore disponibili.
  • 7-Zip (versione 9.15 beta) : con questo noto software di compressione dati eseguiamo due diversi benchmark. Il primo viene realizzato utilizzando il tool integrato che restituisce una indicazione sui MIPS (million instructions per second) che il sistema è in grado di offrire (potete confrontare i risultati ottenuti con quelli ufficiali e con quelli del vostro sistema). Il secondo invece prende in considerazione una situazione reale nella quale viene richiesto al sistema di comprimere in formato 7z una cartella da 5,36GB contenente 4.379 file di diversa dimensione e tipologia (immagini, testo, html, video, foto, applicazioni) e 536 sottocartelle e poi di decomprimere la stessa. L’operazione di compressione ha una forte dipendenza dalla memoria cache della CPU e dalla memoria RAM installata nel sistema. Quella di estrazione dipende molto, invece, dalla capacità della CPU di gestire le operazioni su interi. In tutti i casi, il software sfrutta abbastanza bene tutte le risorse (core) di CPU a disposizione.
  • Auto Gordian Knot (versione 2.55) : software utile per effettuare backup di DVD o comunque operazioni di transcodifica video nei formati DivX ed XviD. Per le nostre prove utilizziamo il codec XviD che il tool installa di default ed eseguiamo il ripping di un completo DVD (Codice Swordfish) che per l’occasione abbiamo memorizzato su un disco fisso e lo “comprimiamo” in modo da farlo entrare su due CD.
  • Handbrake (versione 0.9.4) : un software di transcodifica video open source multipiattaforma e multithreaded con il quale effettuiamo una conversione video di un intero DVD (Codice Swordfish) in formato adatto per i dispositivi Apple iPod, iPhone e iPad.
  • DaCapo (versione 9.12) : questa suite di benchmark permette di valutare il comportamento del sistema quando si utilizzano tool di sviluppo per Java. Esso include tutta una serie di applicazioni reali open source fra cui Tomcat, FOP, Eclipse, Batik, Xalan e altri. Nel nostro caso riportiamo il tempo complessivo necessario all’esecuzione di tutti i test.

La tecnologia Turbo Boost è la stessa che abbiamo conosciuto con le prime soluzioni della famiglia Sandy Bridge: questa permette di incrementare automaticamente la frequenza di lavoro della CPU rispetto al valore di default in base a quanto consentito dal carico di lavoro istante per istante. Se sulla CPU insistono compiti tali per cui il massimo valore di TDP è stato raggiunto, la frequenza resta esattamente quella nominale. Se invece alcuni dei core sono inutilizzati o il carico di lavoro è tale da non imporre i massimi assorbimenti, allora la CPU aumenta la sua frequenza di funzionamento fino al valore massimo consentito per ogni specifico modello.


Tecnologia Turbo Boost

Intel ed AMD considerano le rispettive tecnologie turbo come una soluzione molto interessante nell’ottica di tenere bassi i consumi e garantire al contempo prestazioni molto elevate. Quando si progetta una CPU multi-core è necessario fare i conti con i limiti sui massimi assorbimenti ed imporre parametri al contorno che garantiscano l’effettiva possibilità di utilizzo anche in condizioni estreme. Senza utilizzare la tecnologia turbo le CPU resterebbero sottoutilizzate e funzionanti ad una frequenza pari al massimo possibile nelle condizioni di massimo sforzo.


Efficienza della modalità Turbo

La curva dell’efficienza della tecnologia Turbo Boost integrata in Sandy Bridge-E segue quella delle CPU Sandy Bridge (Core i5-2500k) amplificandone però gli effetti. I guadagni da essa derivanti sono molto interessanti seppure li notiamo solo con le applicazioni maggiormente “CPU intensive”. Cadono invece completamente con le applicazioni videoludiche.

Analisi controller delle memorie
Il passaggio ad una nuova piattaforma non deve per forza coincidere con il buttare nel secchio tutto ciò di cui si dispone. Ci chiediamo perciò se sia conveniente utilizzare un kit di memorie dual-channel che avete già in vostro possesso oppure se è meglio pensare ad un upgrade anche in questo senso.


Memorie: dual-channel vs. quad-channel

Tutte le applicazioni che abbiamo provato in queste condizioni ci dicono che utilizzare un kit quad-channel porta solo ad incrementi marginali delle prestazioni (tenendo anche conto che essi sono dovuti alla presenza di un maggior quantitativo di memoria, 8GB contro 4GB nella fattispecie). Solo nel caso di crittografia con algoritmi AES256 e con alcuni software di transcodifica video il vantaggio è davvero netto.

Ma sapete che noi amiamoci vederci chiaro: abbiamo dunque eseguito altri test utilizzando configurazioni single-, dual-, triple- e quad-channel. Lo scopo è quello di capire se Sandy Bridge-E è un’architettura avida di banda di memoria e perciò passibile di cali prestazionali qualora questa dovesse mancare oppure se un controller così ampio apporta solo piccoli miglioramenti.


Banda dati memorie al variare dell’ampiezza del canale

Passando da uno scenario a singolo canale via via verso uno a quattro canali, la banda di memoria aumenta in maniera logaritmica con una progressione che parte dal 100 percento per poi fermarsi ad appena il 25 percento.

Un benchmark che può in maniera chiara darci indicazioni precise sull’influenza della banda di memoria è quello integrato in 7-zip: ci riferiamo in particolare al test di compressione che risulta essere molto memoria-dipendente. Al suo fianco abbiamo messo anche i risultati ottenuti con il test di estrazione che invece dipende quasi solo esclusivamente dalla potenza di calcolo della CPU.


Influenza della banda di memoria sulle prestazioni del sistema: 7-zip

I numeri restituiti nel caso di estrazione dimostrano che non vi è alcuna variazione delle prestazioni all’aumentare della banda di memoria a disposizione del sistema. Al contrario, nel caso di compressione, i valori ottenuti aumentano al crescere della banda di memoria ma differenze concrete le rileviamo solo nel passaggio da single-channel a dual-channel. Salendo verso una configurazione triple- o addirittura quad-channel gli incrementi sono molto meno marcati. Partiamo da alcuni test sintetici utili a comprendere il livello di prestazioni di cache e unità di calcolo x86.


SiSoft SANDRA: CPU test

I benchmark Whetstone e Dhrystone del SiSoft SANDRA rappresentano il classico metodo di misura delle prestazioni di un processore rispettivamente con operazioni di tipo floating point ed integer. In questo caso la nuova CPU Intel Core i7-3960X a sei core non teme confronti restituendo valori eccezionali, notevolmente superiori sia a quelli di modelli quad-core come Core i7-2600K sia a quelli di modelli a sei core di passata generazione come Core i7 980X. Il modello top di gamma della concorrente AMD, l’FX-8150, resta decisamente indietro.


SiSoft SANDRA: multimedia test

Anche con i benchmark che misurano prettamente le prestazioni delle unità multimediali il nuovo processore high-end di casa Intel non teme rivali e riesce a battere tutte le altre CPU compreso il setup a doppio processore Core 2 QX9775. In questo caso la soluzione di punta di casa AMD riesce ad ottenere una buona posizione in classifica mentre Core i7 980X e Core i7-2600K sono lasciati a debita distanza.


SiSoft SANDRA: banda dati intercore

La banda dati intercore mostrata dalla nuova CPU, pur non essendo la migliore in assoluta, mostra un discreto incremento rispetto a quella delle soluzioni Sandy Bridge come Core i7-2600K. Probabilmente le migliorie apportate al sistema delle cache ha avuto la sa influenza positiva.


SiSoft SANDRA: latenze intercore (a valori inferiori corrispondono prestazioni migliori)

Purtroppo, al contrario di quanto visto con la banda dati, le latenze nelle comunicazioni intercore sono peggiorate rispetto a quelle dei modelli Core i5 e Core i7 Sandy Bridge. Tai numeri contribuiscono ad avvalorare la nostra tesi circa il sistema delle cache: una cache L3 di maggiori dimensioni può contribuire al miglioramento della banda ma non a quello delle latenze!


Cache

A proposito di latenze, quelle che abbiamo registrato per i tre livelli di cache di Sandy Bridge-E non sono troppo dissimili da quelli ottenuti nel caso del Core i7 980X six core. Rispetto a quelli di un 2600K la latenza della cache L3 è decisamente superiore, complice la dimensione quasi doppia, ma resta comunque al di sotto di quella delle CPU Bulldozer.


SiSoft SANDRA: banda dati controller memorie

Come abbiamo visto in precedenza la banda dati disponibile al controller delle memorie è decisamente elevata grazie al supporto per configurazioni quad-channel. Sandy Bridge-E è capace di una banda superiore ai 30GB/s quando si usano almeno 4 moduli di memoria: il vantaggio di tutta questa banda sulle prestazioni delle applicazioni tradizionali è invece tutt’altra cosa. Spostiamo ora la nostra attenzione verso gli ambiti del calcolo intensivo che richiedono notevole potenza alla CPU. Primordia e Molecular Dynamics sono due benchmark tratti da Science Mark che permettono di misurare le performance della CPU con calcoli scientifici. Essi non sono ottimizzati per ambienti multi core, dunque sono utili a controllare sia le prestazioni single-core che l’efficacia delle eventuali tecnologie Turbo di Intel ed AMD.


Primordia (a valori inferiori corrispondono prestazioni migliori)

Le prestazioni offerte dal singolo core delle CPU Intel di ultima generazione sono molto interessanti e questo si riflette in maniera egregia sui benchmark come Primordia . Il tempo registrato è il migliore in assoluto anche se rispetto al Core i7-2600K il vantaggio è solo marginale; ben diverse sono le cose nei confronti di uno dei modelli a sei core di precedente generazione (Core i7 980X) rispetto al quale il 3960X guadagna circa quattro secondi.


Molecular Dynamics (a valori inferiori corrispondono prestazioni migliori)

Quanto appena visto potrebbe essere ripetuto come un mantra anche nel caso del benchmark Molecular Dynamics .


Fritz Chess Benchmark

Fritz Chess è un engine di simulazione del gioco degli scacchi in grado di sfruttare al massimo ambienti multi-threaded anche se permette di indirizzare fino ad 8 thread. I numeri ottenuti dalla CPU Core i7 3960X non sono entusiasmanti come ci si sarebbe aspettato (siamo ben al di sotto di quelli di un Core i7 980X) ma crediamo ci sia una spiegazione: probabilmente gli 8 thread non vengono perfettamente assegnati alla CPU che dispone di 6 core ma riesce a gestire fino a 12 thread (gli altri sei core logici sono disponibili mediante tecnologia Hyper Threading).


Crittografia

Anche nelle operazioni di crittografia la nuova CPU Intel Core i7-3960X mostra prestazioni molto elevate ma non tali da riuscire a superare del tutto uno dei suoi predecessori come il Core i7 980X. La potenza della nuova CPU è indiscussa, visti i numeri ottenuti nel caso di algoritmi SHA256, ma il modulo di accelerazione AES integrato sembra aver perso un po’ di smalto.


Crittografia: Truecrypt con algoritmo Serpent

Quando servono prestazioni pure la CPU Core i7-3960X esclude qualunque altro rivale (in questo caso purtroppo non abbiamo a disposizione i dati provenienti dal Core i7 980X): i modelli Sandy Bridge non riescono ad essere proprio al passo mentre il nuovo nato di casa AMD offre una buona risposta.


Crittografia: Truecrypt con algoritmo AES

Anche passando al modulo di accelerazione AES integrato, le prestazioni della nuova CPU Sandy Bridge-E continuano ad essere da primo in classifica. Seguono a debita distanza Core i7-2600K e AMD FX-8150. I software di rendering sfruttano sia le risorse grafiche che quelle di CPU, pertanto risultano un ottimo metodo di misurazione delle loro prestazioni. Prendiamo in considerazione, nel nostro batch di prove, PovRay e Cinebench 10.


Povray (a valori inferiori corrispondono prestazioni migliori)

Quando è chiamata a risolvere compiti di una certa complessità, la nuova CPU Intel non si tira indietro: con Povray i tempi raggiunti sono i migliori in assoluto, anche se il vantaggio rispetto ad un Core i7-2600K è solo di pochi secondi (5 percento circa).


Cinebench 10

A fronte di prestazioni in linea con quelle di un Core i7-2600K quando si utilizza Cinebench 10 in modalità single-CPU, i numeri ottenuti in modalità multi-CPU sono decisamente in favore del Core i7-3960X. Assolutamente nulla da fare per il più vecchio Core i7 980X che non va oltre i numeri del top di gamma della famiglia Sandy Bridge né tantomeno per la nuova CPU AMD FX-8150.


Fattore di moltiplicazione dovuto ad ambienti multicore

Il fattore di moltiplicazione, passando dallo scenario a singola CPU ad uno multi-CPU, è invece molto simile a quello del Core i7 980X e fra i più alti in assoluto (fatto salvo quello ottenuto con la piattaforma a doppia CPU Core 2 Quad). Questo denota la buona efficienza dell’architettura Intel.


7-zip: benchmark integrato

7-zip è uno dei software che meglio sfrutta la potenza delle CPU multi core: e così il Core i7 3960X non teme di accaparrarsi nuovamente la prima posizione, seguita a ruota dal Core i7 980X e poi dalla nuova CPU AMD FX-8150. Il 2600K resta invece confinato decisamente più in basso.


7-zip: compressione ed estrazione di dati (secondi, inferiore è meglio)

Passando ai dati di fatto, rileviamo come i tempi necessari per espletare le operazioni di compressione ed estrazione di dati sono effettivamente eseguite più velocemente dal Core i7-3960X anche se il margine di vantaggio rispetto al Core i7-2600K, questa volta in seconda posizione, non è così marcato come in precedenza. I software di codifica video permettono di stressare notevolmente i sottosistemi CPU e memorie, dunque niente di meglio per valutare le performance dei diversi processori.


XMPEG (a valori inferiori corrispondono prestazioni migliori)

Molto interessanti anche i tempi impiegati nell’operazione di transcodifica video con il software XMPEG ove il trono faticosamente conquistato dalla CPU AMD FX-8150 è stato recuperato. I numeri del Core i7-3960X sono in questo caso nettamente migliori di quelli del Core i7-2600k con un vantaggio del 20 percento circa.


AGK (a valori inferiori corrispondono prestazioni migliori)

Al contrario quando la transcodifica video è eseguita con Auto Gordian Knot la migliore CPU sembra essere un “banale” Core i3-2100 forte dei suoi soli due core. Il 3960X riesce a mantenere la seconda posizione al di sopra delle altre CPU della famiglia Sandy Bridge seppur con un vantaggio solo minimo.


Handbrake (a valori inferiori corrispondono prestazioni migliori)

Quattro sono le CPU che, in un range di pochi secondi, detengono la testa di una classifica realizzata attraverso il software Handbrake impiegato in un’operazione di conversione di un intero DVD (Codice Swordfish) in formato per Apple iPod; a guidarle è proprio il nuovo arrivato di casa Intel che però non riesce ad ottenere ampi consensi visto il vantaggio sul modello Core i7-2600K di appena un secondo su complessivi otto minuti circa. Anche il top di gamma della linea di processori AMD FX incalza da vicino il nuovo Sandy Bridge-E concedendogli appena 15 secondi di vantaggio.


Sviluppo software: utilizzo di strumenti JAVA

I tempi di esecuzione con strumenti software legati al mondo JAVA e contenuti nella suite Da Capo continuano a dar ragione al Core i7-3960X. > Abbiamo utilizzato alcuni giochi 3D per capire quanta potenza le nuove CPU Intel riescano a fornire alla scheda grafica. Di seguito troverete due serie di test, la prima effettuata con scheda grafica Radeon HD 4850 e livello di dettagli / risoluzioni molto contenute, utile a garantire un corretto confronto con tutte le piattaforme CPU sinora provate. La seconda e più ampia serie di test è stata effettuata con scheda grafica Sapphire Radeon HD 6950 Toxic ed è utile per capire se esiste e quale sia l’entità dell’eventuale vantaggio delle nuove piattaforme nei casi reali.

Serie di test con Radeon HD 4850


3DMark06

Il punteggio ottenuto con il 3DMark06 afferma senza ombra di dubbio che la nuova piattaforma Intel sarà in grado di fornire eccellenti prestazioni in ambito gaming, superiori a quelle del Core i7 980X e del Core i7-2600K, così come maggiori di quelle delle CPU top di gamma della rivale AMD.


Call of Juarez

È però sufficiente passare in rassegna i risultati del primo “gioco vero” come quelli di Call of Juarez, per avere una smentita di quanto appena visto; certo le differenze sono davvero piccole, ma sembra che la nuova CPU Sandy Bridge-E non riesca a cavarsela nemmeno nei confronti dei modelli Core i5-2500K e Core i7-2600K.


World in Conflict

World in Conflict torna invece a mostrare numeri interessanti per la nuova piattaforma del chipmaker americano, smentendo così i numeri visti con Call of Juarez.

Dunque è forse giunto il momento di scendere nel dettaglio delle prestazioni offerte da una piattaforma gaming effettiva.

Serie di test con Sapphire Radeon HD 6950 Toxic


Stalker Clear Sky: Max detail


Stalker Clear Sky: Max detail + AA


Metro 2033: Max detail


Far Cry 2: Max detail


Far Cry 2: Max detail + AA


Lost Planet 2: Max detail


AvP: Max detail


AvP: Max detail + AA


HAWX 2: Max detail


HAWX 2: Max detail + AA

Nessuno – o quasi – dei giochi provati si avvantaggia della nuova CPU Intel con la quale le prestazioni che registriamo sono esattamente identiche a quelle del modello Core i7-2600K. > Quando si ha a che fare con processori multi core è bene osservare il comportamento del sistema con più applicazioni attive allo stesso tempo . Quelli che seguono sono i risultati di alcuni test eseguiti contemporaneamente.


7-zip e Cinebench eseguiti contemporaneamente

La disponibilità di sei core fisici abbinati alla tecnologia Hyper Threading permette alle nuove CPU Core i7-3960X di ottenere risultati decisamente elevati, superiori a quelli raggiunti con la CPU Core i7 980X e ben al di sopra di quelli di AMD FX-8150 o Core i7-2600k.


Povray e Mainconcept (inferiore è meglio)

Lo stesso accade anche nell’esecuzione contemporanea di operazioni di rendering e codifica video dove però la nuova CPU è tallonata dal fratello minore Core i7-2600K.


PCMark Vantage – Productivity test

Anche il test sulla produttività del PCMark Vantage mostra ottimi risultati per il Core i7-3960X, posizionato un gradino al di sopra della CPU AMD FX-8150. > I consumi del sistema sono stati valutati misurando l’assorbimento sulla presa di corrente ed effettuando rilevazioni in IDLE e sotto sforzo (CPU Stability Test). I valori riportati in tabella tengono conto anche di un fattore di correzione relativo all’alimentatore utilizzato:

  • Il valore registrato va considerato solo in termini comparativi in quanto include anche l’inefficienza dell’alimentatore;
  • L’inefficienza dell’alimentatore non è lineare ma segue una curva che tenderebbe a penalizzare i consumi ridotti (l’efficienza è generalmente maggiore quando il carico sull’alimentatore aumenta). Per questo abbiamo applicato una correzione percentuale ai risultati utile a rendere idealmente lineare la curva di inefficienza.

Consumi con sistema in IDLE (inferiore è meglio)

I consumi in IDLE della nuova piattaforma Intel nel suo complesso sono simili a quelli mostrati da Bulldozer nella sua incarnazione FX-8150 o Phenom II X4 980. I valori registrati sono però nettamente peggiori rispetto a quelli delle piattaforma Sandy Bridge Core i7-2600K o Core i5-2500K e, viceversa, ben più contenuti di quelli di una più vecchia piattaforma socket LGA 1366 con CPU Core i7 980X.


Consumi con sistema sotto stress (inferiore è meglio)

Quando il carico sulla CPU sale di molto, i consumi del Core i7-3960X raggiungono gli stessi valori di quelli di un Core i7 980X pur restando inferiori a quelli di AMD FX-8150. I valori che abbiamo registrato sono di circa 50W superiori rispetto a quelli di una piattaforma Intel P67 con CPU Core i7-2600K.


Consumi massimi

Anche spingendo al massimo sui consumi, grazie ad una intensiva sessione di WPrime, i risultati non cambiano di molto: gli assorbimenti del Core i7 3960X restano decisamente superiori rispetto a quelli di un Core i7-2600K ma al di sotto di quelli di una CPU AMD FX-8150. >>> Il capitolo overclock conta davvero molto per Intel e per le nuove CPU Sandy Bridge-E tanto da costituire uno dei fattori di vendita sul quale l’azienda punterà. Per garantire la massima flessibilità possibile e superare alcune limitazioni che Intel non è riuscita a scrollarsi di dosso nemmeno con una seconda revisione dei chipset per processori Sandy Bridge, la nuova piattaforma include alcune interessanti novità.

Ovviamente non sono state trascurate le possibilità classiche, ovvero quelle legate ai moltiplicatori che potrete impostare fino ad un massimo d 57x nei modelli X o K. E il bus? Una delle novità è proprio in questo senso: come per le piattaforme con chipset P67 o Z68 è possibile modificare la frequenza del bus partendo dai suoi 100MHz di default ma vi assicuriamo che già il salire oltre i 105MHz è un miracolo.

Per aggirare questo ostacolo, seppure crediamo che la soluzione sia solo la “classica pezza”, Intel ha creato un sistema di moltiplicazione che si interpone fra la frequenza del bus stessa e la frequenza che va a pilotare la CPU. Gli step disponibili sono tre: 1x, 1,25x ed 1,67x. In pratica, attivando il moltiplicatore 1,25x la frequenza di riferimento della CPU sarà 125MHz invece che 100MHz mentre resterà identica (100MHz) per tutte le altre componenti. Con moltiplicatore a 1,67x la frequenza sale invece a 167MHz.


Moltiplicatore della frequenza di bus

Grazie a questo stratagemma sarà possibile overcloccare facilmente anche se non si hanno a disposizione moltiplicatori utili per la CPU. Se ad esempio vorrete portare una CPU Sandy Bridge-E a 6GHz ma non avete a disposizione il moltiplicatore 60x, potrete usare un moltiplicatore 48x, bus a 100MHz e moltiplicatore del bus 1,25x (48 x 1,25 x 100 = 6GHz). Se siete intenzionati a raggiungere i 6120MHz, potrete alzare la frequenza del bus a 102MHz lasciando invariati gli altri parametri.


Overclocking Assistant

Sempre nell’ottica del miglioramento dell’approccio all’overclock, Intel ha introdotto una feature indicata come Overclocking Assistant: questa è comunque appannaggio solo delle schede madri dello stesso marchio e permette in maniera semplice di portare la frequenza di funzionamento della CPU su valori specifici modificando semplicemente una voce (si tratta di una caratteristica simile a quella presente sulle schede madri ASUS ove è indicata come CPU Level Up).

Passiamo ora ai fatti e vediamo fino a che punto siamo riusciti a spingerci con la nuova CPU Intel Core i7-3960X, considerando che per le prove abbiamo utilizzato un sistema di dissipazione a liquido all-in-one.


Massima frequenza di bus

Una prima valutazione è stata fatta per cercare la massima frequenza di bus possibile. Come anticipato, il più alto valore stabile che siamo riusciti a raggiungere con l’esemplare del nostro sistema è stato pari a 105,2MHz, appena il 5 percento in più del valore di default.


Sistema automatico di overclock

Utilizzando il sistema Overclocking Assistant, la massima frequenza raggiunta per la CPU in nostro possesso è stata di 4,6GHz.

Passando in modalità manuale, abbiamo provato a spingere la CPU utilizzando proprio il metodo appena messo a disposizione da Intel. Questa scelta nasce anche dall’esigenza di lottare contro una scheda madre, quella fornitaci dalla stessa Intel, dotata di un bios probabilmente non alla sua versione definitiva e dunque non in grado di fornire supporto a tutti i moltiplicatori sbloccati che la CPU invece offre.


Overclock manuale: tensione di core come di default

Abbiamo dunque impostato il moltiplicatore del bus a 1,25x e lavorato con i valori di moltiplicazione disponibili. Senza modificare le tensioni di funzionamento della CPU abbiamo raggiunto stabilmente i 4GHz.


Overclock manuale: tensione di core come pari a 1,55V

Per poter andare oltre è stato necessario aumentare la tensione di core: il massimo valore raggiunto è stato pari a 4,625GHz con tensione di 1,55V, poco più di quanto eravamo riusciti a fare in modalità semi-automatica.


Intel Extreme Tweaking Utility

Intel fornisce anche una comoda utility software funzionante sotto Windows che permette tanto di monitorare quanto di modificare i parametri di funzionamento della piattaforma socket LGA 2011. > Sono passati circa tre anni dall’annuncio delle prime CPU Core i7 Nehalem destinate al mercato high-end e della relativa piattaforma socket LGA 1366. Da allora Intel ha lavorato molto sull’architettura delle sue CPU arrivando sino alla realizzazione di Sandy Bridge: le CPU che ne portano il nome sono state sin da subito acclamate come prodotti eccezionali capaci di offrire un importante salto prestazionale rispetto ai predecessori ed offrire un certo numero di interessanti feature.

La bontà di questa architettura è tale che Intel ha deciso di utilizzarla come base per la nuova famiglia di processori di fascia enthusiast. Questi possono attingere a tutta una serie di caratteristiche innovative che non sempre rappresentano però un reale vantaggio sulle prestazioni finali della CPU: controller delle memorie quad-channel compatibile con moduli DDR3-1600, supporto per lo standard di connessione PCI Express 3.0 con relativa integrazione di un controller che fornisce 40 linee elettriche, supporto per le estensioni AVX, AES ed SSE 4.2, ben 15MB di cache L3 condivisa fra tutti i core ed architettura a 6 core con supporto per Hyper Threading e Turbo Boost. A tutto questo va aggiunto un esteso supporto all’overclock che permette d agire sui moltiplicatori (solo con i modelli X e K) e abbastanza agilmente anche sulle frequenze del bus.

Parlando in particolare del controller delle memorie quad-channel e pur non potendo un single benchmark darci il polso della situazione complessiva, è chiaro che questa piattaforma va utilizzata con memorie configurate almeno in modalità dual-channel ma non preoccupatevi troppo di andare oltre.

Il capitolo overclock, pur risultando interessante sotto il profilo delle potenzialità, ha mostrato importanti limitazioni circa le massime frequenze raggiungibili almeno con l’esemplare in nostro possesso. D’altro canto la complessità della CPU costituisce senza ombra di dubbio un fattore limitante in tal senso: sarà interessante ora vedere se gli altri modelli che arriveranno sul mercato, come il 3930X, se la caveranno meglio.

Rivali? Non ce ne sono purtroppo, tanto che il miglior concorrente del modello 3960X va cercato all’interno del listino dello stesso produttore. Il Core i7-2600K è stato in molti casi capace di competere ad armi pari con il top di gamma della famiglia Sandy Bridge-E. In particolare con i giochi 3D non abbiamo trovato differenze importanti con il 2600K così come anche con alcune applicazioni tradizionali: l’IPC (istruzioni per ciclo di clock) che abbiamo misurato è esattamente identico fra modelli Sandy Bridge e Sandy Bridge-E, dunque nei casi in cui non l’influenza della cache è contenuta ed in quelli in cui non c’è una forte richiesta in termini di multi-threading, il vantaggio del Core i7-3960X resta confinato solo alle maggiori frequenze del Turbo. Troppo poco! Ben diverso è invece il confronto con le soluzioni quad-core ed esa-core socket LGA 1366 rispetto alle quali il nuovo arrivato garantisce un solido incremento prestazionale.

E rivali non ce ne sono nemmeno dal punto di vista del prezzo. La sola CPU costa 990 dollari se prendiamo in considerazione il modello di punta Core i7-3960X. Scendendo un gradino più in basso al modello 3930K il prezzo scende di conseguenza a 555 dollari. Le schede madri hanno anch’esse prezzi molto elevati che vanno da 250 a 300 dollari circa in base al modello specifico.

È dunque giustificabile un simile esborso? Chi desidera il massimo delle prestazioni in tutti i settori e con qualunque applicazione oggi non ha scelta: il Core i7-3960X rappresenta quanto di meglio si possa desiderare. Questo non significa però che il suo costo sia adeguato all’offerta. Se così fosse le sue prestazioni dovrebbero essere superiori mediamente del 300 percento rispetto a quelle di un Core i7-2600K!

A cura di Dino Fratelli >>

Link copiato negli appunti

Ti potrebbe interessare

14 11 2011
Link copiato negli appunti