Supercomputer, SGI canta vittoria

C'è un nuovo monster di calcolo pronto a duellare per la palma del più veloce al mondo: un sistemone Itanium/Linux già operativo nel quartier generale NASA. Ma è davvero questo il più veloce?

Mountain View (USA) – Nell’avvincente sfida tecnologica fra IBM e NEC , giocata a colpi di teraflop, si è appena inserita Silicon Graphics , che ha prodotto ciò che ritiene essere il supercomputer più potente al mondo.

Battezzato Columbia, e installato presso la NASA , il cervellone di SGI ha fatto segnare una performance di 42,7 trilioni di calcoli al secondo (Tflops), dunque sensibilmente superiore sia ai 35,86 Tflops dell’Earth Simulator di NEC, che guida l’attuale classifica Top500 dei supercomputer più veloci al mondo, sia ai 36,01 Tflops dell’ultimo modello sperimentale di Blue Gene/L annunciato alla fine di settembre da IBM.

In realtà, se si considerano anche i sistemi che non sono ancora entrati a far parte della Top500, la palma di supercomputer più veloce al mondo sembra spettare ancora a NEC, che meno di due settimane fa ha svelato un supercomputer, l’ SX-8 , capace di macinare 58,5 Tflops. Questo valore, come quelli riportati da IBM e SGI, è stato misurato con il benchmark standard Linpack: stando ai benchmark proprietari di NEC, invece, l’SX-8 è in grado di raggiungere i 65 Tflops.

Supercomputer Columbus “A dispetto degli altri supercomputer recentemente annunciati, la velocità record di Columbia è stata ottenuta su di un sistema già pienamente operativo presso la sede del nostro cliente”, ha sottolineato Dave Parry, senior vice president and general manager, Server and Platform Group di SGI. Parry si riferisce al fatto che sia il nuovo modello di Blue Gene/L di IBM che l’SX-8 di NEC non sono ancora entrati in commercio, e lo loro performance sono state misurate in test di laboratorio. È dunque assai probabile che nell’imminente nuova edizione semestrale della Top500 il supercomputer di SGI possa inserirsi in prima posizione.

Il produttore americano ha poi precisato che il test di velocità è stato eseguito utilizzando solo 16 dei 20 server Altix che formano il Columbus: ciò significa, secondo alcune fonti, che il mostro è potenzialmente in grado di superare i 60 Tflops.

Il sistema completo conta 10.240 processori Itanium 2, dunque 512 CPU per singolo nodo, e si basa sul sistema operativo Linux. SGI sostiene di aver costruito e installato Columbus, al cui progetto ha collaborato anche Intel, in 120 giorni, completando il lavoro lo scorso 12 ottobre. I dettagli tecnici del sistemone sono disponibili qui .

La NASA utilizzerà Columbus per una vasta gamma di ricerche, tra cui le previsione degli uragani, lo studio dei cambiamenti climatici e la progettazione di nuovi modelli di shuttle. Si veda, a tal proposito, l’articolo ” Supercarburante NASA per Linux “.

La tua email sarà utilizzata per comunicarti se qualcuno risponde al tuo commento e non sarà pubblicato. Dichiari di avere preso visione e di accettare quanto previsto dalla informativa privacy

  • Anonimo scrive:
    Notebook????
    ...a quando un bel notebook con questo Xeon a basso consumo?Anche se dovesse avere una bassa autonomia non sarebbe proprio male...Parlando per assurdo ci metterei anche uno di quei nuovi HDD SCSI da 2.5", una QuadroFX Go, e ovviamente, niente Windoze.Sarebbe un vero notebook da lavoro, che i grafici apprezzerebbero sicuramente, e non uno di quei tanti baracconi che si vedono oggigiorno.Lasciatemi sognare.. ;-)
    • Anonimo scrive:
      Re: Notebook????
      - Scritto da: Anonimo
      ...a quando un bel notebook con questo Xeon
      a basso consumo?
      Anche se dovesse avere una bassa autonomia
      non sarebbe proprio male...
      Parlando per assurdo ci metterei anche uno
      di quei nuovi HDD SCSI da 2.5", una QuadroFX
      Go, e ovviamente, niente Windoze.
      Sarebbe un vero notebook da lavoro, che i
      grafici apprezzerebbero sicuramente, e non
      uno di quei tanti baracconi che si vedono
      oggigiorno.

      Lasciatemi sognare.. ;)Esistono gia' i portatili a 3.2 o 3.4 ghz HT con GeforceFX go e con winXp vanno da dio con qualsiasi applicazione opengl e non.Sono sicuro che da la paga a qualsiasi Xeon a 2.8 nella maggior parte dei casi.Quella CPU e' da usare in Dual o Quad.
      • Anonimo scrive:
        Re: Notebook????

        Esistono gia' i portatili a 3.2 o 3.4 ghz HT
        con GeforceFX go e con winXp vanno da dio
        con qualsiasi applicazione opengl e non....
        Sono sicuro che da la paga a qualsiasi Xeon
        a 2.8 nella maggior parte dei casi.Gliela danno anche perchè Xeon anche se è molto simile al p4, è una cpu pensata e ottimizzata per sistemi server, per i desk meglio, per costi e per vari accorgimenti, altre cpu.
  • Anonimo scrive:
    DOA
    Circa un anno fa Intel puntava ancora sul core del P4, che è molto simile a quello usato negli xeon, poi le difficoltà a scalare in frequenza e prestazioni li ha indotti a puntare sul core del pentium-M.Questi Xeon sono un "riasrcimento" che Intel sta tentando di aggiudicarsi per quanto speso a portare i 64 bit sul core del P4 (che poi sarebbe passato alle cpu desk), lo stesso saranno eventuali cpu P4 x desktop con le stesse estensioni, che potrebbero uscire da qui in avanti, in sostanza si tratta di una famiglia di macchine destinate a crescere pochissimo in prestazioni ed a essere rimpiazzate in un paio d'anni al max, troppo poco per l'investimento in uno xeon (e se passa qualche mese, una asepttativa di vita troppo bassa anche per le macchine desktop).Intanto Intel sta lavorando sul pentium-M con estensioni a 64 bit e ne ha pianificato il rilascio tra un paio d'anni o meno... il margine di qualche mese in più o in meno sta tutto nel vedere se contineranno a riuscire a tenere il centrino fuori dai desktop (a cui contribuisce il ritardo nel portare i 64 bit su p-M) e se riusciranno a non farsi deridere troppo per le prestazioni dei p4/xeon a 4 GHz o meno per i prossimi due anni... questi p4-64 sono podotti senza futuro, di cui è già programmata l'estinzione, pensateci bene prima di acquistarli!
    • Anonimo scrive:
      Re: DOA
      Tutti i processori sono destinati all'estinzione entro pochi mesi.E dopo un paio d'anni costa meno comprare un PC nuovo che upgradare il vecchio.
      • Anonimo scrive:
        Re: DOA
        L'architettura del pentium pro è viva e vegeta nel pentium M, passando attraverso al pentium 2 e 3, mentre quella del pentium 4 è già stata abbandonata nei piani di Intel.Vorrà dire qualcosa no, se una architettura si rivela degna di vivere dai 100 ai 2000 MHz e avere ancora futuro, mentre un'altra è vissuta dai 1300 ai 3600 ed è già stata dichiarata abbandonata...Ok, non posso montare un dothan al posto del vecchio ppro, intel si diverte troppo a cambiare pin e socket (ricordate ancora la speculazione sugli slot...) ma questo non toglie che abbia più fiducia in una tecnologia che dopo 10 anni ha ancora futuro, consuma un quinto, scalda meno, non mi costringe ad una ventola che mi scassa la min*** mentre guardo un film e che va sugli interi come un p4 con il doppio del clock e x1,5 sui floating...
  • Anonimo scrive:
    il vantaggio dei 64 bit
    OptimizationUse 64-bit registers for 64-bit integer arithmetic.RationaleUsing 64-bit registers instead of their 32-bit equivalents can dramatically reduce the amount of code necessary to perform 64-bit integer arithmetic.Example 1This code performs 64-bit addition using 32-bit registers:; Add ECX:EBX to EDX:EAX, and place sum in EDX:EAX.00000000 03 C3 add eax, ebx00000002 13 D1 adc edx, ecxUsing 64-bit registers, the previous code can be replaced by one simple instruction (assuming that RAX and RBX contain the 64-bit integer values to add):00000000 48 03 C3 add rax, rbxAlthough the preceding instruction requires one additional byte for the REX prefix, it?s still one byte shorter than the original code. More importantly, this instruction still has a latency of only one cycle, uses two fewer registers, and occupies only one decode slot.Per quanto riguarda x86-64 (quindi amd64)cambia innanzitutto l'ISA con registri general purpose a 64 bithttp://www.hwupgrade.it/articoli/902/x86-64.gifil controller DDR integrato è a 72 bit (64 + 8 di ECC) per athlon64Il northbridge ha un datapath di 128 bitper quanto riguarda i vantaggi dell'isa x86-64 eccone un'assaggio.OptimizationUse 64-bit registers for 64-bit integer arithmetic.RationaleUsing 64-bit registers instead of their 32-bit equivalents can dramatically reduce the amount of code necessary to perform 64-bit integer arithmetic.Example 1This code performs 64-bit addition using 32-bit registers:; Add ECX:EBX to EDX:EAX, and place sum in EDX:EAX.00000000 03 C3 add eax, ebx00000002 13 D1 adc edx, ecxUsing 64-bit registers, the previous code can be replaced by one simple instruction (assuming that RAX and RBX contain the 64-bit integer values to add):00000000 48 03 C3 add rax, rbxAlthough the preceding instruction requires one additional byte for the REX prefix, it?s still one byte shorter than the original code. More importantly, this instruction still has a latency of only one cycle, uses two fewer registers, and occupies only one decode slot.Example 2To perform the low-order half of the product of two 64-bit integers using 32-bit registers, a proceduresuch as the following is necessary:; In: [ESP+8]:[ESP+4] = multiplicand; [ESP+16]:[ESP+12] = multiplier; Out: EDX:EAX = (multiplicand * multiplier) % 2^64; Destroys: EAX, ECX, EDX, EFlagsllmul PROC mov edx, [esp+8] ; multiplicand_hi mov ecx, [esp+16] ; multiplier_hi or edx, ecx ; One operand
    = 2^32? mov edx, [esp+12] ; multiplier_lo mov eax, [esp+4] ; multiplicand_lo jnz twomul ; Yes, need two multiplies. mul edx ; multiplicand_lo * multiplier_lo ret ; Done, return to caller.twomul: imul edx, [esp+8] ; p3_lo = multiplicand_hi * multiplier_lo imul ecx, eax ; p2_lo = multiplier_hi * multiplicand_lo add ecx, edx ; p2_lo + p3_lo mul dword ptr [esp+12] ; p1 = multiplicand_lo * multiplier_lo add edx, ecx ; p1 + p2_lo + p3_lo = result in EDX:EAX ret ; Done, return to caller. llmul ENDPUsing 64-bit registers, the entire product can be produced with only one instruction:; Multiply RAX by RBX. The 128-bit product is stored in RDX:RAX.00000000 48 F7 EB imul rbx
Chiudi i commenti