Risolvete più rapidamente le maggiori sfide aziendali

Architettura integrata per prestazioni potenti

Intel presenta il processore Intel® Xeon Phi™

Il processore Intel® Xeon Phi™ è un processore host avviabile che offre un livello elevato di parallelismo e vettorializzazione per supportare le applicazioni HPC (High Performance Computing) più impegnative. L'architettura integrata ed efficiente dal punto di vista energetico offre molta più elaborazione per unità di energia consumata rispetto alle piattaforme paragonabili, per consentire costi complessivi di gestione ridotti.1 L'integrazione di memoria e fabric abbatte il muro della memoria e riduce i costi per aiutarvi a risolvere le sfide più importanti con maggiore rapidità.

Prodotto con la tecnologia di processo a 14 nm di Intel, il processore Intel® Xeon Phi™ offre fino a 72 core con esecuzione non sequenziale, istruzioni Intel® Advanced Vector Extensions 512 e fino a 16 GB di memoria on-package ad elevata larghezza di banda, con capacità di 384 GB di memoria DDR4 per la piattaforma. Il risultato di questa architettura all'avanguardia è di oltre 3 teraFLOPS (operazioni in virgola mobile al secondo) a doppia precisione a soli 215 W per processore.

Le potenti prestazioni offrono valore senza precedenti

L'architettura integrata del processore Intel® Xeon Phi™ migliora le prestazioni e abbassa i costi riducendo i colli di bottiglia e la complessità del sistema. Il processore Intel® Xeon Phi™ offre fino a 490 GB/s di larghezza di banda sostenuta della memoria, senza la necessità di schede di memoria dedicate aggiuntive, e I/O di 100 GB/s senza costi ulteriori, con energia sufficiente per due adattatori fabric.

Supportato da una roadmap Intel completa, il processore Intel® Xeon Phi™ è una soluzione a prova di futuro che ottimizza il ritorno sugli investimenti impiegando standard aperti per codice flessibile, portabile e riutilizzabile.

Processori Intel® Xeon® o processori Intel® Xeon Phi™?

Con i processori Intel® Xeon®, i carichi di lavoro con componenti seriali e in parallelo raggiungono prestazioni leader di settore, ma sono ideali anche per applicazioni che richiedono un elevato livello di parallelismo e vettorializzazione. Le applicazioni che riscontrano i maggiori miglioramenti faranno ampio uso dei 72 core con grandissima capacità di elaborazione dei vettori (Intel® AVX-512). Esempi di segmenti con applicazioni altamente parallele comprendono: animazione, energia, finanza, scienze naturali, produzione, settore medico, settore pubblico, meteorologia e altri.

Per un elenco di applicazioni ottimizzate, consultate la vetrina delle applicazioni.

Integrato in una soluzione completa

Il processore Intel® Xeon Phi™ è un elemento fondamentale di Intel® Scalable System Framework (Intel® SSF), che combina computing, memoria/storage, fabric e software per ridurre i colli di bottiglia e la complessità dei sistemi. Intel® SSF è una soluzione completa per lo sviluppo di sistemi HPC ad alte prestazioni, bilanciati, efficienti e affidabili.

Video correlati

Informazioni su prodotti e prestazioni

1

In base al confronto con un sistema a 2 socket E5-2697 v4 che esegue DGEMM. Xeon Phi™ 7250 ha ottenuto un risultato di 2070/215 (GFLOP/Watt) rispetto a 1054/290 (GFLOP/Watt) di E5-2697 v4. Fonte: misurazione o stima di Intel in data marzo 2016. 

Dettagli di configurazione:

Parametri di configurazione del processore Intel® Xeon® E5-2697 v4:

1 nodo, 2 processori Intel® Xeon® E5-2697 v4 su Grantley-EP (Wellsburg) con 128 GB di memoria totale con Red Hat Enterprise Linux* 7.1 kernel 3.10.0-229 utilizzando stream_omp v5.4 con compilatore Intel 16.0.3.174 con il seguente comando: icc stream_omp.c -O3 -openmp -o stream_omp -static -freestanding -o stream_omp_v5.4_IC16.0.3.174_80M.

Parametri di configurazione del processore Intel® Xeon Phi™:

piattaforma utilizzata in Intel per il testing: Intel Adams Pass Product Concept Board (ADP PC), 96 GB di DDR4 (6 x 16 GB a 2133 MHz)

BIOS: CRB BIOS 08.R00.RC085

Impostazioni BIOS:

  • Caricare impostazioni predefinite (Turbo on)
  • Impostare modalità cluster su quad
  • Impostare velocità della memoria DDR a 2133 o Auto
  • La modalità di memoria MCDRAM varia tra Flat e Cache

Processori usati per questa edizione:

  • processore KNL B0 tQS (Bin3) 7210 QDF# QKTA:  
    • 32 tile / 64 core, 16 GB di MCDRAM,
    • 1,5 GHz (singolo core turbo), 1,4 GHz (tutti i core turbo), 1,1 GHz (AVX-P1), 1,3 GHz, (non-AVX-P1)
    • 1,6 GHz mesh, 6,4 GT/s OPIO
  • processore KNL B0 tQS (Bin2) 7230 QDF# QKTB:  
    • 32 tile / 64 core, 16 GB di MCDRAM,
    • 1,5 GHz (singolo core turbo), 1,4 GHz (tutti i core turbo), 1,1 GHz (AVX-P1), 1,3 GHz, (non-AVX-P1)
    • 1,7 GHz mesh, 7,2 GT/s OPIO
  • processore KNL B0 tQS (Bin1) 7250
    • 34 tile / 68 core, 16 GB di MCDRAM,
    • 1,6 GHz (singolo core turbo), 1,5 GHz (tutti i core turbo), rapporti P predefiniti
    • 1,7 GHz mesh, 7,2 GT/s OPIO

OS: RHEL* 7

Opzioni kernel: noreplace-paravirt idle=halt mce=on

Variabili ambientali: vedere come ogni singolo carico di lavoro è stato eseguito per specifiche variabili ambientali

KNL Self Boot Software Package MPSP 1.2.2

MICPERF 1.3.0 release preliminare

ComposerXE 2016 o pacchetto ridistribuibile equivalente installato

MKL-based HPL Package 11.3.2.009

Intel MPI versione 5.1.2-150

Dimensioni matrice:

DGEMM: 20000 x 20000 o 26000 x 26000

SGEMM: 30000 x 30000

Dimensione del problema LINPACK: 100000