Costruire un'architettura HPC ottimizzata

Progetta il tuo sistema High Performance Computing (HPC) affinché sia pronto ai futuri carichi di lavoro.

Elementi costitutivi di un sistema HPC:

  • La progettazione del tuo sistema HPC può basarsi su una combinazione di strategie di parallel computing, cluster computing e grid/distributed computing.

  • Un approccio cloud ibrido, che combina la tua infrastruttura locale con le risorse del cloud pubblico, assicura una maggiore scalabilità in caso di necessità, riducendo il rischio di perdere nuove opportunità.

  • Le tecnologie Intel® per l'HPC includono processori, memoria e fabric, fornendo una solida base per sistemi ad alte prestazioni e incredibilmente scalabili.

author-image

di

Nell'odierno ambiente aziendale accelerato, il successo della tecnologia HPC inizia da un'architettura HPC ben definita. A seconda dei carichi di lavoro della tua organizzazione e degli obiettivi di calcolo, sono disponibili diverse architetture di sistema HPC e risorse di supporto per aiutarti a ottenere maggiore produttività e prestazioni scalabili.

Progettazione di sistemi HPC

L'architettura HPC può assumere molte forme a seconda delle tue esigenze. Le organizzazioni possono adottare diverse soluzioni per progettare sistemi HPC.

Parallel computing
Il parallel computing HPC consente ai cluster HPC di eseguire calcoli simultaneamente o in parallelo. Fondamentale per affrontare problemi grandi e complessi, il parallel computing prende i grandi carichi di lavoro e li divide in attività computazionali separate, che vengono poi svolte simultaneamente.

Questi sistemi possono essere progettati per essere orizzontalmente o verticalmente scalabili. La scalabilità verticale del parallelismo prevede che un lavoro all'interno di un singolo sistema venga suddiviso in modo che i singoli core possano eseguirlo, utilizzando al massimo le potenzialità del server. Al contrario, la scalabilità orizzontale del parallelismo implica che lo stesso lavoro venga suddiviso in parti gestibili, quindi distribuito su più server o computer per essere eseguito in parallelo.

Cluster computing
In un cluster HPC più computer o nodi sono collegati tra loro attraverso una rete locale (LAN) per ricreare un'architettura cluster HPC. Il sistema funziona come un singolo computer, ma con una potenza computazionale estremamente elevata. La configurazione di un cluster HPC è progettata ad hoc per risolvere un singolo problema distribuendolo tra tutti i nodi di un sistema. I cluster HPC hanno una topologia di rete definita e permettono di affrontare calcoli avanzati con velocità di elaborazione illimitate.

Grid e distributed computing
Il grid computing HPC e il distributed computing HPC sono sinonimi della stessa architettura computazionale. Coinvolgono più computer collegati in rete, che condividono un obiettivo comune, come risolvere un problema complesso o eseguire un'attività computazionale impegnativa. Questo approccio è ideale per affrontare lavori che possono essere suddivisi in blocchi separati e distribuiti su tutta la griglia. Ciascun nodo all'interno del sistema può eseguire attività in modo indipendente, senza dover comunicare con gli altri nodi.

Compatibilità delle applicazioni HPC comuni
Intel ha collaborato con i partner di settore per definire le migliori pratiche per la promozione delle applicazioni HPC e dei sistemi cluster basati sull'architettura Intel®. Le specifiche della piattaforma Intel® HPC definiscono i requisiti software e hardware comuni che gli sviluppatori di applicazioni possono adottare come base per soluzioni cluster. Un sistema conforme a questi requisiti assicura un set definito di caratteristiche a livello di applicazione, inclusi i componenti di runtime del software Intel® che offrono i migliori risultati prestazionali. Le specifiche della piattaforma includono informazioni sulla configurazione e sulla conformità in una vasta gamma di applicazioni comuni.

Infrastruttura cloud HPC

In passato, i sistemi HPC erano limitati alla capacità che l'infrastruttura locale poteva garantire. Oggi, il cloud offre l'opportunità di estendere la capacità locale con risorse supplementari.

Le più recenti piattaforme di gestione del cloud consentono un approccio cloud ibrido, che integra la tua infrastruttura locale con i servizi cloud pubblici, così che i carichi di lavoro possano essere distribuiti senza soluzione di continuità su tutte le risorse disponibili. Questo assicura una maggiore flessibilità nell'implementazione dei sistemi HPC e nella velocità con cui è possibile scalarli, oltre alla possibilità di ottimizzare il costo totale di proprietà (TCO).

In genere, un sistema HPC locale offre un TCO inferiore rispetto a un sistema HPC equivalente riservato 24/7 nel cloud. Tuttavia, una soluzione locale dimensionata sulla capacità massima verrà pienamente sfruttata solo quando si raggiunge tale capacità. Per la maggior parte del tempo, la soluzione locale sarà sottoutilizzata, lasciando gran parte delle risorse inattive. D'altro canto, un carico di lavoro che non può essere elaborato per mancanza di risorse può comportare la perdita di importanti opportunità.

In breve, il ricorso al cloud per potenziare l'infrastruttura HPC locale in occasione di lavori urgenti può ridurre il rischio di perdere grandi opportunità. 

Scegliere i processori HPC per massimizzare scalabilità e prestazioni

Con la sua vasta esperienza nelle tecnologie HPC, Intel offre le prestazioni necessarie per la gestione dei più impegnativi carichi di lavoro futuri. I processori scalabili Intel® Xeon® forniscono una piattaforma altamente versatile, in grado di adattarsi perfettamente alle diverse esigenze prestazionali dei carichi di lavoro HPC più critici.

In collaborazione con i suoi partner, Intel ha dato priorità alla creazione di progetti di riferimento per i sistemi HPC più ottimizzati. Per la convalida dei requisiti prestazionali, Intel® Cluster Checker garantisce che il tuo sistema cluster HPC sia integro e perfettamente configurato per l'esecuzione di applicazioni parallele con incredibile portabilità tra sistemi locali e cloud HPC.

Con la tecnologia Intel® CoFluent™ è possibile accelerare la distribuzione di sistemi complessi e determinare le impostazioni ottimali modellando interazioni hardware e software simulate.

Una rivoluzione nella memoria HPC

La memoria è una componente essenziale nella progettazione dei sistemi HPC. Responsabile dell'archiviazione a breve termine dei dati di un sistema, la memoria può essere un fattore limitante per le prestazioni. La tecnologia Intel® Optane™ aiuta a superare questi colli di bottiglia nei data center colmando le lacune nella gerarchia tra memoria e storage, in modo da non limitare la capacità di calcolo.

Dimensionamento delle prestazioni con il fabric HPC

Per scalare efficacemente i sistemi HPC, è necessario un fabric ad alte prestazioni, specificamente progettato per supportare i cluster HPC. L'architettura Intel® Omni-Path (Intel® OPA) supera le limitazioni prestazionali delle attuali tecnologie fabric assicurando una scalabilità fino a decine di migliaia di nodi e oltre. Questo offre agli sviluppatori di applicazioni una soluzione end-to-end per routing adattivo, routing dispersivo, ottimizzazione dei flussi di traffico, protezione dell'integrità dei pacchetti e ridimensionamento dinamico delle corsie. I fabric Intel ad alte prestazioni sono progettati per soddisfare le esigenze dei futuri carichi di lavoro di calcolo HPC a un prezzo competitivo.

Un percorso più semplice per l'adozione dell'HPC

Intel offre le competenze essenziali per comprendere le applicazioni che desideri eseguire e il modo in cui uno specifico sistema HPC, combinazione di risorse locali e cloud, potrà aiutarti a produrre risultati e massimizzare il volume di lavoro che puoi realizzare. Con un'architettura HPC basata sulle tecnologie Intel®, sei pronto a soddisfare le future esigenze HPC ed exascale.

Oggi il cloud permette di scalare i sistemi HPC, estendendo facilmente l'accesso a risorse di calcolo, storage e rete.