Analizzate un volume di dati al secondo per i carichi di lavoro Apache Spark™ fino a 1,51 volte superiore, con le istanze VM Google Cloud™ N2

Apache Spark

  • Analizzate più dati al secondo con un throughput 1,51 volte superiore.

  • Ottimizzate l'analisi dei dati e l'apprendimento automatico nel cloud.

  • Accelerate i carichi di lavoro con la memoria persistente Intel® Optane™.

author-image

By

Ottenete informazioni dai dati più velocemente con le istanze VM Google Cloud N2 con processori scalabili Intel® Xeon® di seconda generazione

L'analisi dei dati, l'apprendimento automatico e i carichi di lavoro di intelligenza artificiale mettono in ordine e danno un senso a enormi quantità di dati aziendali. Poiché questi carichi di lavoro comportano un'intensa elaborazione, ospitarli nel cloud richiede un hardware che possa soddisfare le impegnative sfide che si devono fronteggiare quando si ha bisogno di ricavare informazioni dai dati con rapidità. Se la vostra organizzazione esegue i cluster Apache Spark — che fornisce una piattaforma di analisi unificata per l'elaborazione dei big data — il tipo di istanza VM che scegliete influenza direttamente la velocità a cui potete tradurre i dati in azioni. Per gli impegnativi carichi di lavoro Apache Spark, le istanze VM Google Cloud N2 rese possibili dai processori scalabili Intel® Xeon® di seconda generazione possono migliorare i carichi di lavoro di apprendimento automatico per l'analisi dei dati, permettendo alla vostra azienda di evolversi rapidamente con nuove iniziative.

In un confronto delle prestazioni di apprendimento automatico del clustering k-means, le più recenti istanze VM Google Cloud N2 rese possibili dai processori scalabili Intel® Xeon® di seconda generazione hanno superato le istanze VM N1 precedenti con processori Intel® Xeon® E5 v4, analizzando volumi di dati al secondo fino a 1,51 volte superiori per i carichi di lavoro dell'analisi dei dati avanzata Apache Spark.

Analizzate più dati al secondo con un throughput 1,51 volte superiore

Le istanze cloud supportano un sempre maggior numero di carichi di lavoro a elevata elaborazione come l'analisi dei dati, l'apprendimento automatico e l'intelligenza artificiale (IA), il che è l'ideale per le organizzazioni che desiderano l'agilità e la flessibilità che il cloud computing garantisce al resto della loro azienda.

Dei test che mettono a confronto le prestazioni del clustering k-means utilizzando la suite di benchmark HiBench, mostrano che le istanze VM Google Cloud N2 con processori scalabili Intel® Xeon® di seconda generazione possono migliorare i carichi di lavoro dell'apprendimento automatico Apache Spark aumentando il volume di dati al secondo fino a 1,51 volte rispetto alle istanze VM N1 con processori Intel® Xeon® E5 v4.

Ciò significa che scegliere le istanze VM Google Cloud N2 rispetto alle istanze VM N1 può migliorare notevolmente la velocità a cui la vostra organizzazione può elaborare i dati.

Figura 1. Confronto del throughput relativo delle istanze bhn VM Google Cloud N1 ed N2 (32 vCPU/128 GB RAM) per i carichi di lavoro del clustering k-means dalla suite di benchmark HiBench.

Le nuove tecnologie dei processori scalabili Intel® Xeon® di seconda generazione ottimizzano l'analisi dei dati

Scegliere le istanze VM Google Cloud N2 significa ottenere accesso alle tecnologie principali integrate nei processori scalabili Intel® Xeon® di seconda generazione, che lavorano per ottimizzare l'analisi dei dati avanzata ad alta intensità di elaborazione e i carichi di lavoro dell'apprendimento automatico. Intel® Advanced Vector Extensions 512 (Intel® AVX-512) processa più dati con una singola istruzione, gestendo le attività computazionali più velocemente e accelerando questi carichi di lavoro avanzati. Le istanze VM Google Cloud N2 con processori scalabili Intel® Xeon® di seconda generazione offrono Intel® Deep Learning Boost (Intel® DL Boost), che ottimizza i cicli di rete neurale per migliorare le operazioni IA di 3,4 volte, il che lo rende uno strumento formabile per ottimizzare l'analisi dei dati avanzata e i carichi di lavoro dell'apprendimento automatico. Per una flessibilità ancora maggiore, le istanze VM Google Cloud N2 rese possibili dai processori scalabili Intel® Xeon® di seconda generazione utilizzano anche gli Intel® Field Programmable Gate Arrays (FGPA), che possono essere riconfigurati per diversi modelli ML in cui gli algoritmi cambiano frequentemente per accelerare le operazioni IA.

Accelerate i carichi di lavoro con la memoria persistente Intel® Optane™

Le istanze VM Google Cloud N2 rese possibili dai processori scalabili Intel® Xeon® di seconda generazione introducono inoltre la possibilità di accelerare ulteriormente i carichi di lavoro dell'analisi dei dati con la memoria persistente Intel® Optane™ (PMem). La PMem Intel® Optane™ è una combinazione di tecnologia di memoria e di storage che consente alle istanze VM Google Cloud N2 di memorizzare una maggiore quantità di dati più vicino al processore per fornire latenze più basse per l'analisi dei dati e l'apprendimento automatico.

Per saperne di più

Per dare inizio ai vostri carichi di lavoro di apprendimento automatico Apache Spark su istanze VM Google Cloud con processori scalabili Intel® Xeon® di seconda generazione, consultate http://intel.it/GoogleCloud.