Esegui le tue query di Databricks fino al 38% in meno di tempo e Riduce i costi fino al 30% selezionando Microsoft® Azure® Edsv4 VM con scalabile Intel® Xeon® di seconda generazione

Databricks:

  • Esegui le query di supporto decisionale fino al 38% più rapidamente con le macchine virtuali E8ds_v4 abilitate dai processori scalabili Intel Xeon di seconda generazione rispetto alle macchine virtuali L8s_v2 con processori AMD EPYC.

  • Risparmia fino al 30% per eseguire query di supporto decisionale con le macchine virtuali E8ds_v4 abilitate dai processori scalabili Intel Xeon di seconda generazione rispetto alle macchine virtuali L8s_v2 con processori AMD EPYC.

author-image

di

Con Photon Vectorized Query Engine abilitato, queste VM hanno offerto più forte delle prestazioni di carico di lavoro della decisione rispetto L8s_v2 ottimizzato per l'archivio con processori AMD EPYC™

Databricks e Databricks Lakehouse piattaforma store e analizzare i grandi volumi di dati strutturati e non strutturati che le organizzazioni raccolgono. se si eseguono questi carichi di lavoro nel cloud, è possibile accelerare il tempo necessario per condurre le query selezionando istanze basate su hardware che si performa bene. Le query più veloci si traducono in un'implementazione più rapida degli approfondimenti forniti.

Per aiutare le aziende che scelgono le VN cloud per il data warehousing il supporto per la decisione, abbiamo tstato due serie Microsoft Azure VM che sono ben adatti a tali carichi di lavoro: Edsv4 VM abilitato da Intel® Xeon® scalabile di generazione generazione e VM Lsv2 ottimizzato per l'archivio con processori EPYC di seconda generazione. Abbiamo testato un carico di lavoro di supporto decisionale su cluster di queste due serie VM abilitato da Databricks Runtime 9.0. Abbiamo abilitato Photon, un motore di query vettoriale progettato per migliorare le prestazioni di query SQL, su entrambi.

Le macchine virtuali Edsv4 con processori Intel Xeon di seconda generazione hanno superato le macchine virtuali Lsv2 ottimizzate per l'archiviazione, eseguendo le query in modo più rapido. Inoltre, quando abbiamo calcolato il prezzo/le prestazioni delle due serie su questo carico di lavoro, abbiamo scoperto che le VM Edsv4 hanno fornito un valore migliore.

Godetevi le prestazioni del data Speedier con le VM Edsv4

I nostri test hanno utilizzato un benchmark di supporto decisionale basato su TPC-DS, che offre una metrica più bassa che riflette il tempo necessario per condurre una data serie di query Tempi più brevi non solo ottengono informazioni actionable nelle mani dei decisori in precedenza, ma può anche tradurre al risparmio riducendo VM uptime e i costi associati. Come la Figura 1, le VM E8ds_v4 con scalabile Intel Xeon di seconda generazione hanno completato le query su un data 1TB impostato in 38% in meno di tempo rispetto le VM L8s_v2 con i processori EPYC di seconda generazione l'hanno fatto. Con un set di dati 10TB, il tempo di completamento della query del cluster E8ds_v4 è stato del 36% più breve di quello del cluster L8s_v2.

Figura 1. Tempo di elaborazione relativo per completare una serie di query di benchmark su un cluster E8ds_v4 VM abilitato a Photon con processori Intel Xeon Scalable di seconda generazione e un cluster L8s_v2 con processori AMD EPYC su set di dati da 1TB e 10TB.

Il tempo di query più veloce si traduce per un valore migliore

Come si acquista per le VM giuste per i tuoi carichi di lavoro Databricks, il prezzo può essere un fattore importante. Per calcolare Prezzo di realizzazione degli scenari di test che descriviamo sulla Pagina precedente, abbiamo iniziato Prezzo all'ora per ogni VM al momento di test. Abbiamo utilizzato questa velocità e i tempi della Figura 1 per determinare Prezzo per ogni corsa di TB per tutti e quattro gli scenari. Come la Figura 2, possiamo eseguire i carichi di lavoro di supporto decisionale su VM Edsv4 fornisce un costo più basso per una data quantità di prestazioni. Per il dataset 1TB, il cluster E8ds_v4 abilitato da processori scalabile Intel® Xeon® di seconda generazione ha offerto il 30% più basso di prestazioni rispetto al cluster L8s_v2 ottimizzato per lo storage con i processori EPYC di seconda generazione. Per il dataset 10TB, il cluster E8ds_v4 ha fornito un risparmio di prezzo/prestazioni del 22%.

Figura 2. Prezzo Normalized / prestazioni per eseguire un carico di lavoro di supporto decisionale contro un ambiente di supporto Databricks su Azure E8ds_v4 abilitato da Photon, rispetto alle VM L8s_v2 su sia dataset 1TB che 10TB.

Conclusioni

Abbiamo studiato due metriche - il tempo per completare un set di query Databricks e il rapporto prezzo/prestazioni - per due diversi set di dati su Microsoft Azure E8ds_v4 VM con processori Intel Xeon Scalable di seconda generazione e VM L8s_ v2 ottimizzate per lo storage con processori AMD EPYC. Le VM E8ds_v4 hanno completato i set di query in fino al 38% in meno di tempo. In combinazione con la tariffazione oraria, queste macchine virtuali hanno fornito risparmi sui costi fino al 30%. Selezionando le VM E8ds_v4 con processori Intel Xeon scalabile di seconda generazione, la tua azienda potrebbe ottenere informazioni prima mentre anche spendendo meno.

Per saperne di più

Per iniziare a eseguire i tuoi cluster Databricks su Microsoft Azure Edsv4 con processori Intel Xeon scalabile di seconda generazione, consultare https://docs.microsoft.com/it-it/azure/virtual-machines/edv4-edsv4-series.

Per dettagli di test e risultati completi mostrando come queste VM Intel Xeon scalabile di seconda generazione sono state affrontate contro le VM con processori di generazione precedente, leggere il report all'indirizzo https://www.intel.it/content/www/it/it/partner/workload/microsoft/enhance-databricks-azure-vms-benchmark.html.