Le VM Ddsv5 hanno accelerato l'indicizzazione rispetto sia alle VM Dsv3 che Ddsv4 con processori di generazione precedente
Microsoft Azure Kubernetes Services (AKS) offre flessibilità e agilità alle aziende che eseguono i carichi di lavoro di Elasticsearch sui cluster di Kubernetes nel cloud. Quale tipo di VM offre il miglior livello di prestazioni per questi carichi di lavoro? Per scoprirlo, abbiamo confrontato le prestazioni di Elasticsearch di tre tipi di istanze in un ambiente containerizzato di Kubernetes:
- VM Ddsv5 Microsoft Azure con processori scalabili Intel® Xeon® di terza generazione
- VM Ddsv4 Microsoft Azure con processori scalabili Intel® Xeon® di seconda generazione
- VM Microsoft Azure Dsv3 con processori Intel® Xeon® E5-2673 v4
Per quantificare le prestazioni di ricerca di Elasticsearch, abbiamo utilizzato lo strumento di benchmark Rally 2.3.0, che agisce da generatore di carico e registra e memorizza le misurazioni di telemetrica in Elasticsearch durante i carichi di lavoro di ricerca per trovare i problemi di prestazioni per il confronto tra i cluster. Utilizzando due dataset di Rally, nyc_taxis (un dataset di analisi di trasporti) e http_logs (un dataset di servizi web), abbiamo scoperto che le VM Azure Ddsv5 con processori scalabili Intel® Xeon® di terza generazione hanno indicizzato fino a 2,49 volte in più documenti al secondo con tempi ricerca più rapidi fino al 69% rispetto a un cluster di VM Azure Dsv3. Inoltre, le VM Ddsv5 hanno superato le VM Ddsv4 fino al 30% nell'indicizzazione del throughput con tempi di ricerca più brevi del 29%. Per maggiori informazioni su Rally e i carichi di lavoro che abbiamo utilizzato, consultare di seguito.
Ciò dimostra che in più carichi di lavoro di Elasticsearch, selezionando le VM Azure Ddsv5 con la tecnologia di processori più recente può offrire prestazioni di Azure Kubernetes Services migliori di quelle con le due generazioni di processori precedenti. Indicando i contenuti più velocemente, le aziende ricevono i dati di cui hanno bisogno in meno tempo per prendere decisioni aziendali fondamentali.
Indicizza i dati più velocemente per ottenere informazioni più veloci con le VM Azure Ddsv5
Mentre le aziende utilizzano Elasticsearch per molti casi di utilizzo, tra cui il monitoraggio delle prestazioni delle applicazioni, le ricerche di applicazioni e l'analisi aziendale, abbiamo confrontato il throughput di indicizzazione per un carico di lavoro di analisi di trasporti e un tipico carico di lavoro di servizi Web (vedere Figura 1).
Utilizzando il dataset nyc_taxis, che memorizza i dati delle corse di taxi di NYC nel 2015 ed esegue gli scenari di ricerca, le VM Ddsv4 con processori scalabili Intel® Xeon® di seconda generazione indicizzavano il 53% in più di documenti al secondo (docs/s) rispetto al cluster di VM Dsv3. Le VM Azure Ddsv5 con processori scalabili Intel® Xeon® di terza generazione hanno migliorato le prestazioni ancora di più, offrendo il 91% di documenti in più di quelli delle VM Dsv3.
Sul dataset http_logs, che utilizza i dati del log del server HTTP esempio ed esegue gli scenari di ricerca, i tipi di VM hanno mostrato di nuovo scalabilità di prestazioni simili rispetto alle VM Dsv3. Le VM Azure Ddsv4 avevano il 92% di throughput in più, mentre le VM Ddsv5 con processori scalabili Intel® Xeon® di terza generazione avevano un throughput di 2,49 volte di più, per un'indicizzazione significativamente più veloce.
Mantieni i tempi di ricerca bassi con le VM Azure Ddsv5
Il benchmark Rally ha anche catturato la latenza di ricerca durante l'esecuzione dei carichi di lavoro di Elasticsearch. I tempi di ricerca più brevi indicano che le aziende non devono aspettare fino a quando si ottiene informazioni dai loro dati. La figura 2 confronta la latenza di ricerca normalizzata che le VM hanno sperimentato sia per i set di dati nyc_taxis che http_logs. Le VM Ddsv4 con processori scalabili Intel® Xeon® di seconda generazione hanno ridotto la latenza di ricerca del 33% e del 44% rispettivamente. Le VM Ddsv5 più recenti con processori scalabili Intel® Xeon® di terza generazione hanno accelerato ancora di più i tempi di attesa di più, riducendo la latenza di ricerca del 56% e del 69% rispetto alle VM Dsv3.
Conclusioni
Indipendentemente dal tuo caso di utilizzo specifico per Elasticsearch l'indicizzazione di più contenuti al secondo può portare alle informazioni più velocemente. I test mostrano che selezionare le VM Microsoft Azure Ddsv5 con processori scalabili Intel® Xeon® di terza generazione per eseguire la ricerca di Elasticsearch su cluster di Kubernetes può migliorare il throughput di indicizzazione e i tempi di ricerca per più casi di utilizzo.
Se il tipo di istanze cloud che scegliete può indicizzare più dati in meno tempo per informazioni di dati più veloci, potrebbe anche ridurre il numero di istanze che devi acquistare, migliorando potenzialmente i tuoi costi di gestione.
Per saperne di più
Per iniziare a eseguire i carichi di lavoro Elasticsearch sulle VM Ddsv5 Microsoft Azure, visita https://docs.microsoft.com/en-us/azure/virtual-machines/dddv5-ddsv5-series.
Per saperne di più su Elastic, visita https://www.elastic.co/.
Per utilizzare lo strumento di benchmark Rally, visita https://github.com/elastic/rally. È possibile trovare entrambi i dati utilizzati nei test su https://github.com/elastic/rally-tracks/tree/master/http_logs e https://github.com/elastic/rally-tracks/tree/master/nyc_taxis.