Che cos'è la telemetria del cloud?
La telemetria del cloud utilizza strumenti software per registrare e analizzare informazioni sull'infrastruttura IT che altrimenti sarebbero difficili da raccogliere.
Per la gestione del cloud, la telemetria è fondamentale: l'occhio umano non nota grandi differenze nell'infrastruttura IT quando l'hardware non sta funzionando in modo ottimale. La telemetria offre ai professionisti dell'IT la possibilità di osservare i componenti e monitorare le applicazioni in modo più profondo, con metodi di misurazione che tracciano prestazioni, utilizzo, consumo energetico e altro ancora.
Utilizzando in modo efficace la telemetria, le aziende possono migliorare i principali indicatori delle prestazioni, tra cui il TCO, l'affidabilità, la sicurezza, le prestazioni e il consumo energetico. La telemetria può inoltre generare informazioni utili ai team IT per la gestione dei requisiti di capacità in evoluzione e per la rilevazione dell'efficienza dell'utilizzo dell'infrastruttura.
Grazie ai recenti progressi nella telemetria e nell'orchestrazione cloud, le aziende possono progredire verso un data center davvero moderno e autonomo. L'IA e l'analisi predittiva nella telemetria del cloud sono in grado di prevedere guasti e altri problemi (e talvolta li risolvono senza coinvolgimento umano).
Ottimizzazione dell'infrastruttura con la telemetria
Negli ultimi anni, le funzionalità della telemetria sono diventate più solide. Nuovi metodi di misurazioni e tecniche, resi disponibili con hardware avanzati, consentono un monitoraggio e un'analisi del cloud più approfonditi rispetto alle precedenti generazioni di tecnologie. La promozione del valore e delle prestazioni dall'infrastruttura richiede un approccio olistico e multisistema alla telemetria.
Server
La protezione degli investimenti effettuati su hardware richiede una telemetria del server che offra uno sguardo approfondito sulla salute del server. I parametri che riguardano il consumo di energia e il flusso d'aria volumetrico, nonché il surriscaldamento e il raffreddamento, possono contribuire a identificare i problemi che potrebbero compromettere la salute dell'hardware. Il monitoraggio e il bilanciamento del carico del server, nonché il tracciamento della memoria del server, sono anch'esse considerazioni importanti.
Computing
Grazie a una telemetria efficace, le aziende possono gestire le risorse di elaborazione in modo più efficiente. La telemetria è in grado di rilevare l'utilizzo per core e confrontare le percentuali di uso della CPU con le specifiche dei componenti. Se una CPU sta funzionando in modo inefficiente, l'IT può procedere a una risoluzione dei problemi o sostituirla al fine di raggiungere i livelli di prestazioni attesi.
Memoria
La telemetria per i moduli di memoria a doppia faccia classici (DIMM) si concentra sulla previsione dei guasti. Poiché i problemi su una DIMM specifica si estenderanno spesso a un lotto intero, la telemetria potrebbe contribuire ad analizzare quali altre DIMM sostituire per minimizzare i guasti. I moduli di memoria persistente (PMM) moderni come la memoria persistente Intel® Optane™ consentono una telemetria più robusta. Ciò è dovuto a un analizzatore di resistenza, di cui sono dotati i PMM, dalla durata predefinita per migliorare la manutenzione predittiva.
Storage
Le unità a stato solido (SSD) hanno condotto a miglioramenti significativi nelle funzionalità di telemetria. Queste unità, tra cui le SSD Intel®, possiedono moderni strumenti di analisi della saluto che forniscono informazioni sulle prestazioni e sulla durata residua dell'unità. Man mano che la salute dell'unità diminuisce, la telemetria rende possibile la previsione dei guasti delle unità.
Networking
La telemetria per l'infrastruttura di rete sta avanzando negli ultimi anni. Mentre le unità legacy consentivano solo un'analisi dell'I/O e delle prestazioni, le unità più recenti sono in grado di offrire una visione più completa dell'utilizzo della rete. Con le schede di rete intelligenti con FPGA Intel®, il bilanciamento del carico può essere gestito da vicino per diminuire i carichi di lavoro di rete dalle risorse di elaborazione centrale.
Applicazioni
La telemetria sotto forma di monitoraggio delle applicazioni può offrire uno sguardo più approfondito per verificare se le tue applicazioni stiano soddisfacendo i benchmark. I team IT sono in grado di analizzare i tempi di latenza e gli intervalli di caricamento, nonché altri indicatori della salute globale delle applicazioni.
Utilizzando in modo efficace la telemetria, le aziende possono migliorare i principali indicatori delle prestazioni, tra cui il TCO, l'affidabilità, la sicurezza, le prestazioni e il consumo energetico.
Strategia di telemetria: suggerimenti per voi
Non esiste una strategia di telemetria adatta a tutti. La vostra infrastruttura esistente, le considerazioni sui costi a breve e lungo termine e gli obiettivi aziendali determineranno la direzione generale della vostra strategia.
Tuttavia, alcuni principi di base si applicano a qualsiasi azienda nella speranza di prepararsi per il futuro con una moderna strategia di telemetria:
- Meno è meglio: mentre la telemetria si concentra sulla raccolta di informazioni sull'hardware e sul software, non tutti i dati sono ugualmente importanti. Spesso, le informazioni vengono raccolte in massa, ma solo parzialmente utilizzate. È importante identificare le giuste misurazioni da eseguire.
- Passo a passo: l'analisi dei carichi di lavoro è un processo composto da quattro fasi, che inizia dalla verifica della salute della piattaforma e dalla convalida dell'hardware. Poi, bisogna usare la caratterizzazione per comprendere meglio il comportamento del sistema. Bilanciate la vostra piattaforma per carichi di lavoro specifici un hardware di giuste dimensioni. Una volta che l'immagine dell'hardware si presenta bene, tracciate un profilo del software e ottimizzatelo per identificare le inefficienze.
- Diventare predittivi: hardware e strumenti più recenti consentono di individuare i problemi prima che si manifestino. Attraverso la transizione a hardware in grado di misurare la propria salute e durata residua, è possibile mettere a punto una strategia di manutenzione predittiva piuttosto che reattiva che minimizzi i guasti e le interruzioni di servizio.
- Automazione delle decisioni: grazie al miglioramento della telemetria nell'identificazione dei problemi, l'estrazione dei dati dell'infrastruttura può aiutarvi a prendere decisioni migliori sull'utilizzo e l'ottimizzazione delle prestazioni. Rilevando il modo in cui i carichi di lavoro sono stati bilanciati e i componenti sono stati utilizzati in passato, l'estrazione dei dati dell'infrastruttura può consentire decisioni migliori sul futuro. Molte di queste decisioni possono anche essere prese automaticamente dopo la formazione dei modelli di IA, in modo tale che le prestazioni e il consumo energetico possano essere ottimizzate senza l'intervento umano.
Le funzionalità di telemetria spesso si evolvono di pari passo con i progressi dell'infrastruttura, ad esempio, man mano che nuovi tipi di hardware consentono l'esecuzione di nuove misurazioni. Considerate ogni nuovo componente in aggiunta alla vostra configurazione attuale e se può avere un impatto sulla vostra strategia e sui metodi di misurazione chiave.
Strumenti Intel per la telemetria cloud
Presso Intel, ci impegniamo ad aiutare le aziende a capire come utilizzare efficacemente la telemetria e a trovare metodi di misurazione efficienti. Dalla telemetria basata su hardware ai kit di sviluppo e ai framework per gli ingegneri prestazionali, la tecnologia Intel® opera per migliorare la telemetria del cloud moderna.
Intel ha portato la telemetria all'interno dei chip grazie alle nostre unità avanzate di monitoraggio delle prestazioni (Intel® PMU). Questo hardware sofisticato su chip permette una telemetria più robusta con metodi misurazione e diagnostica avanzati. Continuiamo a sviluppare i PMU insieme ai nostri aggiornamenti dell'architettura.
Con Intel® Telemetry Collector (ITC), i team IT possono analizzare e visualizzare le prestazioni per una gamma di sistemi. ITC offre l'accesso alla stessa raccolta di strumenti che i propri ingegneri prestazionali di Intel userebbero nell'analisi delle prestazioni.
Con l'evoluzione delle funzionalità di telemetria, Intel proseguirà nella missione finalizzata all'innovazione e alla formazione per tutte le fasi dell'analisi e dell'ottimizzazione dei carichi di lavoro. Dall'analisi predittiva e aumentata ai progressi della telemetria basata su hardware, siamo entusiasti di consentire la tecnologia del futuro per i nostri clienti, oggi.