BLOG 24Care - 24Care

24 Care Srl - PI & CF 10185010963
Vai ai contenuti

Manutenzione Efficace Del Server

24Care Srl
Pubblicato da Elvis Plesky in MANUTENZIONE · 20 Maggio 2019
Tags: Manutenzioneserverservermaintenancecomponentipermanutenzioneserver
Un server non richiede manutenzione sotto forma di cambi di olio e controlli della pressione dei pneumatici, ma in molti modi il possesso di apparecchiature informatiche che fungono da server è un po 'come possedere un veicolo. Guidare un'auto non richiede competenze ingegneristiche e l'esecuzione di un server non richiede che tu sia un ingegnere hardware o uno sviluppatore di software.

Con una macchina è necessario avere alcune nozioni di base giuste, i cambi di olio e le verifiche della pressione dei pneumatici più il servizio occasionale. Allo stesso modo un server ha bisogno di manutenzione ordinaria e non si tratta solo di pagare le tariffe di hosting mensili. Il tuo server richiede molta manutenzione regolare, molto più di un veicolo in effetti.

Non è necessario essere un tecnico per eseguire questa manutenzione, ma è necessario sapere che un server che funziona 24 ore su 24, 7 giorni su 7, che serve milioni di client, avrà bisogno di un piano di manutenzione del server. Raramente comporta usura fisica, non sentirai il tuo server cigolare via mentre cerca i file. Ma a livello di software c'è uno strato di usura. Diamo un'occhiata.

Perché è necessario un piano di manutenzione del server
Piani di manutenzione del server: un'introduzione
Costruire un piano di manutenzione del server
Rispondere ai problemi emergenti: ciò di cui hai bisogno
Manutenzione preventiva: la chiave per evitare problemi
Ripristino di emergenza: creazione di un piano per essere operativi
Perché è necessario un piano di manutenzione del server
Le parti mobili del tuo server spesso durano una vita, nessuno apre dischi rigidi e ne lubrifica i cuscinetti, ad esempio. Nel peggiore dei casi potrebbe essere necessario sostituire un fan o due, ma anche questi raramente rinunciano al fantasma. Tuttavia, i server comportano "chilometraggio" in un senso software del termine.

Nel tempo, il tuo server creerà archivi e archivi di grandi dimensioni, inclusi file di cache che possono rallentare i tassi di transazione. Anche la frammentazione delle tabelle SQL nel tempo è un problema. Dato che il volume delle transazioni crea vecchie impostazioni del server potrebbe non essere più valido e il software del server diventerà un obiettivo morbido per gli aggressori. Infine, entrambi gli HDD e gli SSD si deteriorano, sebbene ciò avvenga per un lungo periodo di tempo.

Cosa succede quando si verifica un degrado del server? Bene, nella migliore delle ipotesi puoi soffrire di prestazioni del server più lente, che possono causare problemi nel tuo carico di lavoro e portare a clienti insoddisfatti. Nel peggiore dei casi, è possibile che si verifichino gravi problemi di corruzione dei dati e perdita di dati o furto di dati dovuto all'hacking. Fortunatamente la maggior parte dei problemi di manutenzione del server che abbiamo segnalato può essere gestita utilizzando un piano di manutenzione del server.

Piani di manutenzione del server: un'introduzione
Abbiamo detto che i server precedenti non sono come le macchine, non hanno bisogno di manutenzione fisica, ma che in molti modi i server sono in realtà come le macchine in quanto hanno bisogno di manutenzione del software. Proprio come la tua auto, alcune attività di manutenzione saranno urgenti e richiedono un'attenzione frequente, mentre altre richiedono solo una revisione annuale. Ad esempio, non controllerai il motore e le luci ogni mese, ma controllerai la pressione dei pneumatici almeno una volta al mese. Diamo un'occhiata ad alcuni intervalli per la manutenzione del server:

Controlli giornalieri del server
Ci sono un sacco di cose che devi controllare ogni giorno quando sei responsabile di un piano di manutenzione del server. Innanzitutto, controlla gli aggiornamenti incluso il database dello scanner antivirus e altri aggiornamenti software critici che possono prevenire attacchi zero-day.

In effetti dovresti esaminare attentamente le dichiarazioni di vulnerabilità fatte dai fornitori di software e hardware in modo che tu possa correggere i tuoi server dagli attacchi. Inoltre, controlla i registri di sicurezza per provare i tentativi di intrusione in modo da avere la possibilità di bloccare questi utenti.

Verifiche settimanali del server
Meno frequentemente dovresti verificare che i tuoi backup funzionino. Non è necessario farlo quotidianamente poiché non è probabile che siano necessari backup quando allo stesso tempo i backup hanno improvvisamente smesso di funzionare. Tuttavia, un controllo settimanale è essenziale.

Un altro controllo da eseguire settimanalmente o anche ogni due settimane è l'utilizzo del disco. Anche in questo caso, l'utilizzo del disco cambia di rado improvvisamente, quindi non è qualcosa che devi controllare ogni giorno. Tuttavia a corto di spazio su disco può significare che il server si guasta. Controlla problemi come account che sono file temporanei obsoleti e obsoleti.

Verifiche mensili del server
Ti consigliamo di ottimizzare il tuo database ogni due mesi, la frammentazione del database si verifica ad un tasso fino al 5% al ​​mese e nel tempo la frammentazione colpirà davvero le prestazioni. Anche l'ottimizzazione delle singole applicazioni è importante perché le app non ottimizzate possono pregiudicare le prestazioni.

Tuttavia, poiché i livelli di traffico possono variare molto, può essere utile limitare l'ottimizzazione delle applicazioni a una volta ogni due mesi in modo da ottenere una buona misura dei livelli di carico delle app.

Controlli server in tempo reale
Abbiamo elencato un sacco di punti che devi controllare ogni giorno, ma alcuni controlli devono essere effettuati in tempo reale. In altre parole, per tutto il giorno. Questi punti di dati di integrità del server possono segnalare quando il carico è in aumento e notificare i problemi in anticipo può aiutare a prevenire un errore completo del server: i tempi di inattività sono costosi.

La maggior parte di questi fattori è facile da controllare utilizzando uno strumento di monitoraggio del server, infatti, si potrebbero persino ricevere avvisi automatici. È possibile controllare, ad esempio, la CPU e la temperatura generale del server, lo stato di salute dei volumi RAID e i fattori di carico, incluso il numero di connessioni di rete aperte.

Come i controlli si trasformano in un piano
Che cos'è un piano di manutenzione del server in realtà? Bene, un piano di manutenzione è semplicemente un programma fisso che delinea quale dei suddetti controlli viene effettuato in tempo reale, giornaliero o mensile. Farlo non è difficile: sebbene i grandi operatori dispongano di tecnici interni, le piccole imprese possono fare affidamento sul personale remoto o su un'altra azienda per farlo.

Ma se siete tutti da soli non disperate: potete costruire il vostro piano di manutenzione del server, e non è affatto difficile.

Costruire un piano di manutenzione del server
Un buon punto di partenza è quello di classificare le attività di manutenzione in base a ciò che stai cercando di ottenere con l'attività e di spostarti da lì. In questo articolo, lo divideremo in tre aree.

In primo luogo, esamineremo l'azione che è necessario intraprendere per rispondere in caso di emergenza, chiamiamolo piano di risposta alle emergenze . Questi includono passaggi come ricevere avvisi quando c'è un'emergenza e la possibilità di ripristinare rapidamente il servizio quando qualcosa va storto.

Successivamente, prenderemo in considerazione le misure da intraprendere che possono prevenire le emergenze che si verificano in prima istanza. Ad esempio, è possibile eseguire proattivamente verifiche di sicurezza, analizzare i numeri delle prestazioni e verificare l'utilizzo delle risorse del server.

Infine vedremo alcune azioni che fungono da tipo di assicurazione in caso di problemi con il server. Queste attività, compreso il controllo dei backup e l'esecuzione di controlli di failover, assicureranno che è possibile ripristinare rapidamente il server in caso di necessità.

Rispondere ai problemi emergenti: ciò di cui hai bisogno
Veicoli diversi hanno diversi punti di guasto: un missile ha probabilmente punti di guasto molto diversi da quelli di una bici da corsa. Allo stesso modo, diversi server hanno cause di errore diverse: i motivi per i quali un server di posta potrebbe fallire sono molto diversi dai motivi per cui un server web cadrà.

Per questo motivo non possiamo suggerire un singolo piano che ti dica esattamente cosa devi monitorare per assicurarti di rispondere rapidamente in caso di emergenza. Invece, ti guideremo nella direzione giusta delineando ciò che dovresti prendere in considerazione. Useremo un web server come esempio tipico.

Problemi con la capacità del server e la domanda dell'utente
Il tuo server non è costruito per gestire una domanda illimitata: ha un limite di capacità. A volte la domanda può aumentare in modo imprevisto, forse qualcuno ha inviato un'e-mail popolaresca a un milione di persone o qualcosa su richiesta dei trigger dei social media. Ciò può causare un sovraccarico della memoria, dischi che non possono rispondere e un server che non serve le pagine.

Allo stesso modo, negli ambienti in cui è condiviso l'hosting, alcuni utenti possono eseguire applicazioni che attingono un'enorme quantità di risorse. In effetti, alcuni utenti possono abusare intenzionalmente delle risorse del server non controllando la quantità di carico del server che generano.

Infine, a volte il sovraccarico del server è causato da errori di codifica. Gli script che non sono ben scritti possono causare perdite di memoria e altri problemi con le risorse. Come parte del piano di manutenzione del server, è necessario prestare attenzione sia agli script che agli utenti che sfruttano più della loro giusta quota di risorse del server, tenendo contemporaneamente sotto controllo l'utilizzo del server.

Attacchi al server e malware
Viviamo in un'epoca in cui gli attacchi ai server sono incredibilmente comuni. Questi possono venire in diverse forme. Ad esempio, i robot possono provare a inserire la forza bruta nella macchina e le migliaia di query simultanee coinvolte causeranno problemi di capacità. Un attacco riuscito può portare ad accessi non autorizzati al proprio computer.

Il malware è un'altra grande minaccia, le iniezioni di software tramite vulnerabilità non rivelate e prive di patch possono consentire agli hacker di entrare nel vostro computer, fornendo ancora accesso non autorizzato e potenzialmente portando il server ad essere utilizzato come sito di staging per attacchi su altre macchine.

A parte i rischi di accesso non autorizzato, compresi perdita di dati e problemi di capacità, questi attacchi possono portare a una perdita di reputazione: in altre parole, il tuo server può essere escluso dai risultati dei motori di ricerca e scoprirai che il traffico cala vertiginosamente. Fai attenzione agli attacchi come parte del piano di manutenzione del tuo server.

Errori e insuccessi
I server sono dispositivi altamente connessi: sia internamente su base hardware e software che esternamente. Fai attenzione ai problemi di rete, incluse le connessioni interrotte ai backend del database o altre app su cui fa affidamento il tuo server.

L'hardware è un altro punto che devi guardare, assicurati che il tuo volume RAID rimanga in salute, ad esempio, e guardi gli indicatori chiave come la temperatura della CPU e dello chassis. Infine, se un alimentatore ridondante si guasta, sostituirlo immediatamente e allo stesso modo con i problemi relativi al volume RAID.

In sostanza, è necessario monitorare le statistiche del server a tutti i livelli: traffico di rete, utilizzo, carichi e altro in modo da poter notare quando qualcosa è inusuale. Solo allora puoi investigare ulteriormente. Tuttavia, aiuta ad avere un piano che puoi mettere in atto quando noti una situazione di emergenza in via di sviluppo.

Manutenzione preventiva: la chiave per evitare problemi
Abbiamo delineato ciò di cui hai bisogno per capire quando si tratta di monitorare i problemi emergenti, ma prevenire è meglio della cura. Di nuovo, dipende leggermente da quale server si sta eseguendo, ma diamo un'occhiata ad alcune delle operazioni di manutenzione preventiva che è possibile aggiungere al piano di manutenzione del server in cui il server in questione è un server di database.

Deframmentare e controllare gli indici e l'integrità
I database implicano un enorme volume di operazioni di lettura e scrittura che devono essere gestite rapidamente, di conseguenza un database può diventare frammentato. Eliminare le query in particolare può portare alla frammentazione, motivo per cui è importante ottimizzare regolarmente le tabelle nel database per ridurre la frammentazione che causa problemi di prestazioni e che riduce lo spazio libero.

Allo stesso modo, il piano di manutenzione preventiva del server dovrebbe eseguire regolarmente un'analisi dell'indice, ottimizzando gli indici su cui MySQL è così dipendente. MySQL ha una funzione di analisi che dovrebbe essere eseguita su base mensile per garantire che MySQL trovi sempre i dati velocemente. Analizza snellisce gli indici e si assicura che le query vengano eseguite rapidamente.

L'integrità del database può essere un problema, MySQL a volte perde la traccia dei set di dati a causa di crash del database e altri errori dell'app. Le verifiche settimanali sull'integrità del database possono impedire l'interruzione delle query poiché fornisce a MySQL l'opportunità di correggere gli errori.

Controlla la salute e lo spazio del disco
Proprio come l'integrità del database, non puoi dare per scontato lo stato del disco. Assicurati sempre di controllare i registri del server perché è qui che si trovano gli avvisi di errori HDD e RAID. Questi errori offrono un'indicazione dell'esaurimento del disco rigido o del guasto del volume RAID, offrendo la possibilità di sostituire un'unità prima che faccia cadere il server.

Non è sconosciuto che un server cada perché ha esaurito lo spazio su disco. È necessario lasciare spazio al database per aumentare le dimensioni, eseguire i backup e elaborare le transazioni di database di grandi dimensioni. Liberare spazio rimuovendo i file temporanei, i backup che non sono più rilevanti e altri dati obsoleti.

L'efficienza del cluster è importante, i cluster di database devono essere sincronizzati in modo efficiente se si desidera impedire query lente e errori di database. Ancora una volta, il rilevamento precoce è fondamentale in quanto può impedire un costoso arresto del database.

Scrutare i log SQL
Il tuo server MySQL registrerà gli errori quando trova corruzione della tabella o problemi con gli indici. Il controllo dei registri garantisce che venga visualizzato un avviso tempestivo di possibili errori del database: un registro pieno di errori è un sicuro segnale di avvertimento.

Le domande lente sono un altro punto a cui prestare attenzione. Oltre a evidenziare problemi di prestazioni generali, indica anche quali query specifiche stanno causando problemi di prestazioni, consentendo di ottimizzarle per migliorare le prestazioni del server.

Infine, un controllo dello stato mensile delle velocità del server ti fornirà un record per tornare indietro in modo da poter rilevare quando il server sta iniziando a sperimentare colli di bottiglia. È quindi possibile risolvere questi colli di bottiglia più facilmente prima che emergano problemi più seri.

Nel complesso è necessario un certo grado di esperienza di gestione del server per capire veramente cosa si tratta delle prestazioni del server che possono generare una bandiera rossa, indicando che si sta avvicinando un potenziale problema. Sia che si esegua un server Web, un server DB o altro, la manutenzione preventiva è fondamentale.

Ripristino di emergenza: creazione di un piano per essere operativi
I piani preventivi sono fondamentali per evitare il disastro, ma anche gli ambienti server meglio gestiti occasionalmente affrontano disastri. Come rispondi? Chiaramente, l'obiettivo più importante è far ripartire le cose.

Con un piano di recupero del disastro ben concepito puoi essere attivo e funzionante in un minuto o meno. Il turnaround che è così veloce non è necessario per ogni caso d'uso, alcuni proprietari di siti Web non vedranno alcun danno se il loro sito è inattivo per un'ora o due. Per gli altri, ogni minuto di inattività è una perdita di entrate.

Ci sono una vasta gamma di opzioni che possono ridurre al minimo i tempi di fermo. Questi includono cluster ad alta disponibilità che sono grandi per garantire la continuità del business. L'hardware con tolleranza agli errori, inclusi gli alimentatori ridondanti, può funzionare insieme ai mirror di fail-over per garantire che l'errore hardware non porti mai a lunghi tempi di inattività.

Cruciale per il disaster recovery: i tuoi backup
Alcuni dei punti citati nel paragrafo precedente sono costosi da implementare e al di fuori della portata di molti operatori di siti web. Ma un punto è fondamentale per un piano di manutenzione del server sensato. Ha a che fare con i tuoi backup.

Innanzitutto, assicurati che i tuoi backup vengano completati ogni giorno. Controlla gli errori e assicurati che lo strumento di backup indichi lo stato giusto. Successivamente, è necessario verificare che i backup possano essere ripristinati: è possibile recuperare i dati, c'è qualche danneggiamento? Monitora sempre lo spazio su disco disponibile poiché questo è un motivo principale per il fallimento dei backup. Infine, esegui un test sul processo di ripristino per verificare quanto tempo ci vuole e se riesce in prima istanza. Fai attenzione a problemi imprevisti come problemi di connettività che potrebbero rendere difficile il recupero.

Stabilirsi sul piano di recupero
Infine, nel decidere come si desidera impostare il piano di recupero e su quanto si investe, è necessario valutare attentamente i requisiti dell'applicazione. Inizia pensando a quanto tempo di inattività puoi tollerare: quanto velocemente hai bisogno di ripristinare i servizi prima che il danno diventi intollerabile?

Quindi individuate i piani, il software e infine l'hardware necessario per ottenere il piano di disaster recovery. Nel fare ciò puoi abbinare i trade-off che puoi accettare, contro quelli che non puoi accettare. Ma qualunque cosa tu faccia, verifica sempre il tuo controllo e verifica la tua strategia di backup.



Torna ai contenuti