Dopo aver recuperato il mio Maxtor dovevo controllare che non avesse errori fisici. Per farlo mi sono affidato a
smartmontool, il quale sfrutta la tecnologia smart (tutti gli hard disk moderni sono smart capable).
Procediamo:
Tutti i test possono essere fatti anche su un hard disk attualmente in uso
Installiamo smart
sudo apt-get install smartmontools
Verifichiamo che l’hard disk supoprti smart
sudo smartctl -i /dev/hdx
Se leggiamo Avaible siamo a cavallo, se leggiamo disable digitiamo
sudo smartctl -s on /dev/hdx
Facciamo un primo test generico ma ugualmente importante…anzi forse più importante
sudo smartctl -H /dev/hdx
Se leggiamo passed possiamo proseguire, se leggiamo failed salviamo i dati di corsa e proviamo ad effettuare una formattazione a basso livello (la speranza è l’ultima a morire)
Con :
sudo smartctl -l error /dev/hda
è possibile avere un log degli errori che il disco ha registrato ( SMART Error Log) a partire dalla prima volta che è stato messo in funzione; guardate se ci sono errori registrati, se non sono recenti non preoccupiamoci
Proseguiamo con test più specifici:
smartctl -t offline /dev/hda
In questo modo eseguiamo lo SMART Immediate Offline Test, per vedere i risultati bisogna pazientare il programma vi dice quando finirà il test, dovrebbe infatti scrivere una cosa tipo “Please wait 2120 seconds for test to complete. Test will complete after Mon Jun 18 23:21:16 2007″. Per vedere i risultati del test visualizziamo lo SMART Error Log come descritto sopra.
A questo punto eseguiamo a scelta lo SMART Short Self Test o lo SMART Extended Self Test, ovviamente il secondo è più approfondito del primo (mettere short al posto di long per evvettuare lo Short Self Test)
smartctl -t long /dev/hda
I risultati di entrambi i test vengono riportati nel Self Test Error Log:
smartctl -l selftest /dev/hdx
MONITORIAMO AUTOMATICAMENTE L’HARD DISK
Quello che ho fatto è stato configurare il demone smartd in modo che facesse tutti questi test descritti fin’ora nell’arco di 4 ore (11-15) ogni 2 giorni circa (Lunedì Mercoledì Venerdì Domenica); la mia però è una situazione particolareil mio hard disk ne ha passate di tutti i colori, se non avete problemi particolari vi basterà fare i test 1 volta a settimana. Se il demone rileva qualche errore dovrà scrivere su un file di log l’errore e volendo dovrà anche spegnere il computer (per salvaguardare i dati).
Quindi nel file /etc/smartd.conf ho scritto:
/dev/hdx \
-H \
-l error -l selftest \
-s (O/../../(1|3|5|7)/11|L/../../(1|3|5|7)/13|C/../../(1|3|5|7)/15) \
-m ThisIsNotUsed -M exec /percorso_script
Il contenuto dello script sarà invece:
#!/bin/bash
FILE=”/percorso_file_log”
echo “$SMARTD_MESSAGE” >> “$FILE”
halt
Questi sono i miei script se volete modificarli vi rimando al man di smartd.conf
Ora proviamo ad avviare il demone
sudo /etc/init.d/smartd restart
Dato che all’avvio del demone i test vengono fatti anche se non è il giorno prestabilito, se il file di log viene creato in teoria tutto funziona! Per avviare il demone all’avvio del computer in debian basta modificare /etc/default/smartmontools.
MONITORARE LA TEMPERATURA
Niente di più semplice, basta usare hddtemp
sudo apt-get install hddtemp
sudo hddtemp /dev/hdx
Per monitorare la temperatura periodicamente si può usare cron
sudo crontab -e
Così si modificherà il file di cron, io l’ho impostato così
# m h dom mon dow command
0 0,4,8,12,16,20 * * * /bin/date >> /file_di_log
0 0,4,8,12,16,20 * * * /usr/sbin/hddtemp /dev/hdx >> /file_di_log
Così ogni 4 ore avrò nel mio file la data e la temperatura, come per smart io ho messo ogni 4 ore perchè ho paura che l’hard disk si fonda, modificate a piacimento!
Buon monitoraggio!
Grazie per la guida, ce li ho solo io questi errori?
utente@pc01:~$ sudo smartctl -l error /dev/hda | grep Error
SMART Error Log Version: 1
ATA Error Count: 193 (device log contains only the most recent five errors)
ER = Error register [HEX]
Error 193 occurred at disk power-on lifetime: 3048 hours (127 days 0 hours)
40 d1 08 56 5f b6 e1 Error: UNC at LBA = 0x01b65f56 = 28729174
Error 192 occurred at disk power-on lifetime: 3048 hours (127 days 0 hours)
40 d1 08 de 5b 7a e1 Error: UNC at LBA = 0x017a5bde = 24796126
Error 191 occurred at disk power-on lifetime: 3048 hours (127 days 0 hours)
40 d1 08 de 5b 7a e1 Error: UNC at LBA = 0x017a5bde = 24796126
Error 190 occurred at disk power-on lifetime: 3048 hours (127 days 0 hours)
40 d1 08 de 5b 7a e1 Error: UNC at LBA = 0x017a5bde = 24796126
Error 189 occurred at disk power-on lifetime: 3048 hours (127 days 0 hours)
40 d1 78 0e c4 b7 e1 Error: UNC at LBA = 0x01b7c40e = 28820494
utente@pc01:~$ sudo smartctl -l error /dev/hdb | grep Error
SMART Error Log Version: 1
ATA Error Count: 8176 (device log contains only the most recent five errors)
ER = Error register [HEX]
Error 8176 occurred at disk power-on lifetime: 1 hours (0 days 1 hours)
10 51 2e 91 2b c9 f4 Error: IDNF at LBA = 0x04c92b91 = 80292753
Error 8175 occurred at disk power-on lifetime: 1 hours (0 days 1 hours)
10 51 2e 91 2b c9 f4 Error: IDNF at LBA = 0x04c92b91 = 80292753
Error 8174 occurred at disk power-on lifetime: 1 hours (0 days 1 hours)
10 51 2e 91 2b c9 f4 Error: IDNF at LBA = 0x04c92b91 = 80292753
Error 8173 occurred at disk power-on lifetime: 1 hours (0 days 1 hours)
10 51 2e 91 2b c9 f4 Error: IDNF at LBA = 0x04c92b91 = 80292753
Error 8172 occurred at disk power-on lifetime: 1 hours (0 days 1 hours)
10 51 2e 91 2b c9 f4 Error: IDNF at LBA = 0x04c92b91 = 80292753
credo siano dei blocchi/settori danneggiati…puoi anche andare avanti per un bel pò con pochi blocchi danneggiati non c’è nessuna controindicazione…infatti come puoi notare in hda l’errore è iniziato 127giorni fa.
Io stesso sto usando il mio hard disk con 41 settori danneggiati…prima della formattazione a basso livello ne aveva qlc migliaia. Quindi a voler fare le cose fatte bene una formattazione a basso livello non gli farebbe male!
Non ne ho avute esperienze positive con la tecnologia smart. Avevo un Maxtor con dei valori perfetti… tutto di un tratto è partito meccanicamente (sdeenngg… sdeeng) e lo Smart monitor mi diceva TUTTO OK!!!!
Sicuramente possono aiutare… ma non si deve ma fidare troppo!! 🙂
Io incrocio le dita 🙂