disco rigido - Differenza tra l'errore S.M.A.R.T. 0x05 (settore riallocato) e 0xC6 (settore non correggibile)
Il mio HDD esterno da 2 TB ha recentemente iniziato a segnalare un numero molto elevato di errori di 0xC5 (settori in sospeso) (valore grezzo: 309) e proprio oggi ha segnalato un errore di settore non correggibile (valore grezzo: 1) mentre il conteggio dei settori riallocati è rimasto a 0. Potrebbe essere irrilevante, ma anche il mio conteggio dei settori in sospeso è stato incrementato di 1.
Se ho capito bene, i settori in sospeso che il firmware dell'HDD determina essere danneggiati vengono riallocati (o rimappati), incrementando così il conteggio dei settori riallocati. Sono curioso di sapere perché questo settore che il mio HDD ha determinato essere difettoso non è stato riallocato e semplicemente contrassegnato come non correggibile. Qual è la differenza esplicita tra i due errori e perché uno dovrebbe essere segnalato al posto dell'altro? Ho ragione a concludere che il settore non correggibile non è stato riallocato e che l'unità tenterà comunque di utilizzare quel settore e causerà problemi (ad esempio lo stallo durante il tentativo di lettura/scrittura)?
Risposta #1
Hai quasi completamente ragione, tranne per il fatto che l'interpretazione di 0xC5 è più delicata. Da Wikipedia:
Conteggio dei settori "instabili" (in attesa di essere rimappati, a causa di errori di lettura irrecuperabili). Se un settore instabile viene successivamente letto con successo, il settore viene rimappato e questo valore viene diminuito. Gli errori di lettura su un settore non rimappano immediatamente il settore (poiché il valore corretto non può essere letto e quindi il valore da rimappare non è noto e potrebbe anche diventare leggibile in seguito); Al contrario, il firmware dell'unità ricorda che il settore deve essere rimappato e lo rimapperà la prossima volta che viene scritto. [29] Tuttavia, alcune unità non rimappacheranno immediatamente tali settori quando vengono scritte; Al contrario, l'unità tenterà prima di scrivere nel settore problematico e, se l'operazione di scrittura ha esito positivo, il settore verrà contrassegnato come buono (in questo caso, il "Conteggio eventi di riallocazione" (0xC4) non verrà aumentato). Si tratta di una grave carenza, poiché se tale unità contiene settori marginali che si guastano costantemente solo dopo che è trascorso un certo periodo di tempo a seguito di un'operazione di scrittura riuscita, l'unità non rimappa mai questi settori problematici.
Come puoi vedere, 0xC5 settori sono quelli per i quali c'è ancora la possibilità di recuperare i dati in essi contenuti. In questo senso, i dati su 0xC5 vengono congelati e la rimappatura avverrà se i dati possono essere letti e l'integrità dei file ripristinata completamente mediante la rimappatura
0xC6 è invece,
Il conteggio totale degli errori non correggibili durante la lettura/scrittura di un settore. Un aumento del valore di questo attributo indica difetti della superficie del disco e/o problemi nel sottosistema meccanico.
All'inizio dell'articolo, si dice che:
Il lavoro di Google su oltre 100.000 unità in un periodo di 9 mesi ha trovato correlazioni tra alcune informazioni SMART e i tassi di errore effettivi. Nei 60 giorni successivi al primo errore non correggibile su un'unità (attributo SMART 0xC6 o 198), l'unità aveva, in media, una probabilità 39 volte maggiore di guastarsi rispetto a quella che sarebbe stata se non si fosse verificato tale errore.
Dovresti notare che la presenza o l'assenza di tali errori non è un potente indicatore dell'avvicinarsi del guasto del disco, perché una grande frazione (circa un terzo) di tutti gli HDD si guasta senza un singolo avviso SMART. Tuttavia, una volta che si è verificato uno di questi guasti, le possibilità di avvicinarsi al fallimento sono molto più alte.
Un semplice commento sul RAW_value: sei fortunato che il tuo produttore lo utilizzi in modo intuitivo, cioè come semplice conteggio di questo tipo di errori. Sei fortunato perché SMART non fa parte dello standard T13/ATA; RAW_VALUE attributi sono dati a 64 bit che possono essere codificati in qualsiasi formato desiderato dal fornitore dell'unità. Seagate (ad esempio, ho una certa esperienza con questo) codifica alcuni dei loro attributi; La formula per decodificarli è sconosciuta e non documentata. E, quel che è peggio, non sono i soli a farlo.