Kontrola stavu disků v systému Linux. Kontrola pevného disku v Linuxu

od Admin

Podívejme se na způsoby, jak zkontrolovat a diagnostikovat hdd v systémech Linux. Informace o provozu HDD vám pomohou analyzovat stav a v případě potřeby vyměnit vadné médium, čímž zabráníte pádu systému nebo ztrátě dat. Navíc zpřísňujeme monitorování chytrý HDD do našeho monitorovacího systému zabbix

Získáme seznam připojených jednotek v systému

Abychom zjistili, co je kde namontováno, udělejme to

Dívej se rušné místo na jednom nebo druhém pohonu

Pokud je jízda měkká, zkontrolujme to následujícím příkazem

root@big:~# cat /proc/mdstat
Osobnosti:
md1: aktivní raid1 sdb3 sda3
965888832 bloků super 1.2

md0: aktivní raid1 sdb1 sda1
9756544 bloků super 1.2
nepoužívaná zařízení:
root@big:~#

jaký raid je nainstalován (sestaven)
md0- název raidového zařízení
sda sdb- zahrnutá zařízení v tomto raidu
- stav disků v poli RAID

Nainstalujte potřebné balíčky

aptitude install hdpparm sysstat smartmontools

Podíváme se na stav rychlosti čtení z disku

S pomocí iostat(jako součást sysstat) analyzujeme zatížení našich HDD

Díváme se na datový výstup pro všechny disky v intervalu 10 sekund

Jednotku, kterou chcete analyzovat, můžete definovat přidáním

Pomocí této utility určíme zátěž našich zařízení, I/O statistiky a procentuální využití.

avg-cpu: %uživatel %pěkný %Systém %iočekejte %ukrást %líný
0,16 0,00 1,89 23,75 0,00 74,21

Kontrola stavu pohonů

Nejprve zkontrolujte, zda na našem HDD nejsou špatné bloky, v případě potřeby je vyberte a označte je jako ignorované.

badblocks /dev/sda3 -sv > /root/badblockSDA3
Kontrola špatných bloků (test pouze pro čtení): 27,93 % hotovo, uplynulo 36:12. (0/0/0 chyb)

/dev/sda3- název testovaného zařízení
s- zobrazení procentuálních informací
proti- povolit podrobný režim
> /root/badblockSDA3- zápis vadných sektorů do souboru

Označení špatných bloků (v budoucnu budou označené bloky systémem ignorovány):

e2fsck -l /root/badblockSDA3 /dev/sda3

Špatné bloky jsou označeny a můžete s diskem pracovat.

POZORNOST!!! Tato operace musí být provedena na nepřipojeném médiu nebo v režimu pouze pro čtení

POZORNOST!!! Testované zařízení a zařízení, na kterém budou označeny špatné bloky, musí být stejné!

Přijímáme data S.M.A.R.T o provozu HDD

Kde /dev/sdX je název zařízení, které je třeba zkontrolovat.
Získáte výstup atributů S.M.A.R.T., význam každého z nich je dobře popsán na wiki

Sledování stavu S.M.A.R.T pevných disků v Zabbix

U každého disku kontrolujeme podporu SMART

root@big:~# smartctl -i /dev/sda |grep SMART
Podpora SMART je: Dostupné – zařízení má funkci SMART.
Podpora SMART je: Povoleno
root@big:~#

Pokud je podporována, ale není povolena, povolte ji

smartctl -s na -S na -o na /dev/sda

zkontrolujte stav pomocí příkazu

smartctl -H /dev/sda |grep "test"| cut -f2 -d: |tr -d " "

root@big:/etc/zabbix# smartctl -H /dev/sda |grep "test"| cut -f2 -d: |tr -d " "
PROSTĚNO
root@big:/etc/zabbix#

V konfiguračním souboru agenta zabbix povolte pro disk možnost inteligentní kontroly

UserParameter=HDD_smart.[*],sudo smartctl -H /dev/$1 |grep "test"| cut -f2 -d: |tr -d " "

Kde HDD_smart- klíč pro prvek zabbix

PROTI sudoři přidat záznam

zabbix ALL=NOPASSWD:/usr/sbin/smartctl

restartujte sudo a zabbix agenta.

Abychom si byli jistí správností, přihlaste se jako uživatel zabbix a zkontrolujte provedení našeho příkazu

root@big:/etc/zabbix# su - zabbix -s /bin/bash
Adresář chybí nebo je nepřístupný, přihlaste se pomocí HOME=/
zabbix@big:/$ sudo smartctl -H /dev/sda |grep "test"| cut -f2 -d: |tr -d " "
PROSTĚNO
zabbix@big:/$

Vytvořme agenta zabbix na serveru zabbix ( Aktivní) datový prvek

název- libovolný
Typ- Agent Zabbix (aktivní)
Klíč- HDD_smart. - pro první disk, pro druhý, resp...
Typ- Symbol

A po nějaké době pozorujeme data

Vadný pevný disk je jedním z nejnepříjemnějších jevů v provozu počítače. Nejen, že můžeme snadno hodně ztratit důležitá informace a souborů a výměna HDD si vybírá daň z rozpočtu. K tomu připočtěme promarněný čas a nervy, které, jak známo, nejsou obnoveny. Aby nás problém nezaskočil a diagnostikoval jej předem, stojí za to vědět, jak zkontrolovat chyby na pevném disku v OS Ubuntu. Softwarové nástroje Lidí, kteří takové služby poskytují, je spousta.

Jak testovat v Ubuntu HDD za chyby.

Pro provedení kontroly disku v Ubuntu není vůbec nutné stahovat programy. Operační systém již obsahuje obslužný program určený pro tento úkol. Říká se tomu badblocks a ovládá se přes terminál.

Otevřete terminál a zadejte:

Tento příkaz zobrazí informace o všech pevných discích, které systém používá.

Poté zadáme:

sudo badblocks -sv /dev/sda

Příkaz se již používá k vyhledávání poškozených sektorů. Místo /dev/sda zadejte název vašeho disku. Přepínače -s a -v se používají k zobrazení průběhu kontroly bloků (bloků) ve správném pořadí a k poskytování zprávy o všech akcích (v).

Stisknutím Ctrl + C zastavíme kontrolu pevného disku.

Ke sledování systému souborů můžete také použít dva další příkazy.

Chcete-li odpojit systém souborů, zadejte:

Chcete-li zkontrolovat a opravit chyby:

sudo fsck -f -c /dev/sda

  • „-f“ vynutí proces, to znamená, že jej spustí, i když je HDD označen jako zdravý;
  • "-c" najde a označí špatné bloky;
  • "-y" je další vstupní argument, který okamžitě odpovídá Ano na všechny systémové otázky. Místo toho můžete zadat „-p“, zkontroluje se to automaticky.

Programy

Další software s touto funkcí také skvěle pracuje. A někdy i lepší. Pro některé uživatele je navíc práce s grafickým rozhraním jednodušší.

GParted je jen pro ty, kteří nemají rádi textové rozhraní. Nástroj provádí velké množství souvisejících úkolů Provoz HDD na Ubuntu. To zahrnuje kontrolu chyb na disku.

Nejprve si musíme stáhnout a nainstalovat GParted. Pro stažení z oficiálních úložišť zadejte následující příkaz:

sudo apt-get install gparted

  1. Otevřete aplikaci. Všechna média se okamžitě zobrazí na hlavní obrazovce. Pokud je některý z nich označen vykřičník, to znamená, že už s ním není něco v pořádku.
  2. Klikněte na disk, který chcete zkontrolovat.
  3. Klikněte na tlačítko „Sekce“ umístěné nahoře.
  4. Vyberte „Kontrola chyb“.

Program prohledá disk. V závislosti na jeho objemu může proces trvat déle nebo méně. Po skenování budeme informováni o jeho výsledcích.

Jedná se o složitější nástroj, který provádí vážnější kontrolu HDD různé parametry. V důsledku toho je také náročnější na správu. GUI není k dispozici ve Smartmontools.

Stáhněte si program:

aptitude install smartmontools

Podívejme se, jaké disky jsou připojeny k našemu systému. Je třeba dávat pozor na řádky končící písmenem, nikoli číslem. Tyto řádky obsahují informace o discích.

ls -l /dev | grep -E 'sd|hd'

Zadejte příkaz pro výstup detailní informace o dopravce. Vyplatí se podívat na parametr ATA. Faktem je, že při výměně nativního disku je lepší nainstalovat zařízení se stejným nebo větším ATA. Tímto způsobem můžete maximalizovat jeho schopnosti. A také se podívejte a zapamatujte si parametry SMART.

smartctl –info /dev/sde

Začněme kontrolou. Pokud je podporováno SMART, přidejte „-s“. Pokud není podporován nebo je již povolen, lze tento argument odstranit.

smartctl -s na -a /dev/sde

Poté se podívejte na informace v části READ SMART DATA. Výsledek může nabývat dvou hodnot: PASSED nebo FAILED. Pokud se objeví to druhé, můžete začít dělat zálohy a hledat náhradní pevný disk.

Tím možnosti programu nekončí. Ale jednorázově kontroly HDD tohle bude celkem dost.

Bezpečná kopie

Toto je již program, který je vhodný pro použití na potápějící se lodi. Pokud si uvědomujeme, že s naším diskem není něco v pořádku, a snažíme se zachránit co nejvíce přeživších souborů, pak přijde na pomoc Safecopy. Jeho úkolem je právě kopírování dat z poškozených médií. Navíc extrahuje soubory i z poškozených bloků.

Nainstalujte Safecopy:

sudo apt install safecopy

Přenášíme soubory z jednoho adresáře do druhého. Můžete si vybrat jakýkoli jiný. V tomto případě přenášíme data z jednotky sda do domovské složky.

sudo safecopy /dev/sda /home/

Špatné bloky

Někteří mohou mít otázky: „Co jsou tyto rozbité bloky a kde se vůbec vzaly na mém HDD, když jsem se ho nikdy nedotkl? Špatné bloky nebo chybné sektory jsou části HDD, které již nejsou čitelné. Každopádně takto byly označeny souborovým systémem z objektivních důvodů. A s největší pravděpodobností je v těchto místech s diskem opravdu něco v nepořádku. „Špatné“ se nacházejí jak na starých pevných discích, tak na těch nejmodernějších, protože fungují pomocí téměř stejných technologií.

Chybné sektory se objevují z různých důvodů.

  • Záznam byl přerušen kvůli výpadku napájení. Všechny informace vstupující na pevný disk jsou rozděleny ve formě jedniček a nul na různé části. Narušit tento proces znamená značně zmást pevný disk.
  • Nekvalitní montáž. Tady není co říct. S levným čínským zařízením může létat cokoli.

Nyní víte, jak zkontrolovat chyby na pevném disku. Kontrola disku, jak na Ubuntu, tak na jiných systémech, je poměrně důležitá operace, která by se měla provádět alespoň jednou ročně.

Každý počítač je složité zařízení, které se skládá z mnoha součástí a nikdo není imunní vůči selhání kterékoli z nich. V tomto článku se podíváme na to, jak rychle rozpoznat jeden z vážných problémů se zařízeními pro ukládání informací, ať už je to pevný disk nebo flash disk, a jak se v Linuxu kontroluje disk na chybné sektory.

Každá jednotka se skládá z mnoha malých bloků (sektorů), které ukládají informace ve formě nul nebo jedniček (bitů). Pokud z nějakého důvodu operační systém nemůže zapsat část informace do určitého sektoru, lze jej považovat za „rozbitý“.

Sektor může být poškozen z různých důvodů:

  • Výrobní vady
  • Během záznamu informací vypněte napájení počítače.
  • Fyzické opotřebení pohonu.

Malé množství špatné sektory lze nalézt téměř na jakémkoli úložném zařízení. Ale stojí za to věnovat pozornost, pokud se jejich počet v průběhu času zvyšuje. To může znamenat blížící se fyzickou smrt disku a je čas, abyste přemýšleli o jeho výměně.

Podívejme se, které linuxové nástroje můžeme použít ke kontrole disku na špatné linuxové sektory.

Kontrola chybných sektorů na disku pomocí chybných bloků.

Badblocks je standardní linuxový nástroj pro kontrolu chybných sektorů. Ve výchozím nastavení se instaluje téměř v jakékoli distribuci a lze jej použít ke kontrole pevného disku i externího disku.

Nejprve se podívejme, jaké disky jsou připojeny k našemu systému a jaké mají oddíly. K tomu potřebujeme další standardní linuxovou utilitu – fdisk.

Přirozeně musíte provádět příkazy s právy superuživatele:

Parametr -lřekneme fdisku, že musíme zobrazit seznam oddílů a ukončit.

Nyní, když víme, jaké máme oddíly, můžeme v nich zkontrolovat chybné sektory. K tomu použijeme nástroj badblocks následovně:

sudo badblocks -v /dev/sda1 > badsectors.txt

Pro kontrolu specifikujeme následující parametry:

  • -proti- podrobný výstup informací o výsledcích testu.
  • /dev/sda1- sekce, ve které chceme zkontrolovat chybné sektory.
  • > badsectors.txt- výstup výsledku příkazu do souboru badsectors.txt.

Pokud byly v důsledku toho nalezeny vadné sektory, musíme dát pokyny operační systém v budoucnu do nich nezaznamenávejte informace. K tomu potřebujeme Linuxové nástroje pro práci se souborovými systémy:

  • e2fsck. Pokud opravíme oddíl se souborovými systémy Linux (ext2,ext3,ext4).
  • fsck. Pokud opravíme jiný souborový systém než ext.

Zadejte následující příkazy:

sudo e2fsck -l badsectors.txt /dev/sda1

Nebo, pokud náš souborový systém není ext:

sudo fsck -l badsectors.txt /dev/sda1

Parametr -lřekneme obslužnému programu, aby použil seznam vadných sektorů ze souboru badsectors.txt, který jsme získali dříve při kontrole pomocí obslužného programu badblocks.

Kontrola disku na chybné sektory v Linuxu v smartmontools

Nyní se podíváme na modernější a spolehlivým způsobem zkontrolujte disk, zda neobsahuje špatné linuxové sektory. Moderní disky ATA/SATA, SCSI/SAS, SSD mají vestavěný systém vlastního monitorování S.M.A.R.T (technologie samomonitorování, analýzy a reportování, technologie vlastního monitorování, analýzy a hlášení), která monitoruje parametry měniče a pomůže určit zhoršení parametrů měniče v raných fázích. Pro práci s S.M.A.R.T v Linuxu existuje utilita smartmontools.

Nejprve jej nainstalujme. Pokud je vaše distribuce založena na Debian\Ubuntu, zadejte:

sudo apt install smartmontools

Pokud máte distribuci založenou na RHEL\CentOS, zadejte:

sudo yum nainstalovat smartmontools

Nyní, když jsme nainstalovali smartmontools, můžeme zobrazit stránku nápovědy pomocí příkazu:

Přejděme k práci s obslužným programem. Zadejte následující příkaz s parametrem -H aby nám obslužný program zobrazil informace o stavu disku:

sudo smartctl -H /dev/sda1

Jak můžete vidět, kontrola disku na špatné linuxové sektory je dokončena a nástroj nám říká, že s jednotkou je vše v pořádku!

Kromě toho můžete zadat následující parametry -A nebo --Všechno získat ještě více informací o pohonu, popř -X A --xall pro zobrazení informací, včetně dalších parametrů pohonu.

závěry

V tomto článku jsme se podívali na způsoby, jak pod Linuxem zkontrolovat disky na chybné sektory, abychom včas předvídali možné poruchy a neztratili data.

S tímto problémem jsem se také musel potýkat. Můj jeden přítel, který nainstaloval Ubuntu jako starý notebook ASUS, a kdo prostě občas nechce používat mozek, přišel za mnou s takovým problémem. Na jeho notebooku je nainstalováno nové Ubuntu 12.10 a systém se velmi často nechce nabootovat, hází ho na černou obrazovku nebo zamrzá na fialovém pozadí. Ale v Nedávno Tato zpráva se začala objevovat, něco jako „Operační systém nelze spustit. Vyberte požadovanou klávesu pro další akce...“ A pak následuje popis toho, co je potřeba stisknout. Nepamatuji si přesně, které klávesy systém navrhuje stisknout, ale význam je v tom, že pro automatickou opravu chyb stiskněte tu a takovou klávesu, pro ruční ladění jinou a pro ignorování této zprávy jste požádáni o stisknutí třetího tlačítka. Automatická oprava chyb k ničemu nevedla a načítání operačního systému nikdy nedospělo k logickému závěru. Rozhodl jsem se tedy zkusit slavný tým fsck.

Nejprve musíte zavést z obou spouštěcí flash disk s Ubuntu (Lubuntu, Xubuntu, Kubuntu atd.), nebo s Disk UbuntuŽivé CD. Nyní musíme zjistit, který oddíl Ubuntu musíme skenovat, abychom to opravili souborový systém. Spusťte Terminál (Ctrl-Alt-T) a spusťte příkaz:

sudo fdisk -l

Tento příkaz nám zobrazí všechny disky a flash disky, které jsou připojeny k systému. Uvedu příklad se svým osobním počítačem, a ne s notebookem přítele. Zde je to, co jsem dostal:

ubuntu@ubuntu:~$ sudo fdisk -l

Disk /dev/sda: 640,1 GB, 640135028736 bajtů
255 hlav, 63 sektorů/stopa, 77825 válců, celkem 1250263728 sektorů



Identifikátor disku: 0x0009d6f7


/dev/sda1 * 2048 61442047 30720000 83 Linux
/dev/sda2 61442048 73730031 6143992 82 Linux swap / Solaris
/dev/sda3 73730048 1250263039 588266496 83 Linux

Disk /dev/sdb: 500,1 GB, 500107862016 bajtů
255 hlav, 63 sektorů/stopa, 60801 válců, celkem 976773168 sektorů
Jednotky = sektory 1 * 512 = 512 bajtů
Velikost sektoru (logický/fyzický): 512 bajtů / 512 bajtů
Velikost I/O (minimální/optimální): 512 bajtů / 512 bajtů
Identifikátor disku: 0xb9ff6f01

Spouštění zařízení Start End Blocks ID System
/dev/sdb1 * 16065 100197404 50090670 83 Linux
/dev/sdb2 105322201 976771071 435724435+ 5 Rozšířené
/dev/sdb3 100197405 105322139 2562367+ 82 Linux swap / Solaris
/dev/sdb5 105322203 832110591 363394194+ 7 HPFS/NTFS/exFAT
/dev/sdb6 832112640 860755218 14321289+ 83 Linux
/dev/sdb7 860758016 862613503 927744 82 Linux swap / Solaris
/dev/sdb8 862615552 976771071 57077760 83 Linux

Položky tabulky oddílů nejsou v pořadí disků

Disk /dev/sdc: 8115 MB, 8115978240 bajtů
250 hlav, 62 sektorů/stopa, 1022 válců, celkem 15851520 sektorů
Jednotky = sektory 1 * 512 = 512 bajtů
Velikost sektoru (logický/fyzický): 512 bajtů / 512 bajtů
Velikost I/O (minimální/optimální): 512 bajtů / 512 bajtů
Identifikátor disku: 0xc3072e18

Spouštění zařízení Start End Blocks ID System
/dev/sdc1 * 32 15847625 7923797 b W95 FAT32

Jak můžete vidět z výstupu příkazu sudo fdisk -l, Mám 2 pevné disky(sda)640 GB a (sdb)500 GB a také flash disk (sdc)8GB, ze kterého jsem vlastně bootoval. Vím, že můj základní systém s Ubuntu 12.04 je umístěn na disku sda ​​a oddíl s operačním systémem se nazývá sda1.

Nyní, když známe oddíl, který je třeba skenovat, můžeme ho skutečně začít kontrolovat. V terminálu:

sudo fsck -y -f -c /dev/sda1

Pokud se zobrazí chyba, pravděpodobně budete muset tento oddíl odpojit:

sudo umount /dev/sda1

Příkazové klávesy a parametry fsck:

y- na všechny otázky vždy odpovídejte ano (existuje alternativa: klávesa p - spustí kontrolu v plně automatickém režimu);

F- vynucená kontrola souborového systému (i když je souborový systém označen jako plně funkční)

C- hledá špatné bloky a podle toho je označí

/dev/sda1- zařízení nebo oddíl, který je třeba zkontrolovat. I když tým může mít jinou podobu. Například:

sudo fsck -p /dev/sda1

V tomto případě byl přidán pouze přepínač -p. Právě jste si přečetli o všech příkazových klávesách fsck a přidali přesně ty klíče, které potřebujete. Chcete-li se dozvědět o všech možnostech programu, zadejte do Terminálu:

muž fsck

Toto vytvořil Terminál po kontrole:

ubuntu@ubuntu:~$ sudo fsck -y -f -c /dev/sda1
fsck z util-linux 2.20.1
e2fsck 1.42.5 (29. července 2012)
Kontrola chybných bloků (test pouze pro čtení): 0,00 % hotovo, uplynulo 0:00. (0/0/0 chyba
/dev/sda1: Aktualizace chybného bloku inode.
Průchod 1: Kontrola inodů, bloků a velikostí
Průchod 2: Kontrola adresářové struktury
Průchod 3: Kontrola připojení adresáře
Průchod 4: Kontrola počtu referencí
Průchod 5: Kontrola souhrnných informací o skupině

Představoval si Linus Torvalds při vytváření svého duchovního dítěte, že Linux bude použit ve vestavěných systémech, nejen v levných domácích routerech, ale také v tak seriózních telekomunikačních řešeních, jako je AVAYA PBX?

Nedávno jsme museli obnovit funkčnost AVAYA PBX jednoho velkého zákazníka. Toto je brána (podvozek) Avaya G650 se serverem (procesorem) Avaya S8400. Kde v kvalitě systémový disk Je použito 2 GB média CompactFlash. Což lze považovat za podmíněně SSD disk s rozhraním IDE.
A představte si mé překvapení, když jsem po připojení jednotky CF přes čtečku karet uviděl známou strukturu Linux soubor systémy. Což samozřejmě zjednodušilo postup kontroly funkčnosti CF mechaniky.

Jak zkontrolovat chyby v souborovém systému disku Linux

Na operačním sále Systém MicroSoft DOS (ach ano, pamatuji si verzi 5.0, která se vešla na jednu disketu!) měl příkaz CHKDSK disk check. A něco podobného existuje v Linuxu.
Chcete-li zkontrolovat chyby systému souborů na disku Linux, musíte zjistit názvy systémů souborů, které chcete zkontrolovat:

# df -h Velikost souborového systému Použitá dostupnost Využití % Namontováno na /dev/sda 20G 4.0G 15G 21 % / /dev/sdd1 1G 455M 555M 46 % /media/Np%blsl3648B4Jjeiedgyy /dev 1G09 /sdd6/dev 1G09/sdd6 10.13-23dd žádné 246M 0 246M 0% /dev/shm

U testovaného disku je CF /dev/sdd1 A /dev/sdd6
Dále musíte odpojit testované systémy souborů:

#sudo umount /dev/sdd1 #sudo umount /dev/sdd6

#fsck -y /dev/sdd1 #fsck -y /dev/sdd6

Parametr -y automaticky odpoví ano na všechny otázky, což je to, co většina uživatelů obvykle dělá.

Výsledky nástroje pro kontrolu souborového systému Lunux FSCK

V mém případě došlo k chybám na jednom z oddílů, které utilita opravila. Poté byl CF disk vrácen na své místo a byla obnovena funkčnost Avaya PBX.