Jak długo przetrwają twoje dane?


Porady dotyczące archiwizowania

Jak długo przetrwają twoje dane?

Mozolna droga do czytelnika - przekazywanie cyfrowych danych zależy od wielu elementów. Jeśli zabraknie jednego z nich, dane mogą umrzeć śmiercią naturalną.

W zastosowaniach profesjonalnych od archiwizacji długoterminowej wymaga się, aby zapewniała możliwość bezstratnego odczytu (przez cykliczne przemieszczanie na nowe platformy i nośniki), ochronę przed próbami sfałszowania (przez kontrolę dostępu i protokołowanie zmian) i zachowanie formatu dokumentów (przez konserwowanie sprzętu i oprogramowania odczytującego, emulację, rozkapsułowanie danych i interpretera w szczelnym kontenerze).

Natomiast w zastosowaniach domowych nieodzowna jest tylko możliwość bezstratnego odczytu, choć ponadto pożądana jest ochrona przed próbami sfałszowania - w wymiarze wykonalnym dla użytkownika. Zatem dane powinny być stale dostępne w całości i z zachowaniem pełnej jakości, a zmiany zasobów powinny się odbywać w sposób kontrolowany. Za to konserwowanie pierwotnego formatu w wypadku większości użytkowników nie jest niekoniecznie. Z przytoczonych tu aspektów i wymienionych powyżej przyczyn ginięcia danych wynikają następujące - mniej lub bardziej trywialne - reguły przechowywania cyfrowych zasobów.

1. Wszystkie cenne zasoby powinny mieć co najmniej jedną kopię zapasową, a najlepiej dwie, na niezależnych od siebie nośnikach. Jeden z duplikatów należy przechowywać w innym miejscu niż oryginał - albo u krewnych, którzy nie mieszkają razem z tobą, albo w jednym z serwisów webhostingowych oferujących przestrzeń serwerową (patrz punkt 13).

2. W zastosowaniach prywatnych należy wybierać twarde dyski jako nośnik docelowy. Przeciętnie okazują się mniej zawodne niż płyty CD i DVD, a przy tym są tańsze od napędów taśmowych (streamerów). W odróżnieniu od taśm, oferują nie tylko sekwencyjny dostęp do danych, lecz i dowolny. W ramach archiwizowania zasobów można więc dodawać nowe lub wymieniać pojedyncze, zmodyfikowane pliki. Z powodu ogromnej pojemności obecnych dysków można sobie zaoszczędzić sporo czynności organizacyjnych (np. numerowania i wymiany nośników). Dyski o podobnej pojemności sformatowane w tym samym systemie plików ograniczają dodatkowo nakład pracy i źródła błędów. Ogólnie rzecz biorąc, dyski 3,5-calowe są mniej zawodne od modeli 2,5-calowych.

3. Decydując się na archiwizowanie swoich zasobów na twardych dyskach przechowywanych poza komputerem, podłączaj je co sześć miesięcy. Jeśli dysk pozostaje nieużywany zbyt długo, tężeje substancja w jego łożyskach.

4. Macierz RAID 1 lub RAID 5, składająca się z dwóch lub czterech dysków, automatyzuje przebieg pierwszego replikowania danych, jednak ma pewne wady: duplikat znajduje się w tym samym miejscu, co oryginał (patrz punkt 1), oprócz tego replikowane są również błędy. Dlatego nieodzowne jest utworzenie trzeciej, niezależnej kopii zapasowej.

5. Ustal lokalizację oryginału (plik, folder lub nośnik) i przywracaj zasoby w to miejsce jedynie wtedy, gdy oryginał ulegnie uszkodzeniu. Bezplanowe synchronizowanie w obie strony z udziałem dwóch lub trzech lokalizacji źródłowych prowadzi ze względów logicznych do utraty danych i/lub niepotrzebnej redundancji.

6. Dane przetwarzane elektronicznie mogą ulec utracie bez wiedzy użytkownika. W wypadku dużej ich ilości nie sposób zachować nad wszystkim kontroli, dlatego przed każdą synchronizacją danych skorzystaj z funkcji podglądu w programie archiwizacyjnym. Nawet najprostsze programy, typu Xcopy i Robocopy (argument /L), lub bezpłatne narzędzie Microsoft SyncToy zapewniają taką opcję.

7. Definiuj prawa dostępu do plików, aby - zależnie od otoczenia - upewnić się, że tylko tobie wolno modyfikować pliki oryginału lub kopii zapasowej.

8. Zanim przejdziesz na nowy system operacyjny lub nowe aplikacje, przeanalizuj, czy zapewnią ci dostęp do wszystkich zasobów. Jeśli po wdrożeniu nowego oprogramowania cenne formaty plików mogą być nieczytelne lub nie uda się uruchomić potrzebnych interpreterów, zanim podejmiesz ten krok, musisz skonwertować wszystkie pliki. Jeżeli to przegapisz, utracisz dostęp do niektórych zasobów lub będziesz zdany na komercyjnych usługodawców.

9. Szczególny problem przy wymianie systemu operacyjnego stwarzają systemy plików. Twardy dysk sformatowany w apple'owskim HFS+ nie zadziała ot tak w środowiskach Windows czy Linux, a linuksowy system plików Ext2 nie będzie czytelny na platformach Mac i Windows. Również w tym wypadku pomoże tylko odpowiednio wczesne skopiowanie zasobów na dysk sformatowany w kompatybilnym systemie plików. W ostateczności możesz użyć FAT(32), bo akceptują go wszystkie systemy operacyjne.

10. Wymiana sprzętu bardzo często idzie w parze z ograniczeniami dostępu do zasobów, co może się zakończyć utratą danych. Jeśli np. w nowym komputerze zabraknie napędu dyskietek, to zanim zdobędziesz nowy lub podłączysz napęd zewnętrzny, przestarzałe dyskietki może nadgryźć ząb czasu. W Macu lub nowym pececie nie ma portu równoległego, a więc pozostawisz je na pastwę losu. Nawet twarde dyski IDE uda się odczytać w nowym komputerze tylko po włożeniu ich w zewnętrzną obudowę i podłączeniu przez port USB. Kopiując zawczasu zasoby na kompatybilne nośniki danych, unikniesz niepotrzebnych nerwów, kosztów i utraty danych.

11. Stosuj jak najmniej odmiennych formatów plików do zapisywania cennych zasobów danych. Do długoterminowej archiwizacji najbardziej nadają się otwarte, znormalizowane formaty, takie jak ODF (Open Document Format), PDF, TFF bądź OGG. Ponadto nie powinieneś też mieć problemów, korzystając z powszechnie znanych DOC, XLS czy MP3. Ale pamiętaj o jednym - im mniej formatów używasz, tym prościej będzie skonwertować swoje wszystkie zasoby, gdy któryś z nich będzie zagrożony.

12. Unikaj plików zaszyfrowanych przy użyciu technologii DRM. Na przykład w wypadku formatów audio chronionych przez DRM masz możliwość nagrania danych na zwyczajny krążek Audio CD. Później możesz przechwycić utwory z płyty i zapisać je w otwartym formacie OGG lub przynajmniej w popularnym MP3 (oba są pozbawione restrykcji DRM).

13. Kopie zapasowe w trybie online zapewniają możliwość gromadzenia danych poza miejscem zamieszkania, w serwisie hostingowym. Natomiast bezpłatne serwisy tego typu (np. Google) nie dają żadnej gwarancji, a ponadto oferują skromną przestrzeń dyskową i prędkość uploadu. Oprócz tego musisz sam zadbać o ochronę dostępu (zaszyfrować swoje archiwa) lub ślepo zaufać administratorom serwisu.