Zbuduj superkomputer w domu

Wykonywanie niektórych zadań wymaga ogromnych mocy obliczeniowych. Przykładem jest rendering obrazów 3D, obliczenia naukowe czy kompresja MP3. Często nawet najsilniejsze stacje robocze nie dają sobie z nimi rady. Wtedy trzeba sięgnąć po bardziej radykalne rozwiązania...

Wykonywanie niektórych zadań wymaga ogromnych mocy obliczeniowych. Przykładem jest rendering obrazów 3D, obliczenia naukowe czy kompresja MP3. Często nawet najsilniejsze stacje robocze nie dają sobie z nimi rady. Wtedy trzeba sięgnąć po bardziej radykalne rozwiązania...

Oprogramowanie MOSIX to bezpłatne rozszerzenie jądra Linuksa, które umożliwia budowę klastra obliczeniowego na podstawie tanich komputerów PC. W ten sposób można łączyć wiele słabych maszyn, które samodzielnie nie byłyby już użyteczne.

Zobacz również:

Mimo wzrostu wydajności współczesnych komputerów PC, są zadania, które zawsze będą przekraczały możliwości pojedynczej maszyny. Dotyczy to wszelkich zadań obliczeniowych, począwszy od obliczeń matematycznych, kompilacji dużych programów, przez rendering grafiki, a na kompresji plików do formatu MP3 kończąc. Do takich zadań tworzy się tzw. klastry - połączone grupy komputerów, pracujące pod nadzorem specjalnego oprogramowania, które potrafi rozdzielać pracę między wszystkie pracujące maszyny. Ponieważ uruchamianie klastrów wymagało dotąd zakupu specjalnego, kosztownego sprzętu i oprogramowania, ich budowa była zarezerwowana jedynie dla dużych ośrodków naukowych, firm i administracji państwowej. Obecnie, dzięki Linuksowi i bezpłatnemu oprogramowaniu Open Source klastry trafiają "pod strzechy". Najpopularniejszym linuksowym oprogramowa- niem do ich budowy jest MOSIX (akronim od: Multi-computer Operating System for UNIX) - jest on dostępny nieodpłatnie, również w postaci kodu źródłowego. Oprogramowanie MOSIX powstało i jest rozwijane na Uniwersytecie Hebrajskim w Jerozolimie. Pierwotnie projekt był rozwijany w systemie BSD UNIX, ale obecnie jedyną platformą systemową jest Linux (i to jedynie platforma x86). Idea twórców MOSIX jest taka, aby utworzyć oprogramowanie pozwalające zbudować klaster, który zarówno z punktu widzenia użytkowników, jak i uruchamianych programów będzie widoczny jako jedna maszyna.

Jak to działa

Architektura MOSIX-a składa się z dwóch modułów wewnętrznych:

- mechanizmu migracji (przenoszenia) procesów z wywłaszczaniem (PPM - Preemptive Process Migration)

- algorytmu odpowiadającego za mechanizm adaptacyjnego (czyli reagującego na panujące w danej chwili warunki) mechanizmu współdzielenia zasobów.

Oba moduły współdziałają przy przenoszeniu procesów między węzłami (w przypadku klastra MOSIX - pojęcie węzeł oznacza jeden komputer) klastra w taki sposób, aby zmniejszyć średnie obciążenie węzłów. Każdy węzeł jest właścicielem procesu (programu), który został na nim uruchomiony lokalnie, a serwerem dla procesów, które się przemieściły z innych węzłów klastra. Warto dodać, że dodawanie i usuwanie węzłów z klastra nie wpływa na trwające procesy.

MOSIX został zaimplementowany jako moduł jądra Linuksa, dzięki czemu jest "przezroczysty" dla działających programów. Uzupełnieniem modułu jądra jest program Mosrun, który zastępuje większość standardowych narzędzi sieciowych Linuksa. Moduł jądra działa jak zarządca zadań, decydując, jakie działanie powinno być przeniesione do innego węzła. Cały ten proces odbywa się automatycznie i w sposób niewidoczny dla samego programu. To dlatego MOSIX jest często nazywany klastrem "fork and forget" (dosłownie "podziel i zapomnij") - użytkownik nie wie, jak jego procesy (programy) są przenoszone między węzłami klastra. Oczywiście, użytkownik może uruchomić program na dowolnej maszynie w klastrze i program ten będzie już automatycznie przenoszony między węzłami. Każdy nowy proces jest przypisywany do najlepszego (tj. takiego, który jest najmniej obciążony w danej chwili) węzła.

Z MOSIX-a mogą korzystać nie wszystkie programy. Niektóre ze względów technicznych nie będą mogły być dystrybuowane do innych węzłów. Dotyczy to na przykład programów, które są uzależnione od współpracy ze sprzętem i wykonywaniem operacji wejścia-wyjścia. Przykładem są aplikacje do wyświetlania grafiki 3D w czasie rzeczywistym (także gry). Programy takie muszą intensywnie współpracować z kartą grafiki.

Adresy internetowe

Główna strona projektu MOSIX

www.mosix.org

Projekt Beowulf

www.beowulf.org

PVM (Parallel Virtual Machine) - narzędzia do budowy komputerów równoległych, które mogą wykorzystywać różne systemy operacyjne, np. Linux i Windows NT

www.epm.ornl.gov/pvm

Komercyjne oprogramowanie TurboLinux EnFuzion do łączenia zwykłych komputerów w sieci lokalnej w klaster

www.turbolinux.com/products/enf

Projekt Linux High Availability

www.linux-ha.org

Pakiet Message Passing Interface (MPI)

http://cersa.admu.edu.ph/ftp/linux/beowulf/tools/PVMPovray-3.1-1.i386.rpm">http://cersa.admu.edu.ph/ftp/

linux/beowulf/tools/PVMPovray-3.1-1.i386.rpm">www.erc.msstate.edu/

labs/hpcl/projects/mpi/<a>

PVMPovRay - specjalna wersja popularnego renderera przystosowana do pracy w klastrach

<a href="http://cersa.admu.edu.ph/ftp/linux/beowulf/tools/PVMPovray-3.1-1.i386.rpm">http://cersa.admu.edu.ph/ftp/

linux/beowulf/tools/PVMPovray-3.1-1.i386.rpm

LUI - narzędzie do automatycznego "klonowania" całego systemu operacyjnego między węzłami klastra

oss.software.ibm.com/

developerworks/projects/lui

MOSIX jest wykorzystywany przede wszystkim do budowy "farm serwerów" WWW, np. znakomicie współpracuje z serwerem Apache (patrz opis w PCWK 4/2000), pozwalając na łatwe zwiększanie wydajności serwera WWW. MOSIX idealnie nadaje się np. do programów wykonujących wiele zadań obliczeniowych jednocześnie - dotyczy to np. kompilacji dużych programów (całego pakietu KDE czy GNOME), kompresji do formatu MP3 i innych programów wykonujących wiele obliczeń (np. do renderingu grafiki). Warto dodać, że opracowano specjalną wersję PovRay do pracy w klastrach (PVMPovRay).

Jak zbudować klaster

Klastry MOSIX są łatwe w budowie i utrzymaniu. Wszystko, czego będziesz potrzebował, to sieć TCP/IP i co najmniej dwa komputery. Co do wymagań związanych z siecią to w warunkach domowych można nawet użyć dwóch komputerów z kartami sieciowymi skroso- wanych kablem Ethernet. Ogromną zaletą MOSIX-a jest to, że do pracy w klastrze można przeznaczyć zwykłe, tanie komputery PC, wymogi to procesor Pentium, twardy dysk (rozsądne minimum to 300-500 MB - tyle jest wymagane przy minimalnych instalacjach Linuksa) pamięć RAM w odpowiedniej ilości (minimum 16 MB) i karta sieciowa. MOSIX jest więc znakomitym sposobem wykorzystania starych komputerów w szkołach i na uczelniach. Górna granica liczby komputerów połączonych w klaster MOSIX to 65535, jednak bardziej realnym ograniczeniem jest wydajność sieci. Dlatego rozbudowane klastry wykorzystują szybkie sieci Gigabit Ethernet lub sieci specjalne, np. Myrinet. Klaster MOSIX jest zawsze widziany przez pracujące w dowolnym węźle programy jako jedna maszyna.

Narzędzie mon pokazujące równoważenie obciążenia dwóch węzłów klastra MOSIX.Kliknij, aby powiększyćNarzędzie mon pokazujące równoważenie obciążenia dwóch węzłów klastra MOSIX.Kolejną zaletą MOSIX-a jest to, że uruchamiane w klastrze programy nie wymagają żadnego specjalnego przygotowania do pracy. Inne klastry wymagają rekompilacji programów z wykorzystaniem specjalnych bibliotek do przetwarzania równoległego. Ceną za zalety jest to, że klastry MOSIX nie są tak wydajne jak te, które wymagają przygotowywania specjalnych programów. Klaster MOSIX może być również, oczywiście, budowany na silnych maszynach serwerowych lub maszynach wieloprocesorowych.

Istnieje kilka sposobów elastycznego rozkładania obciążenia w klastrach MOSIX. Bardzo ciekawym sposobem skalowania klastra (rozszerzania wydajności) jest budowa konfiguracji typu adaptive-pool, w której stacje robocze pracujące pod kontrolą Linuksa dodawane są do klastra, w czasie gdy nie są obciążone innymi zadaniami (np. w nocy). Można to łatwo osiągnąć, automatycznie uruchamiając skrypt /etc/rc.d/init.d/mosix dołączający stację do klastra np. po określonej godzinie i odłączający go przed określoną godziną. Do takiej automatyzacji można wykorzystać choćby standardowy program cron. Istnieją możliwości jeszcze bardziej zaawansowanego sterowania obciążeniem klastra - przykładem jest przyłączanie stacji roboczej jako węzła do klastra jedynie w celu wysyłania zadań obliczeniowych (procesów) do przetwarzania. Taka konfiguracja jest nazywana half-duplex pool. Innym pomysłem jest konfiguracja wsadowa, w której klaster MOSIX może być dostępny jedynie poprzez specjalny program, który kolejkuje zadania do przetwarzania. Szczegóły bardziej zaawansowanych konfiguracji można znaleźć w dokumentacji dołączonej do MOSIX-a.