Sieci neuronowe najnowszej generacji są podatne na nowy rodzaj ataku, który powoduje, że zużywają zbyt dużo energii.

Hakerzy na całym świecie wciąż pracują nad nowymi sposobami ataku i przejęcia urządzeń czy sieci Internetowych. Najnowszy z nich zmusza głęboką sieć neuronową do zużycia większej liczby zasobów obliczeniowych niż jest to konieczne i spowolnienia procesu „myślenia”. Architektura input-adaptive multi-exit jest jedną z kategorii najnowszych, bardzo wydajnych sieci neuronowych, na które w ostatnich latach powstało zapotrzebowanie w wyniku większego zużycia energii przez co raz to większe modele sztucznej inteligencji. Działa na zasadzie dzielenia zadań w zależności od tego, jak trudne są do rozwiązania, a następnie wydaje minimalną ilość zasobów obliczeniowych potrzebnych do rozwiązania każdego z nich.

Najprostszym sposobem wyjaśnienia, w jaki sposób działa ta architektura, jest jest zobrazowanie. Załóżmy, że mamy zdjęcie lwa patrzącego prosto w kamerę z doskonałym oświetleniem i zdjęcie lwa przyczajonego w złożonym krajobrazie, częściowo niewidocznym. Rezultaty działań sieci neuronowych byłyby następujące:

Tradycyjna sieć neuronowa - przepuściłaby oba zdjęcia przez wszystkie swoje warstwy i wydałaby taką samą ilość obliczeń, aby oznaczyć każdą z nich.

- przepuściłaby oba zdjęcia przez wszystkie swoje warstwy i wydałaby taką samą ilość obliczeń, aby oznaczyć każdą z nich. Sieć neuronowa input-adaptive multi-exit - może przepuścić pierwsze zdjęcie przez tylko jedną warstwę, zanim osiągnie niezbędny próg pewności, aby nazwać ją tym, czym jest. Zmniejsza to emisję węgla modelu, ale także poprawia jego prędkość i umożliwia wdrażanie go na małych urządzeniach, takich jak smartfony i inteligentne głośniki. Ten rodzaj sieci neuronowej oznacza, że ​​jeśli zmienisz dane wejściowe, takie jak wyświetlany obraz, możesz zmienić liczbę obliczeń potrzebnych do rozwiązania problemu.

Jak wskazali w tym tygodniu naukowcy z Maryland Cybersecurity Center, w nowym artykule zaprezentowanym na Międzynarodowej Konferencji na temat Reprezentacji Uczenia się, otwiera to lukę, którą hakerzy mogą wykorzystać. Dodając niewielkie ilości szumu do wejść sieci, sprawili, że postrzegała ona dane wejściowe jako trudniejsze i zwiększała swoje obliczenia. W przypadku, gdyby atakujący miał pełne informacje o sieci neuronowej, byłby w stanie zmaksymalizować jej pobór energii. Z drugiej strony, gdyby atakujący nie miał żadnych informacji, nadal mógłby spowolnić przetwarzanie w sieci i zwiększyć zużycie energii o 20% do 80%. Powodem takiej luki jest fakt, że ataki dobrze przenoszą się przez różne typy sieci neuronowych. "Zaprojektowanie ataku na jeden system klasyfikacji obrazów wystarczy, aby zakłócić działanie wielu" - mówi Yiğitcan Kaya, doktorant i współautor publikacji.

Taki typ ataku jest nadal nieco teoretyczny. Architektury adaptacyjne nie są jeszcze powszechnie używane w rzeczywistych aplikacjach. Naukowcy są jednak przekonani, że sytuacja ta szybko się zmieni z powodu presji w branży na wdrażanie lżejszych sieci neuronowych, takich jak dla inteligentnego domu i innych urządzeń IoT. Tudor Dumitraş, profesor, który doradzał w badaniach, mówi, że potrzeba więcej pracy, aby zrozumieć, w jakim stopniu tego rodzaju zagrożenie może spowodować szkody. Dodaje jednak, że ten artykuł jest pierwszym krokiem do podniesienia świadomości: „Ważne jest dla mnie, aby zwrócić uwagę ludzi na fakt, że jest to nowy model zagrożenia, a tego rodzaju ataki można przeprowadzać”.

Źródło: technologyreview.com