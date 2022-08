Naukowcy coraz lepiej szkolą sztuczną inteligencję, co z pewnością pomoże w przyszłości w wielu dziedzinach życia, a póki co daje efekty, które robią świetne wrażenie. Warto wspomnieć choćby Midjourney, od paru tygodni budzące niesłabnące zainteresowanie użytkowników na całym świecie. Teraz inżynierowie Google pokazali Transframer - jest to framework potrafiący tworzyć krótkie materiały wideo na bazie zaledwie jednego zdjęcia! W nieodległej przyszłości może zastąpić to klasyczne technologie renderowania obrazu, pozwalając twórcom na kreowanie krajobrazów na podstawie podanych parametrów wyjściowych.

Transframer nie jest "noworodkiem" na rynku. Pojawił się w 2017 jako Transformer - architektura sieci neuronowej mająca możliwość modelowania tekstu i porównywania słów. Do trenowania SI wykorzystywane są zaawansowane frameworki TensorFlow i PyTorch. Transframer również z nich korzysta, ale rozpoznaje kontekst zdjęcia, aby stworzyć powiązane z nim, krótkie animacje. Dotyczy to zarówno pojedynczych obiektów, jak i całych krajobrazów. Przykład poniżej.

Transframer is a general-purpose generative framework that can handle many image and video tasks in a probabilistic setting. New work shows it excels in video prediction and view synthesis, and can generate 30s videos from a single image: https://t.co/wX3nrrYEEa 1/ pic.twitter.com/gQk6f9nZyg