Technologie
Sztuczna inteligencja tworzy sztukę: Odkryj skuteczne prompty do graficznych modeli AI
Modele graficzne AI, takie jak Midjourney, otwierają nowe horyzonty w świecie sztuki cyfrowej. Te potężne narzędzia pozwalają każdemu, niezależnie od umiejętności artystycznych, tworzyć oszałamiające grafiki na podstawie nawet krótkich promptów. Jednak, aby w pełni wykorzystać potencjał tych modeli, niezbędna jest znajomość tworzenia grafik skutecznie i świadomie.
Z pewnością pomocnym dla użytkowników będzie zapoznanie się z tym, jak konkretny model i usługa tak naprawdę działa, co pozwoli na zrozumienie technicznych aspektów procesu.
Czytaj też
Jak działa generowanie grafik przez sztuczną inteligencję?
Interpretacja promptu: Model AI rozpoczyna od analizy dostarczonych informacji – poprzez rozpoznanie słów kluczowych, fraz oraz kontekstów w celu zrozumienia intencji użytkownika.
Teraz coś ciekawszego – tworzenie reprezentacji wektorowej: przeanalizowany prompt na tym etapie jest konwertowany na reprezentację wektorową (jest to - inaczej mówiąc - reprezentacja naszej myśli w zbiorze odpowiednich liczb, jakie kodują znaczenie, emocje oraz inne ważne parametry związane z naszym poleceniem).
Generowanie obrazu: Reprezentacja wektorowa – nasz zbiór zakodowanych informacji pod postacią cyfr jest przekazywany do generatora obrazu, czyli sieci neuronowej, wyszkolonej na ogromnym zbiorze danych grafik oraz tekstów. Generator przetwarza dane wykorzystując je w celu wygenerowania obrazu odpowiadającego naszym wymaganiom.
Udoskonalanie materiału zwrotnego: Model AI stosuje różne techniki, takie jak upscaling, denoising i korekcję kolorów, aby obraz wyglądał lepiej i zyskał bardziej realistyczny i estetyczny wygląd.
Czytaj też
Jak odbywa się szkolenie modelu?
Model jest szkolony na zbiorze danych obrazów i odpowiadających im promptów. Na podstawie tych danych uczy się, jak generować obrazy odpowiadające opisom tekstowym (uczenie nadzorowane). Analizuje swoje błędy i poprawia algorytmy (uczenie bez nadzoru).
Model otrzymuje „nagrody” lub „kary” za generowanie obrazów o określonej jakości. Na podstawie tych informacji uczy się, jak generować obrazy, które są bardziej satysfakcjonujące dla użytkowników (uczenie przez wzmacnianie).
Czytaj też
Jak lepiej pisać prompty?
Warto zaznaczyć fakt, że modele uczą się głównie na danych w języku angielskim. Oznacza to, że generowanie grafik na podstawie promptów w tymże języku może przynieść lepsze rezultaty. Dzieje się tak z racji, iż modele te są lepiej zaznajomione z gramatyką i słownictwem języka angielskiego, co pozwala im dokładniej zrozumieć twoją intencję. Tym samym unikamy zagrożenia związanego z wystąpieniem błędów w tłumaczeniu.
Przykłady metod, które warto zastosować w naszych projektach:
Midjourney oferuje dostosowanie stylu poprzez określenie modelu aparatu czy rodzaju obiektywu (np. szerokokątny, teleobiektyw) i ustawienia (np. przysłona, czas otwarcia migawki).
Może to wyglądać np. tak: „Wygeneruj zdjęcie wykonane aparatem…; (dodatkowe informacje): … z obiektywem 35mm itd., przedstawiające… (dalsza część polecenia)…”.
Wykorzystaj przykłady: Jeśli to możliwe, dołącz do swojego promptu linki do zdjęć lub obrazów, które oddają styl, kompozycję i kolorystykę, jakie chcesz uzyskać. Pomoże to modelowi AI lepiej zrozumieć twoją wizję.
Wyraź emocje: Zdjęcia mogą przekazywać szeroką gamę emocji. Opisz w swoim prompcie nastrój, jaki chcesz wywołać u odbiorcy, możesz używać w tym celu przymiotników i metafor.
Określ kompozycję: Podaj informacje o kompozycji zdjęcia, takie jak ujęcie (np. z lotu ptaka), kadrowanie (np. centralne, symetryczne) i punkt zaczepienia wzroku.
Opisz szczegółowo scenę: Zamiast ogólnych stwierdzeń, używaj konkretnych słów kluczowych, które oddają atmosferę, oświetlenie, warunki pogodowe i inne elementy sceny. Może wydawać się to oczywistym, lecz warto o tym pamiętać. Stosuj krótkie i zwięzłe zdania, unikając zawiłych konstrukcji gramatycznych (szczególnie w językach innych niż angielski – wynika to z tłumaczeń). Kiedy chcemy przekazać wiele informacji/szczegółów warto podać je w kilku krótszych zdaniach niż w jednym złożonym. Możemy również stosować nawiasy, myślniki.
Dobre w nauce pisania lepszych opisów, jest śledzenie prac i efektów innych użytkowników, do których dołączają prompty, jakich użyli. Często warto oderwać się od osobistego, własnego spojrzenia i zacząć myśleć w inny sposób. Dodaje to świeżości i nierzadko inspiruje. Znajdziemy je w zakładce showcase.
Bądź świadomy ograniczeń modeli AI: Pamiętaj, że modele AI wciąż się rozwijają i mają swoje ograniczenia. Nie oczekuj, że uda ci się stworzyć idealny obraz za każdym razem. Bądź cierpliwy i baw się dobrze: pisanie skutecznych promptów wymaga czasu i praktyki. Nie zniechęcaj się, jeśli nie uzyskasz od razu idealnych rezultatów. Najważniejsze jest, aby czerpać radość z procesu tworzenia i eksperymentować z różnymi pomysłami.
W artykule przedstawiono jedynie wybrane aspekty związane z wykorzystaniem sztucznej inteligencji w procesie tworzenia grafiki. Swoim doświadczeniem w tym obszarze podzielił się m.in. Leszek Emil Buczek podczas prelekcji wygłoszonej w ramach Warszawskich Dni Informatyki – wydarzenia objętego patronatem naszej redakcji. Materiały dostępne są w serwisie WDI - dostęp w ramach pakietów konferencyjnych.
Czytaj też
Graficy kontra AI
Postanowiliśmy zapytać, jakie podejście do sztucznej inteligencji mają graficy: czy przydaje się w ich codziennej pracy? Czy jest dla nich wsparciem, czy postrzegają sztuczną inteligencję jako przyszłe zagrożenie dla ich zawodu?
Marta Jackiewicz, graficzka z Grupy Defence24 komentuje: „Wraz z nieustającym rozwojem technologii tworzenie grafik będzie coraz doskonalsze, a z narzędziami AI przejdzie na jeszcze wyższy poziom. Już teraz dzięki sztucznej inteligencji możliwy jest szybszy retusz zdjęć, usunięcie lub rozszerzenie tła. Nie ukrywam, że osobiście również używam sztucznej inteligencji, ale w małym stopniu. Dla mnie, jako artystki sztuka to wyrażenie swoich emocji, dzięki czemu każdy projekt jest unikalny i wyjątkowy. Sam proces tworzenia grafiki sprawia mi ogromną przyjemność, co powoduje, że zaczynam ”żyć” projektem. Wykonując fotomanipulację muszę podejść do zadania kreatywnie, w mojej głowie musi powstać wizja, a następnie szukam odpowiednich zdjęć. Co prawda zajmuje mi to dużo czasu, ale efekt końcowy z połączenia kilku zdjęć, jest taki, jakby była to jedna fotografia. Daje mi to ogromną satysfakcję. Moim zdaniem grafiki generowane za pomocą polecenia kierowanego do AI nie mają w sobie żadnych emocji, przez co nie zostaną one wywołane u odbiorcy, a to jest najważniejsze w pracy grafika” - ocenia w rozmowie z CyberDefence24.
Czy uważa, że AI może być zagrożeniem dla jej zawodu? „Ostatnio zadałam sobie to pytanie i doszłam do wniosku, że jest to w jakimś stopniu zagrożenie dla grafików. Dzięki sztucznej inteligencji każdy pracownik będzie mógł wygenerować grafikę, co umożliwi firmom zredukowanie zatrudnienia profesjonalistów w opisywanej dziedzinie. Jednak uważam, że AI nie wyprze grafików z powołania, którzy posiadają doświadczenie, a do swojej pracy podchodzą z pasją” - podsumowała Marta Jackiewicz.
Czytaj też
Serwis CyberDefence24.pl otrzymał tytuł #DigitalEUAmbassador (Ambasadora polityki cyfrowej UE). Jeśli są sprawy, które Was nurtują; pytania, na które nie znacie odpowiedzi; tematy, o których trzeba napisać – zapraszamy do kontaktu. Piszcie do nas na:[email protected].