Pamiętacie, jak jeszcze parę lat temu komputer co najwyżej poprawiał nam literówki? No to teraz mamy coś zupełnie innego. Generatywna sztuczna inteligencja po prostu sama coś tworzy — tekst, obrazy, dźwięk, wideo, a nawet kod — a robi to na podstawie ogromnych zbiorów danych, na których wcześniej ją wytrenowano. I wiecie co… od premiery ChatGPT w listopadzie 2022 roku stała się najszybciej przyswajaną technologią konsumencką w historii. W ciągu dwóch miesięcy aplikacja przekroczyła 100 milionów użytkowników. Tak po prostu.
Generatywna sztuczna inteligencja co to jest — definicja i zasada działania
Tu warto się na chwilę zatrzymać. Starsze systemy raczej tylko klasyfikowały dane albo wyłapywały jakieś wzorce — i tyle. A modele generatywne? One produkują coś, czego wcześniej w ogóle nie było. Ich sercem są tak zwane duże modele językowe, czyli LLM-y, które uczą się przewidywać kolejne słowo w zdaniu.
Brzmi banalnie, no wiem. Ale tu cała sztuka tkwi w skali. Model przemiela miliardy zdań i uczy się statystycznych zależności między słowami, a potem, słowo po słowie, składa odpowiedź, która brzmi mniej więcej tak, jakby napisał ją człowiek.
A co to wszystko umożliwiło? Architektura zwana transformerem, którą badacze Google opisali w pracy z 2017 roku zatytułowanej „Attention Is All You Need”. I to właśnie ona stoi dziś za większością narzędzi, których używamy — od ChatGPT, przez Gemini, aż po Claude.
Do czego służy generatywna AI
No i tu robi się ciekawie, bo zastosowania dawno wyszły poza zwykłe chatboty. Firmy biorą te modele do pisania ofert, do obsługi klienta, do analizy umów, do programowania, do projektowania grafik… lista się ciągnie. Lekarze testują je przy streszczaniu dokumentacji, a prawnicy akurat przy wyszukiwaniu orzeczeń.
I nie, polski rynek wcale nie jest tu wyjątkiem — jak opisuje serwis Spider's Web, narzędzia generatywne trafiły do redakcji, agencji marketingowych i działów IT szybciej, niż analitycy w ogóle przewidywali. Tylko że razem z tym rośnie też lista zagrożeń, a mianowicie: dezinformacja, deepfake’i i naruszenia praw autorskich.
Trzeba też pamiętać, że te modele potrafią się zwyczajnie mylić. Jest takie zjawisko nazywane „halucynacją” — polega ono na tym, że system z pełnym przekonaniem wciska nam informacje, które są po prostu nieprawdziwe. Dlatego eksperci powtarzają w kółko, że odpowiedzi trzeba weryfikować, zwłaszcza jak chodzi o sprawy finansowe czy medyczne.
Nowe przepisy: unijny AI Act
Unia Europejska jako pierwsza na świecie uchwaliła całościowe regulacje — i tu akurat byliśmy szybsi niż reszta świata. Rozporządzenie 2024/1689, znane jako AI Act, weszło w życie 1 sierpnia 2024 roku i wprowadza pojęcie „systemu AI ogólnego przeznaczenia”, a do tej szufladki zalicza się właśnie modele generatywne.
Przepisy nakładają na dostawców obowiązki, które dotyczą przejrzystości. I co ważne — treści wygenerowane przez maszynę, w tym deepfake’i, będą musiały być oznaczane, żeby odbiorca po prostu wiedział, że nie ma do czynienia z czymś, co stworzył człowiek.
A kary za łamanie nowych zasad? Dotkliwe, naprawdę. Te najwyższe sięgają 35 milionów euro albo 7 procent rocznego światowego obrotu firmy — w zależności od tego, która kwota wyjdzie wyższa. Większość obowiązków dla modeli ogólnego przeznaczenia obowiązuje od sierpnia 2025 roku, a pełne stosowanie rozporządzenia rozłożono sobie na kolejne miesiące.
I jeszcze jedno — skala inwestycji w tę technologię tylko rośnie. Według prognoz cytowanych przez branżowe analizy globalne wydatki na generatywną AI mają w najbliższych latach iść w setki miliardów dolarów, a kolejne wersje modeli przetwarzają już nie tylko sam tekst, ale też obraz, dźwięk i wideo jednocześnie — i to jest właśnie ta tak zwana multimodalność.
Najnowsze narzędzia potrafią wygenerować kilkunastosekundowy filmik z jednego zdania opisu. Wystarczy zdanie. A jeszcze trzy lata temu coś takiego uchodziło za czyste science fiction.
