Granica pomiędzy pomysłem a jego realizacją szybko zanika. Nowoczesne chatboty AI – w tym Claude, Gemini i ChatGPT – umożliwiają teraz użytkownikom tworzenie funkcjonalnych aplikacji po prostu poprzez ich szczegółowy opis. Proces ten, często nazywany „kodowaniem wibracyjnym”, jest zaskakująco przystępny i nie wymaga specjalnej wiedzy programistycznej. Jakość produktu końcowego jest całkowicie zależna od dostarczonych żądań, co pozwala każdemu na eksperymentowanie… chociaż doskonałość nie jest gwarantowana.
To nie jest rozważanie teoretyczne. Jedna osoba niedawno przetestowała tę możliwość, każąc wszystkim trzem modelom AI zbudować tę samą aplikację do czytników e-booków, zapewniającą jej zaawansowane funkcje, takie jak podświetlanie tekstu w czasie rzeczywistym i dynamiczne efekty audiowizualne. Wyniki były odkrywcze: sam model AI ma mniejsze znaczenie niż dokładność instrukcji.
Zadanie: Tworzenie „czytnika tomów”
Projekt zrodził się z frustracji związanej z istniejącymi aplikacjami do czytania, zwłaszcza Kindle firmy Amazon, któremu brakuje możliwości jednoczesnego czytania na głos i zaznaczania tekstu. Celem było stworzenie aplikacji internetowej o nazwie „Tome Reader”, która mogłaby czytać na głos pobrany tekst (PDF, EPUB lub treść osadzona), jednocześnie podkreślając odpowiednie słowa w czasie rzeczywistym. Aplikacja generowałaby także muzykę w tle na podstawie kategorii treści (horror, science fiction itp.) i uruchamiała efekty audiowizualne po wypowiedzeniu określonych słów kluczowych. Wszystko to w jednym pliku HTML dla łatwości użytkowania.
Proces: iteracyjne udoskonalanie zapytań
Eksperyment nie miał na celu natychmiastowego wyłonienia zwycięzcy. Zamiast tego programista iteracyjnie udoskonalił to samo zapytanie, prosząc każdy model AI o zbudowanie projektu, a następnie wygenerowanie zaktualizowanego zapytania na podstawie wyników.
Gemini najpierw stworzył działający prototyp. Projekt ten został następnie wykorzystany do wygenerowania udoskonalonego zapytania, które zostało przekazane Claude’owi. Claude jeszcze bardziej ulepszył aplikację, ale wprowadził także nieoczekiwaną logikę – ograniczając uruchamianie efektów raz na zdanie, aby uniknąć „spamowania” użytkownika. Wreszcie ChatGPT otrzymał najnowsze żądanie i zbudował aplikację, chociaż miał trudności z dodaniem dedykowanego suwaka głośności.
Wyniki: wszystkie modele są zdolne, ale nie pozbawione funkcji
Ostatecznie wszystkie trzy chatboty pomyślnie stworzyły działającą wersję Tome Reader. Jednak proces ten nie przebiegał bezproblemowo. ChatGPT był najwolniejszy. Claude wykazywał nieprzewidywalne zachowanie (w jednym przypadku wymagało 11 przebudów, aby rozwiązać problem z ładowaniem). Gemini okazało się ogólnie najbardziej niezawodne, ale także najmniej wygodne pod względem dostarczania plików.
Klucz na wynos? Sama prośba jest sprawą najwyższej wagi. Różnica w wydajności pomiędzy darmową i płatną wersją tych modeli była znikoma. Dobrze zaprojektowany zestaw instrukcji może dać imponujące rezultaty niezależnie od zastosowanej sztucznej inteligencji.
Przyszłość tworzenia aplikacji?
Ten eksperyment pokazuje, że sztuczna inteligencja szybko ewoluuje w realne narzędzie do szybkiego prototypowania, a nawet tworzenia funkcjonalnych aplikacji. Chociaż chatboty te nie zastępują doświadczonych programistów, znacznie obniżają barierę wejścia. Zdolność do iteracyjnej pracy z pomysłami bez głębokiej wiedzy na temat kodowania może przyspieszyć innowacje i pozwolić ludziom na urzeczywistnienie swoich wizji bez polegania na tradycyjnych procesach rozwoju.
Przyszłość tworzenia oprogramowania może być przyszłością polegającą na konwersacji, a sztuczna inteligencja będzie partnerem współpracującym w procesie projektowania i budowania.
