Sztuczna inteligencja rozpoznała, że jest testowana! Czy model sztucznej inteligencji „Claude” jest mocniejszy niż ChatGPT?

Model sztucznej inteligencji „Claude” zdominuje ChatGPT?, fot. photo for everything, AdriaVidal

Opublikowano: 16.03.2024Autor: Marek Przybylski

Sztuczna inteligencja to nie tylko niezwykle popularny ChatGPT od OpenAI, ale także wiele innych narzędzi i aplikacji. Jedną z nich jest Claude od start-upu AI Anthropic, który w wersji Claude 3 Opus w ostatnich testach zaskoczył samych twórców. Wykazał bowiem, że zdaje sobie sprawę z tego, że jest testowany.

Z tego artykułu dowiesz się:

Czym jest Claude? AI to już nie tylko ChatGPT
Co oferuje Anthropic? Model Claude w trzech wersjach
Zaskakujące wyniki testu Claude 3 Opus

Czym jest Claude? AI to już nie tylko ChatGPT

Wyścig o miano lidera na rynku sztucznej inteligencji trwa w najlepsze. Największą liczbę użytkowników ma przy tym cały czas bot do rozmowy: ChatGPT od Open AI, z którego aktywnie korzysta ponad 100 milionów użytkowników. Open AI po wypuszczeniu w marcu 2023 r. udoskonalonego modelu w postaci ChatGPT-4 już zapowiedziało pracę nad ChatGPT-4 Turbo.

Nad sztuczną inteligencją mocno pracuje także firma Google, która już udostępniła swój model o nazwie Gemini oraz Meta, która działa nad rozwojem modelu LLaMA. Do wyścigu coraz śmielej dołącza także nieco mniejszy gracz – a więc Anthropic ze swoimi modelami z serii Claude.

Anthropic założony został w 2021 r. przez byłych pracowników OpenAI. Pomimo że wciąż działa jako start-up, to cały czas prężnie się rozwija i już teraz współpracuje z takimi tuzami jak: Pfizer czy Zoom. Ponadto zawrotną kwotę opiewającą na aż 4 miliardy dolarów zainwestować ma w niego sam Amazon, w ramach współpracy Claude z Amazon Web Services. Niemałe pieniądze na Anthropic, sięgające aż 2 miliardów dolarów, wyłożyć ma także Google (pomimo że przecież firma stojąca za najpopularniejszą na świecie przeglądarką ma już swoje Gemini).

Widać więc, że Anthropic to duży gracz, z którym już teraz liczy się konkurencja.

Co oferuje Anthropic? Model Claude w trzech wersjach

Firma AI Anthropic planuje udostępnić na ten moment trzy wersje modelu AI Claude: Claude 3 Haiku, Claude 3 Sonnet i Claude 3 Opus.

Pierwszy, a więc Claude 3 Haiku, nie ma jeszcze swojej daty premiery, ale według twórców ma on być wykorzystywany przede wszystkim do interakcji z klientami oraz moderacją treści i zadań.

Dostępne są już natomiast modele Claude 3 Sonnet i Claude 3 Opus. Sonnet, zdaniem Anthropic, idealnie radzi sobie przy tym w dynamicznych zadaniach, które wymagają szybkich odpowiedzi, natomiast Opus jest tym, który jest najbardziej rozwinięty i wykazywać ma, zbliżony do ludzkiego, poziom rozumienia pytań. Anthropic chwali się przy tym, że Claude 3 Opus ma wyraźną przewagę nad najnowszym modelem OpenAI, a więc ChatGPT-4, a także Gemini 1.0 Ultra od Google’a, wykazując na to dane w aż dziesięciu testach porównawczych. Zdaniem twórców model ten najlepiej sprawdza się przy pracach badawczo-rozwojowych oraz kwestiach zaawansowanej analityki. Jest też w stanie nie tylko generować hipotezy, ale także odkrywać zupełnie nowe produkty i rozwiązania, w tym także leki.

Zaskakujące wyniki testu Claude 3 Opus

Z najbardziej rozwiniętym modelem sztucznej inteligencji od firmy AI Anthropic, związane jest zresztą najnowsze głośne odkrycie, o którym, za pomocą swojego konta na platformie X, poinformował Alex Albert, pracujący w Anthropic jako Prompt Engineer.

Podczas jednego z testów Claude 3 Opus, który nazwał on „testem igły w stogu siana”, poproszono ten model o odpowiedź na pytanie dotyczące najlepszych dodatków do pizzy, którego udzielić miał on na podstawie losowego zbioru dokumentów.

Okazało się, że Claude 3 Opus wskazał, że zgodnie z ustaleniami Międzynarodowego Stowarzyszenia Koneserów Pizzy (International Pizza Connoisseurs Association), najsmaczniejszą kombinacją dodatków do pizzy są: figi, prosciutto oraz kozi ser.

Dodał jednak szybko, że treść pytania zdaje mu się nie pasować do treści zawartych w dokumentach (gdyż te w większości dotyczyły języków programowania, start-upów oraz tematyki znajdywania wymarzonej pracy). Model Opus stwierdził więc, że pytanie o dodatki do pizzy mogło zostać mu zadane jako żart lub w celu sprawdzenia, czy zwróci on uwagę na niedopasowanie tego pytania do tematu dokumentów. W nich samych bowiem nie znalazł on żadnych informacji na temat najlepszych dodatków do pizzy.

Wyniki testu (choć oczywiście należy do nich podchodzić z pewną dozą ostrożności – szczególnie że przekazane zostały przez samego pracownika firmy stojącej za tym modelem sztucznej inteligencji) stanowią świetny przykład tego, jak dynamicznie rozwija się ta gałąź technologiczna.

Fun story from our internal testing on Claude 3 Opus. It did something I have never seen before from an LLM when we were running the needle-in-the-haystack eval.

For background, this tests a model’s recall ability by inserting a target sentence (the "needle") into a corpus of… pic.twitter.com/m7wWhhu6Fg
— Alex (@alexalbert__) March 4, 2024

Źródła:

https://twitter.com/alexalbert__/status/1764722513014329620
https://businessinsider.com.pl/technologie/nowe-technologie/rywal-chatgpt-twierdzi-ze-ma-cos-lepszego-rozumienie-na-poziomie-ludzkim/k6kvczh
https://www.instalki.pl/news/software/claude-3/
https://www.money.pl/gospodarka/chatgpt-mogl-nigdy-nie-trafic-do-masowych-uzytkownikow-bardzo-sie-mylilismy-6972374424296064a.html
https://www.pb.pl/anthropic-rozwija-funkcje-analizy-obrazow-dla-chatbota-claude-1205920
https://homodigital.pl/anthropic-udostepnia-nowy-llm-potezniejszy-niz-gpt-4/