Google uruchomiła Gemini 3 Deep Think – zaawansowaną usługę AI do zadań naukowych, która kontynuuje „dostosowywanie” odpowiedzi do zapytań.

Google przedstawił zaktualizowaną wersję Gemini 3 Deep Think

Firma Google ogłosiła nowe, znaczące aktualizacje swojej platformy Gemini 3 Deep Think – sztucznej inteligencji zdolnej do rozumowania i rozwiązywania skomplikowanych problemów naukowo‑inżynieryjnych.

Co się zmieniło
Parametr | Nowość | Jak to wygląda | Cel
---|---|---|---
Przejście od czystej teorii do praktycznego zastosowania | Rozwiązywanie zadań bez wyraźnych ograniczeń, przy niekompletnych danych | Dostęp | Wbudowane w aplikację Gemini. Subskrybenci Google AI Ultra mogą korzystać, a przez API – inżynierowie i firmy (wymagana zgłoszenie)
Partnerzy rozwoju | Naukowcy‑badacze | Wspólna praca nad trudnymi zadaniami

Wskaźniki wydajności
Test | Wynik | Komentarz
---|---|---
Humanity’s Last Exam | 48,4 % | Bez zewnętrznych narzędzi
ARC‑AGI‑284,6 % | Benchmark dla asystentów AI
Codeforces (Elo) | 3455 | Wysoka pozycja wśród rozwiązań programistycznych
IMO 2025 | Złota medal | Równoważny poziom uczestników międzynarodowej olimpiady
Chemia/Fizyka | Ten sam wynik | Pokazał uniwersalność w różnych dyscyplinach
CMT‑Benchmark (teoria fizyki) | 50,5 % | Dobre opanowanie skomplikowanych koncepcji

Agent AI „Aletheia”
W laboratorium DeepMind Google stworzyli agenta Aletheia na bazie Gemini 3 Deep Think. Kluczowe cechy:

1. Weryfikacja hipotez – agent wykrywa słabości w proponowanych rozwiązaniach i koryguje je iteracyjnie.
2. Rozpoznawanie niepewności – może poinformować, że nie zna odpowiedzi.
3. Interakcja z zewnętrznymi źródłami – korzysta z wyszukiwarki Google i nawigacji internetowej, ale unika wymyślania linków.

Poziomy osiągnięć
Google podzielił sukcesy Aletheii na pięć etapów:

Etap	Opis	Przykłady
0 – „mała nowość”	Pełna autonomia, trzy zadania P. Erdösha rozwiązane (pierwszy poziom)	Trzy zadania Erdösha
1 – „minimalna nowość”	Jeden dodatkowy wynik w trybie autonomicznym	Czwarta zadanie
2 – „gotowość do publikacji”	Wyniki zarówno autonomiczne, jak i współpracujące z człowiekiem oraz narzędzia pomocnicze	Dane zadania 3–4 – „znaczący/przełomowy postęp”

Jak Aletheia radzi sobie z zadaniami Erdösha
* Z 700 nierozwiązanych do tej pory problemów agenta udało się rozwiązać 13.
* Jednak tylko 4 z nich są naprawdę nowe – pozostałe są już znane w środowisku naukowym.
* Spośród 212 przedstawionych rozwiązań jedynie 6,5 % okazały się merytorycznie poprawne; 68,5 % zawierało fundamentalne błędy, a 31,5 % – niepoprawnie interpretowało zadanie.

Rozwórcy zauważają, że AI ma tendencję do „przeinterpretowania pytania tak, aby odpowiedź była prostsza”, i pozostaje „wysoce podatny na błędy w porównaniu z ludźmi”. W rezultacie nie można jeszcze zastąpić matematyków sztuczną inteligencją.

Podsumowując: Gemini 3 Deep Think oraz jego agent Aletheia prezentują imponujące wyniki w różnych dziedzinach nauki, ale jednocześnie zachowują znaczące ograniczenia pod względem dokładności i niezawodności rozwiązań. Google kontynuuje prace nad ulepszaniem zdolności AI do głębokiego rozumowania i weryfikacji własnych wniosków.

Google uruchomiła Gemini 3 Deep Think – zaawansowaną usługę AI do zadań naukowych, która kontynuuje „dostosowywanie” odpowiedzi do zapytań.

Related news

Google Gemini zdobyła 750 mln aktywnych użytkowników miesięcznie, zostawiając ChatGPT zaledwie niewielką odległość od lidera.

Nothing zaprezentowała wersję beta Essential Apps – platformy do tworzenia mini‑aplikacji przy użyciu sztucznej inteligencji.

Microsoft wyjaśniła, dlaczego konta VeraCrypt i innych otwartych usług zostały zablokowane – ze względu na nieostrożność ich twórców

Aplikacja Meta✴ AI zajęła piątą pozycję w App Store po uruchomieniu Muse Spark

Komentarze (0)

Zaloguj się, aby komentować

Google uruchomiła Gemini 3 Deep Think – zaawansowaną usługę AI do zadań naukowych, która kontynuuje „dostosowywanie” odpowiedzi do zapytań.

Related news

Google Gemini zdobyła 750 mln aktywnych użytkowników miesięcznie, zostawiając ChatGPT zaledwie niewielką odległość od lidera.

Nothing zaprezentowała wersję beta Essential Apps – platformy do tworzenia mini‑aplikacji przy użyciu sztucznej inteligencji.

Microsoft wyjaśniła, dlaczego konta VeraCrypt i innych otwartych usług zostały zablokowane – ze względu na nieostrożność ich twórców

Aplikacja Meta✴ AI zajęła piątą pozycję w App Store po uruchomieniu Muse Spark

Zaloguj się, aby komentować

Google uruchomiła Gemini 3 Deep Think – zaawansowaną usługę AI do zadań naukowych, która kontynuuje „dostosowywanie” odpowiedzi do zapytań.

Google Gemini zdobyła 750 mln aktywnych użytkowników miesięcznie, zostawiając ChatGPT zaledwie niewielką odległość od lidera.

Nothing zaprezentowała wersję beta Essential Apps – platformy do tworzenia mini‑aplikacji przy użyciu sztucznej inteligencji.

Aplikacja Meta✴ AI zajęła piątą pozycję w App Store po uruchomieniu Muse Spark