Google uruchomiła Gemini 3 Deep Think – zaawansowaną usługę AI do zadań naukowych, która kontynuuje „dostosowywanie” odpowiedzi do zapytań.

Google uruchomiła Gemini 3 Deep Think – zaawansowaną usługę AI do zadań naukowych, która kontynuuje „dostosowywanie” odpowiedzi do zapytań.

6 software

Google przedstawił zaktualizowaną wersję Gemini 3 Deep Think

Firma Google ogłosiła nowe, znaczące aktualizacje swojej platformy Gemini 3 Deep Think – sztucznej inteligencji zdolnej do rozumowania i rozwiązywania skomplikowanych problemów naukowo‑inżynieryjnych.

Co się zmieniło
Parametr | Nowość | Jak to wygląda | Cel
---|---|---|---
Przejście od czystej teorii do praktycznego zastosowania | Rozwiązywanie zadań bez wyraźnych ograniczeń, przy niekompletnych danych | Dostęp | Wbudowane w aplikację Gemini. Subskrybenci Google AI Ultra mogą korzystać, a przez API – inżynierowie i firmy (wymagana zgłoszenie)
Partnerzy rozwoju | Naukowcy‑badacze | Wspólna praca nad trudnymi zadaniami

Wskaźniki wydajności
Test | Wynik | Komentarz
---|---|---
Humanity’s Last Exam | 48,4 % | Bez zewnętrznych narzędzi
ARC‑AGI‑284,6 % | Benchmark dla asystentów AI
Codeforces (Elo) | 3455 | Wysoka pozycja wśród rozwiązań programistycznych
IMO 2025 | Złota medal | Równoważny poziom uczestników międzynarodowej olimpiady
Chemia/Fizyka | Ten sam wynik | Pokazał uniwersalność w różnych dyscyplinach
CMT‑Benchmark (teoria fizyki) | 50,5 % | Dobre opanowanie skomplikowanych koncepcji

Agent AI „Aletheia”
W laboratorium DeepMind Google stworzyli agenta Aletheia na bazie Gemini 3 Deep Think. Kluczowe cechy:

1. Weryfikacja hipotez – agent wykrywa słabości w proponowanych rozwiązaniach i koryguje je iteracyjnie.
2. Rozpoznawanie niepewności – może poinformować, że nie zna odpowiedzi.
3. Interakcja z zewnętrznymi źródłami – korzysta z wyszukiwarki Google i nawigacji internetowej, ale unika wymyślania linków.

Poziomy osiągnięć
Google podzielił sukcesy Aletheii na pięć etapów:

EtapOpisPrzykłady
0 – „mała nowość”Pełna autonomia, trzy zadania P. Erdösha rozwiązane (pierwszy poziom)Trzy zadania Erdösha
1 – „minimalna nowość”Jeden dodatkowy wynik w trybie autonomicznymCzwarta zadanie
2 – „gotowość do publikacji”Wyniki zarówno autonomiczne, jak i współpracujące z człowiekiem oraz narzędzia pomocniczeDane zadania 3–4 – „znaczący/przełomowy postęp”

Jak Aletheia radzi sobie z zadaniami Erdösha
* Z 700 nierozwiązanych do tej pory problemów agenta udało się rozwiązać 13.
* Jednak tylko 4 z nich są naprawdę nowe – pozostałe są już znane w środowisku naukowym.
* Spośród 212 przedstawionych rozwiązań jedynie 6,5 % okazały się merytorycznie poprawne; 68,5 % zawierało fundamentalne błędy, a 31,5 % – niepoprawnie interpretowało zadanie.

Rozwórcy zauważają, że AI ma tendencję do „przeinterpretowania pytania tak, aby odpowiedź była prostsza”, i pozostaje „wysoce podatny na błędy w porównaniu z ludźmi”. W rezultacie nie można jeszcze zastąpić matematyków sztuczną inteligencją.

Podsumowując: Gemini 3 Deep Think oraz jego agent Aletheia prezentują imponujące wyniki w różnych dziedzinach nauki, ale jednocześnie zachowują znaczące ograniczenia pod względem dokładności i niezawodności rozwiązań. Google kontynuuje prace nad ulepszaniem zdolności AI do głębokiego rozumowania i weryfikacji własnych wniosków.

Komentarze (0)

Podziel się swoją opinią — prosimy o uprzejmość i trzymanie się tematu.

Nie ma jeszcze komentarzy. Zostaw komentarz i podziel się swoją opinią!

Aby dodać komentarz, zaloguj się.

Zaloguj się, aby komentować