Google uruchomiła Gemini 3 Deep Think – zaawansowaną usługę AI do zadań naukowych, która kontynuuje „dostosowywanie” odpowiedzi do zapytań.
Google przedstawił zaktualizowaną wersję Gemini 3 Deep Think
Firma Google ogłosiła nowe, znaczące aktualizacje swojej platformy Gemini 3 Deep Think – sztucznej inteligencji zdolnej do rozumowania i rozwiązywania skomplikowanych problemów naukowo‑inżynieryjnych.
Co się zmieniło
Parametr | Nowość | Jak to wygląda | Cel
---|---|---|---
Przejście od czystej teorii do praktycznego zastosowania | Rozwiązywanie zadań bez wyraźnych ograniczeń, przy niekompletnych danych | Dostęp | Wbudowane w aplikację Gemini. Subskrybenci Google AI Ultra mogą korzystać, a przez API – inżynierowie i firmy (wymagana zgłoszenie)
Partnerzy rozwoju | Naukowcy‑badacze | Wspólna praca nad trudnymi zadaniami
Wskaźniki wydajności
Test | Wynik | Komentarz
---|---|---
Humanity’s Last Exam | 48,4 % | Bez zewnętrznych narzędzi
ARC‑AGI‑284,6 % | Benchmark dla asystentów AI
Codeforces (Elo) | 3455 | Wysoka pozycja wśród rozwiązań programistycznych
IMO 2025 | Złota medal | Równoważny poziom uczestników międzynarodowej olimpiady
Chemia/Fizyka | Ten sam wynik | Pokazał uniwersalność w różnych dyscyplinach
CMT‑Benchmark (teoria fizyki) | 50,5 % | Dobre opanowanie skomplikowanych koncepcji
Agent AI „Aletheia”
W laboratorium DeepMind Google stworzyli agenta Aletheia na bazie Gemini 3 Deep Think. Kluczowe cechy:
1. Weryfikacja hipotez – agent wykrywa słabości w proponowanych rozwiązaniach i koryguje je iteracyjnie.
2. Rozpoznawanie niepewności – może poinformować, że nie zna odpowiedzi.
3. Interakcja z zewnętrznymi źródłami – korzysta z wyszukiwarki Google i nawigacji internetowej, ale unika wymyślania linków.
Poziomy osiągnięć
Google podzielił sukcesy Aletheii na pięć etapów:
| Etap | Opis | Przykłady |
|---|---|---|
| 0 – „mała nowość” | Pełna autonomia, trzy zadania P. Erdösha rozwiązane (pierwszy poziom) | Trzy zadania Erdösha |
| 1 – „minimalna nowość” | Jeden dodatkowy wynik w trybie autonomicznym | Czwarta zadanie |
| 2 – „gotowość do publikacji” | Wyniki zarówno autonomiczne, jak i współpracujące z człowiekiem oraz narzędzia pomocnicze | Dane zadania 3–4 – „znaczący/przełomowy postęp” |
Jak Aletheia radzi sobie z zadaniami Erdösha
* Z 700 nierozwiązanych do tej pory problemów agenta udało się rozwiązać 13.
* Jednak tylko 4 z nich są naprawdę nowe – pozostałe są już znane w środowisku naukowym.
* Spośród 212 przedstawionych rozwiązań jedynie 6,5 % okazały się merytorycznie poprawne; 68,5 % zawierało fundamentalne błędy, a 31,5 % – niepoprawnie interpretowało zadanie.
Rozwórcy zauważają, że AI ma tendencję do „przeinterpretowania pytania tak, aby odpowiedź była prostsza”, i pozostaje „wysoce podatny na błędy w porównaniu z ludźmi”. W rezultacie nie można jeszcze zastąpić matematyków sztuczną inteligencją.
Podsumowując: Gemini 3 Deep Think oraz jego agent Aletheia prezentują imponujące wyniki w różnych dziedzinach nauki, ale jednocześnie zachowują znaczące ograniczenia pod względem dokładności i niezawodności rozwiązań. Google kontynuuje prace nad ulepszaniem zdolności AI do głębokiego rozumowania i weryfikacji własnych wniosków.
Komentarze (0)
Podziel się swoją opinią — prosimy o uprzejmość i trzymanie się tematu.
Zaloguj się, aby komentować