Nvidia przedstawiła Nemotron 3 Super 120B – otwarty model LLM z pięciokrotnym przyrostem szybkości dla agentów AI.

Nvidia przedstawiła Nemotron 3 Super 120B – otwarty model LLM z pięciokrotnym przyrostem szybkości dla agentów AI.

8 hardware

Nowa wersja od Nvidia – Nemotron 3 Super

Nvidia ogłosiła uruchomienie Nemotron 3 Super, otwartej modelu AI typu Mixture‑of‑Experts (MoE).

* 120 miliardów parametrów globalnych, z czego 12 miliardów aktywnych.
* Przeznaczona do agentowego AI – systemów, w których kilka „agentów” współdziała ze sobą i ze światem zewnętrznym.

Architektura
Model wykorzystuje hybrydowy podejście Mamba‑Transformer (połączenie warstw Mamba i elementów Transformer).

W Nemotron 3 Super po raz pierwszy zastosowano paradygmat LatentMoE, warstwy Multi‑Token Prediction oraz wstępne uczenie zgodnie z protokołem NVFP4. Według Nvidia stosunek ten zwiększa dokładność i przyspiesza inferencję.

Wydajność
* Przepustowość – do 5× szybsza niż poprzednia wersja Nemotron Super.
* Dokładność – do 2× wyższa.
* Wsparcie kontekstowego okna o wielkości 1 mln tokenów pozwala agentom przechowywać pełny stan procesu roboczego, zmniejszając ryzyko odchylenia od celu.

Praktyczne zastosowanie
Nemotron 3 Super sprawdza się w złożonych zadaniach w systemach wieloagentowych:

Zadanie Przykład użycia Generacja i debugowanie kodu bez dzielenia na dokumenty Automatyczne pisanie i weryfikacja dużych programów Analiza finansowa Włączenie tysięcy stron raportów do pamięci modelu

Uczenie
Model był trenowany na danych syntetycznych, stworzone przy pomocy logicznych modeli myślenia. Nvidia ujawnia pełną metodologię:

* ponad 10 bilionów tokenów przed i po treningu;
* 15 środowisk do uczenia ze wzmocnieniem;
* przepisy oceny.

Badacze mogą korzystać z platformy Nvidia NeMo do dalszego dostrajania lub tworzenia własnych wersji modelu.

Szczegóły techniczne
* Wsparcie NVFP4 na architekturze Nvidia Blackwell.
* Zmniejszenie wymagań pamięciowych i przyspieszenie wyjścia czterokrotnie w porównaniu z FP8 na Nvidia Hopper bez utraty dokładności.

Dostępność
Model jest już dostępny:

* Przez build.nvidia.com, Hugging Face, OpenRouter i Perplexity.
* Dostawcy chmury: Google Cloud Vertex AI, Oracle Cloud Infrastructure, CoreWeave, Together AI, Baseten, Cloudflare, DeepInfra, Fireworks AI, Modal.
* W formie mikroserwisu Nvidia NIM, umożliwiającego wdrożenie modelu lokalnie lub w chmurze.

Nemotron 3 Super otwiera nowe możliwości dla agentowego AI, łącząc wysoką dokładność, skalowalność i elastyczność konfiguracji.

Komentarze (0)

Podziel się swoją opinią — prosimy o uprzejmość i trzymanie się tematu.

Nie ma jeszcze komentarzy. Zostaw komentarz i podziel się swoją opinią!

Aby dodać komentarz, zaloguj się.

Zaloguj się, aby komentować