Nvidia przedstawiła Nemotron 3 Super 120B – otwarty model LLM z pięciokrotnym przyrostem szybkości dla agentów AI.
Nowa wersja od Nvidia – Nemotron 3 Super
Nvidia ogłosiła uruchomienie Nemotron 3 Super, otwartej modelu AI typu Mixture‑of‑Experts (MoE).
* 120 miliardów parametrów globalnych, z czego 12 miliardów aktywnych.
* Przeznaczona do agentowego AI – systemów, w których kilka „agentów” współdziała ze sobą i ze światem zewnętrznym.
Architektura
Model wykorzystuje hybrydowy podejście Mamba‑Transformer (połączenie warstw Mamba i elementów Transformer).
W Nemotron 3 Super po raz pierwszy zastosowano paradygmat LatentMoE, warstwy Multi‑Token Prediction oraz wstępne uczenie zgodnie z protokołem NVFP4. Według Nvidia stosunek ten zwiększa dokładność i przyspiesza inferencję.
Wydajność
* Przepustowość – do 5× szybsza niż poprzednia wersja Nemotron Super.
* Dokładność – do 2× wyższa.
* Wsparcie kontekstowego okna o wielkości 1 mln tokenów pozwala agentom przechowywać pełny stan procesu roboczego, zmniejszając ryzyko odchylenia od celu.
Praktyczne zastosowanie
Nemotron 3 Super sprawdza się w złożonych zadaniach w systemach wieloagentowych:
Zadanie Przykład użycia Generacja i debugowanie kodu bez dzielenia na dokumenty Automatyczne pisanie i weryfikacja dużych programów Analiza finansowa Włączenie tysięcy stron raportów do pamięci modelu
Uczenie
Model był trenowany na danych syntetycznych, stworzone przy pomocy logicznych modeli myślenia. Nvidia ujawnia pełną metodologię:
* ponad 10 bilionów tokenów przed i po treningu;
* 15 środowisk do uczenia ze wzmocnieniem;
* przepisy oceny.
Badacze mogą korzystać z platformy Nvidia NeMo do dalszego dostrajania lub tworzenia własnych wersji modelu.
Szczegóły techniczne
* Wsparcie NVFP4 na architekturze Nvidia Blackwell.
* Zmniejszenie wymagań pamięciowych i przyspieszenie wyjścia czterokrotnie w porównaniu z FP8 na Nvidia Hopper bez utraty dokładności.
Dostępność
Model jest już dostępny:
* Przez build.nvidia.com, Hugging Face, OpenRouter i Perplexity.
* Dostawcy chmury: Google Cloud Vertex AI, Oracle Cloud Infrastructure, CoreWeave, Together AI, Baseten, Cloudflare, DeepInfra, Fireworks AI, Modal.
* W formie mikroserwisu Nvidia NIM, umożliwiającego wdrożenie modelu lokalnie lub w chmurze.
Nemotron 3 Super otwiera nowe możliwości dla agentowego AI, łącząc wysoką dokładność, skalowalność i elastyczność konfiguracji.
Komentarze (0)
Podziel się swoją opinią — prosimy o uprzejmość i trzymanie się tematu.
Zaloguj się, aby komentować