W sieci pojawił się podejrzany „bezdomny” moduł AI, który może być związany z projektem DeepSeek
Hunter Alpha – tajemniczy model wywołujący podejrzenia o DeepSeek
Nowy model AI pojawiający się na platformie OpenRouter bez wskazania autora szybko przyciągnął uwagę dziennikarzy i badaczy. 11 marca został opublikowany jako „Hunter Alpha” i później oznaczony przez samą platformę jako „ukryty model”, co wzmocniło plotki, że chiński startup DeepSeek może dyskretnie testować swoją kolejną generację AI przed oficjalnym wydaniem.
Co mówią eksperci
* Reuters przeprowadził serię testów z chatbotem Hunter Alpha.
- Bot sam siebie opisał jako „chiński model, wytrenowany głównie na języku chińskim”.
- Wskazał, że dane treningowe obejmują okres do maja 2025 roku – data zgodna z tą wspomnianą przez własnego chatbota DeepSeek.
- Na pytanie o twórcę odpowiedział tylko: „znam swoją nazwę, liczbę parametrów i długość okna kontekstowego”. Ani DeepSeek, ani OpenRouter nie ujawniły autora.
Specyfikacja techniczna
* 1 bilion parametrów – wskazuje na ogromne wymagania obliczeniowe.
* Okno kontekstowe do 1 miliona tokenów – pozwala przetwarzać gigantyczne ilości tekstu w jednej sesji.
Nabil Haum, inżynier ds. agentów AI, zauważył, że połączenie tak dużego okna i logicznego rozumowania przy darmowym dostępie natychmiast rzuca się w oczy; podobne modele zwykle wymagają większych nakładów.
Związek z DeepSeek V4
* Ten sam zestaw parametrów (1 bilion) i okno kontekstowe (1 milion tokenów) pokrywa się z tym, co zadeklarowano dla nadchodzącego modelu DeepSeek V4, planowanego na wydanie w kwietniu.
* To dopasowanie wywołało falę przypuszczeń, że Hunter Alpha może być wczesną wersją testową przyszłego produktu.
Analiza logicznego rozumowania
* Daniel Dewhurst przeprowadził analizę wzorców łańcucha myślenia i doszedł do wniosku, że styl konstrukcji logicznych w botcie jest trudny do podrobienia; zazwyczaj odzwierciedla metodę treningu modelu.
Jednak nie wszyscy zgadzają się z tym wnioskiem.
Niezależna opinia
* Umur Ozkul przeprowadził niezależne benchmarki i stwierdził, że Hunter Alpha prawdopodobnie nie jest DeepSeek V4.
- Wskazał różnice w zachowaniu tokenów i wzorcach architektonicznych w porównaniu z już istniejącymi systemami DeepSeek.
Popularność modelu
* Według danych OpenRouter w niedzielę model przetworzył ponad 160 miliardów tokenów.
* Większość zapytań pochodziła od narzędzi deweloperskich i frameworków dla agentów AI.
Anonimowe uruchamianie modeli nie jest rzadkością: wielu programistów korzysta z takiego podejścia, aby uzyskać obiektywną opinię społeczności przed oficjalnym wydaniem.
Komentarze (0)
Podziel się swoją opinią — prosimy o uprzejmość i trzymanie się tematu.
Zaloguj się, aby komentować