Alibaba, ByteDance i Kuaishou uruchomili nowe modele sztucznej inteligencji — od robotyki po generowanie wideo do filmów.
Chińscy giganci IT prezentują nowe algorytmy AI
Kontekst
W zeszłym tygodniu amerykański rynek sztucznej inteligencji był zajęty dyskusją na temat możliwości modeli Anthropic i Altruist, które wpływają na programowanie i usługi finansowe. Jednocześnie chińscy giganci technologiczni – Alibaba, ByteDance (właściciel TikTok) i Kuaishou – zaprezentowali własne modele AI, demonstrując wzrost wydajności w robotyce i generowaniu wideo. Te rozwinięcia potwierdzają, że Chiny nie pozostają w tyle za zachodnimi konkurentami.
Tło
Ogłoszenia o nowych algorytmach przyszły po niedawnym wypowiedzeniu Demisa Hassabisa (założyciela Google DeepMind), który zauważył, że chińskie modele AI są kilka miesięcy wyprzedzone w stosunku do zachodnich. Mimo to przedstawione w tym roku narzędzia mogą stanowić bezpośrednich rywali produktów OpenAI (Sora), Nvidia i Google w dziedzinie generowania wideo i robotyki.
1. RynnBrain – „inteligentny” asystent robotyczny od Alibaba
* Czym jest?
Dział badawczy Alibaba DAMO ogłosił model RynnBrain, przeznaczony do tego, aby roboty lepiej rozpoznawały otaczający świat i współdziałały z obiektami.
* Prezentacja
W filmie pokazany jest robot z szczypcami zamiast rąk, który zbiera pomarańcze i wkłada je do koszyka. Pokazywane jest także wyciąganie mleka z lodówki.
* Cechy techniczne
- Rozległe szkolenie potrzebne do rozpoznawania codziennych obiektów.
- RynnBrain zawiera wbudowane postrzeganie czasu i przestrzeni: robot pamięta, gdzie i kiedy odbywają się zdarzenia, śledzi postęp zadania i może kontynuować pracę na kilku etapach.
- To zwiększa niezawodność i spójność w realnych warunkach.
* Pozycjonowanie
Alibaba ma za cel stworzenie „podstawowego poziomu inteligencji” dla systemów zintegrowanych, konkurując z Nvidia i Google w robotyce.
2. Seedance 2.0 – generowanie wideo od ByteDance
* Funkcjonalność
Model pozwala tworzyć realistyczne klipy wideo na podstawie prostego opisu tekstowego. Algorytm może także przetwarzać istniejące wideo i obrazy, łącząc je w nowe kompozycje.
* Zalety
- Poprawiona kontrolowalność, szybkość i efektywność w porównaniu z poprzednimi wersjami.
- Pozytywny komentarz od badaczki Hugging Face Adiny Yakefu: model „zaskoczył swoją równowagą” i dostarcza wysokiej jakości wyniki już przy pierwszym uruchomieniu.
* Szczegóły techniczne
Seedance 2.0 łączy wizualizację, dźwięk i pracę operatora w jedną całość, tworząc gotowy produkt zamiast prototypu eksperymentalnego.
* Problemy i ograniczenia
- Z powodu kwestii prywatności ByteDance tymczasowo wyłączył funkcję generowania głosu człowieka na podstawie przesłanego zdjęcia.
- Decyzja podjęta po tym, jak bloger wyraził obawy dotyczące nieautoryzowanego syntezowania mowy.
3. Kling 3.0 – konkurent od Kuaishou
* Ogólny opis
Model Kling 3.0 przeznaczony jest do generowania wideo i pozycjonuje się jako bezpośredni rywal Seedance 2.0.
* Kluczowe ulepszenia
- Poprawiona spójność (szczegóły nie ujawnione w tekście, ale zakłada się znaczny wzrost jakości).
Wnioski
- Chińskie firmy aktywnie rozwijają algorytmy AI dla robotyki i generowania wideo, prezentując konkurencyjne rozwiązania.
- Alibaba skupia się na „inteligentnych” robotach z postrzeganiem czasu i przestrzeni.
- ByteDance oferuje zaawansowany model tworzenia treści wideo, ale zmaga się z kwestiami etyki syntezowania głosu.
- Kuaishou kontynuuje rozwój swojego portfolio modeli generatywnych, konkurując z ByteDance.
Te rozwinięcia potwierdzają, że Chiny nie tylko podążają za zachodnimi innowacjami, ale także aktywnie kształtują własny rynek produktów AI.
Komentarze (0)
Podziel się swoją opinią — prosimy o uprzejmość i trzymanie się tematu.
Zaloguj się, aby komentować