Alibaba, ByteDance i Kuaishou uruchomili nowe modele sztucznej inteligencji — od robotyki po generowanie wideo do filmów.

Alibaba, ByteDance i Kuaishou uruchomili nowe modele sztucznej inteligencji — od robotyki po generowanie wideo do filmów.

4 hardware

Chińscy giganci IT prezentują nowe algorytmy AI
Kontekst

W zeszłym tygodniu amerykański rynek sztucznej inteligencji był zajęty dyskusją na temat możliwości modeli Anthropic i Altruist, które wpływają na programowanie i usługi finansowe. Jednocześnie chińscy giganci technologiczni – Alibaba, ByteDance (właściciel TikTok) i Kuaishou – zaprezentowali własne modele AI, demonstrując wzrost wydajności w robotyce i generowaniu wideo. Te rozwinięcia potwierdzają, że Chiny nie pozostają w tyle za zachodnimi konkurentami.

Tło

Ogłoszenia o nowych algorytmach przyszły po niedawnym wypowiedzeniu Demisa Hassabisa (założyciela Google DeepMind), który zauważył, że chińskie modele AI są kilka miesięcy wyprzedzone w stosunku do zachodnich. Mimo to przedstawione w tym roku narzędzia mogą stanowić bezpośrednich rywali produktów OpenAI (Sora), Nvidia i Google w dziedzinie generowania wideo i robotyki.

1. RynnBrain – „inteligentny” asystent robotyczny od Alibaba
* Czym jest?

Dział badawczy Alibaba DAMO ogłosił model RynnBrain, przeznaczony do tego, aby roboty lepiej rozpoznawały otaczający świat i współdziałały z obiektami.

* Prezentacja

W filmie pokazany jest robot z szczypcami zamiast rąk, który zbiera pomarańcze i wkłada je do koszyka. Pokazywane jest także wyciąganie mleka z lodówki.

* Cechy techniczne

- Rozległe szkolenie potrzebne do rozpoznawania codziennych obiektów.
- RynnBrain zawiera wbudowane postrzeganie czasu i przestrzeni: robot pamięta, gdzie i kiedy odbywają się zdarzenia, śledzi postęp zadania i może kontynuować pracę na kilku etapach.
- To zwiększa niezawodność i spójność w realnych warunkach.

* Pozycjonowanie

Alibaba ma za cel stworzenie „podstawowego poziomu inteligencji” dla systemów zintegrowanych, konkurując z Nvidia i Google w robotyce.

2. Seedance 2.0 – generowanie wideo od ByteDance
* Funkcjonalność

Model pozwala tworzyć realistyczne klipy wideo na podstawie prostego opisu tekstowego. Algorytm może także przetwarzać istniejące wideo i obrazy, łącząc je w nowe kompozycje.

* Zalety

- Poprawiona kontrolowalność, szybkość i efektywność w porównaniu z poprzednimi wersjami.
- Pozytywny komentarz od badaczki Hugging Face Adiny Yakefu: model „zaskoczył swoją równowagą” i dostarcza wysokiej jakości wyniki już przy pierwszym uruchomieniu.

* Szczegóły techniczne

Seedance 2.0 łączy wizualizację, dźwięk i pracę operatora w jedną całość, tworząc gotowy produkt zamiast prototypu eksperymentalnego.

* Problemy i ograniczenia

- Z powodu kwestii prywatności ByteDance tymczasowo wyłączył funkcję generowania głosu człowieka na podstawie przesłanego zdjęcia.
- Decyzja podjęta po tym, jak bloger wyraził obawy dotyczące nieautoryzowanego syntezowania mowy.

3. Kling 3.0 – konkurent od Kuaishou
* Ogólny opis

Model Kling 3.0 przeznaczony jest do generowania wideo i pozycjonuje się jako bezpośredni rywal Seedance 2.0.

* Kluczowe ulepszenia

- Poprawiona spójność (szczegóły nie ujawnione w tekście, ale zakłada się znaczny wzrost jakości).

Wnioski
- Chińskie firmy aktywnie rozwijają algorytmy AI dla robotyki i generowania wideo, prezentując konkurencyjne rozwiązania.
- Alibaba skupia się na „inteligentnych” robotach z postrzeganiem czasu i przestrzeni.
- ByteDance oferuje zaawansowany model tworzenia treści wideo, ale zmaga się z kwestiami etyki syntezowania głosu.
- Kuaishou kontynuuje rozwój swojego portfolio modeli generatywnych, konkurując z ByteDance.

Te rozwinięcia potwierdzają, że Chiny nie tylko podążają za zachodnimi innowacjami, ale także aktywnie kształtują własny rynek produktów AI.

Komentarze (0)

Podziel się swoją opinią — prosimy o uprzejmość i trzymanie się tematu.

Nie ma jeszcze komentarzy. Zostaw komentarz i podziel się swoją opinią!

Aby dodać komentarz, zaloguj się.

Zaloguj się, aby komentować