Projekt Astra i Mariner Prezentowane jako Kluczowe Innowacje w Gemini 2.0
Prezes Google i Alphabet, Sundar Pichai ogłosił w środę uruchomienie Gemini 2.0, nowej wersji modelu AI firmy, mającej na celu rozwinięcie możliwości w zakresie multimodalnego wnioskowania oraz rozwój inteligentnych agentów.
W pośpiechu? Oto najważniejsze informacje!
- Gemini 2.0 Flash oferuje niską latencję i ulepszoną wydajność dla deweloperów.
- Projekt Astra poprawia dialog i pamięć, wspierając komunikację wielojęzyczną i narzędzia integracyjne.
- Projekt Mariner, wczesny prototyp, z powodzeniem porusza się po zadaniach internetowych z sukcesem na poziomie 83,5%.
Z Gemini 2.0, Google zbliża się do swojej wizji stworzenia uniwersalnego asystenta, z nowymi funkcjami, które rozszerzą użyteczność sztucznej inteligencji w różnych dziedzinach.
Uruchomienie Gemini 2.0 nastąpiło po wprowadzeniu Gemini 1.0 w grudniu 2023 roku, co oznaczało początek stawiania przez Google na multimodalne AI, zdolne do przetwarzania i rozumienia tekstu, obrazów, wideo, dźwięku i kodu.
Teraz, z wydaniem Gemini 2.0, te możliwości są jeszcze bardziej rozbudowane, co umożliwia zarówno wprowadzanie, jak i wyjście wielu modalności, w tym obrazów, filmów, a nawet tekstu na mowę w wielu językach.
W sercu Gemini 2.0 leży jego „agentywna” natura, co oznacza, że potrafi rozwiązywać problemy i podejmować działania w imieniu użytkownika pod jego nadzorem. Wydanie to oznacza początek szerszych starań o zintegrowanie tych zaawansowanych możliwości z produktami codziennego użytku.
Te możliwości przybliżają Gemini 2.0 do stania się uniwersalnym asystentem, zdolnym do wspierania różnych aplikacji w różnych branżach.
Dla deweloperów start obejmuje również model Gemini 2.0 Flash, prawdziwego konia pociągowego o niskim opóźnieniu i poprawionej wydajności, dostępnego za pośrednictwem API Gemini i Google AI Studio. Model ten ma na celu zapewnienie interakcji w czasie rzeczywistym, efektywnych, co znacznie poprawia szybkość i skuteczność aplikacji AI.
Gemini 2.0 Flash będzie dostępny dla deweloperów na początku 2024 roku, a użytkownicy mogą doświadczyć ulepszonej wersji asystenta Gemini za pośrednictwem aplikacji Gemini, która jest zoptymalizowana dla dostępu z telefonu komórkowego i komputera.
Dodatkowo, nowe projekty oparte na Gemini 2.0 pokazują rozwijające się możliwości agentów AI. Projekt Astra to asystent AI, który korzysta z multimodalnego rozumienia, aby interaktywnie działać w rzeczywistym świecie. Otrzymał cenne uwagi od zaufanych testerów, co pozwoliło Google doskonalić jego zdolności.
Najnowsze aktualizacje obejmują udoskonalony dialog, z obsługą wielu języków i akcentów, oraz nowe integracje narzędzi, takie jak Google Search, Lens i Maps. Projekt Astra może również pochwalić się lepszą pamięcią, która pozwala mu przypominać sobie wcześniejsze rozmowy, oraz niższym opóźnieniem, umożliwiającym niemal natychmiastowe odpowiedzi.
Google rozszerza swój program testowy i planuje wprowadzić te funkcje do różnych urządzeń, w tym prototypowych okularów.
Project Mariner, kolejny projekt zasilany przez Gemini 2.0, to przeglądarkowy agent AI zaprojektowany do pomocy w skomplikowanych zadaniach. Potrafi poruszać się po stronach internetowych, rozumieć tekst, kod, obrazy i formularze, oraz wykonywać zadania, takie jak wypełnianie formularzy.
Chociaż nadal znajduje się na wczesnym etapie, wykazał imponującą wydajność, osiągając 83,5% sukcesu w teście WebVoyager. Zastosowano środki bezpieczeństwa, takie jak wymaganie potwierdzenia przez użytkownika przed wykonaniem czułych działań.
Dodatkowo, Google eksperymentuje z agentami AI w grach, gdzie pomagają nawigować wirtualnymi światach, oraz w robotyce, wykorzystując przestrzenne rozumowanie Gemini 2.0 do zastosowań w realnym świecie. Google kładzie nacisk na odpowiedzialny rozwój, współpracując z ekspertami w celu zminimalizowania ryzyka i zapewnienia bezpieczeństwa w tych zaawansowanych systemach AI.
Zostaw komentarz
Anuluj odpowiedź