Mountain View, Kalifornia, 2026. április 19., 10:31 PDT
A Google frissíti a Geminit egy új funkcióval: a chatbot mostantól hozzáfér az előfizetők Google Fotók könyvtárához, hogy egyedi AI-képeket generáljon. Ez a lépés a vállalat fogyasztói MI-jét még mélyebben beengedi a felhasználók privát fiókadataiba, túllépve a pusztán begépelt utasításokon.
A Personal Intelligence, a Google opcionális eszköze, amely összekapcsolja a Geminit a Google alkalmazásokkal, most már működik a Nano Banana 2-vel, a vállalat legújabb képgeneráló modelljével. A The Verge szerint a rendszer a Google Fotók címkéit használja arra, hogy kiválassza a személyeket – például a felhasználót, barátokat és családtagokat –, majd egy egyszerű utasításból képet készít.
Az időzítés kulcsfontosságú: a Google személyes adatokat akar felhasználni, hogy előnyt szerezzen a fizetős MI-harcban. A képgenerálás mostanra a fogyasztói MI-előfizetések fő belépési pontja lett. Ahelyett, hogy egyszerűen csak fejlesztené az utasításmezőt, a Google a hatalmas Fotók archívumát használja ki, hogy csökkentse a súrlódást azoknak a felhasználóknak, akik személyre szabott képeket szeretnének készíteni.
A Google közölte, hogy a frissítést a következő napokban vezeti be az Egyesült Államokban a Google AI Plus, Pro és Ultra előfizetőinek. A vállalat tervezi, hogy az asztali Chrome-ban is elérhetővé teszi a funkciót a Geminiben, majd további felhasználókhoz is eljuttatja. A TechCrunch szerint van egy „források” gomb is, amely lehetővé teszi a felhasználók számára, hogy ellenőrizzék, a Gemini hogyan állította össze a kontextust bármely generált képhez. TechCrunch
A Google munkatársai, Animish Sivaramakrishnan és David Sharon szerint a frissítés célja, hogy a felhasználók „több időt tölthessenek alkotással, és kevesebbet magyarázattal”. Olyan utasításokra mutatnak példát, mint amikor a Gemini-t arra kérik, hogy vázoljon fel egy álomházat, vagy készítsen egy képet a sivatagi szigetre szükséges tárgyakról, az eredményeket pedig a Google alkalmazásokból származó preferenciákhoz igazítja. Blog
Ezzel a frissítéssel a felhasználóknak nem kell többé fotót keresniük, letölteniük, majd feltölteniük csak azért, hogy családi stílusú képet készítsenek. Amíg a Fotók címkék rendben vannak, a Gemini kiválaszt egy megfelelő képet referenciaként. Ha valamit elront, a felhasználók kicserélhetik a referenciaképet, vagy közvetlenül javíthatják az eredményt.
A bizalom a sarkalatos pont. A Google állítja, hogy a Gemini nem tanul a privát Google Fotók könyvtárakból, és a felhasználók kikapcsolhatják az alkalmazáskapcsolatokat. Ennek ellenére egy Google Fotók súgóoldal megjegyzi, hogy a Gemini funkciói a Fotókban hozzáférhetnek fotókhoz, videókhoz, arccsoport-címkékhez és Google-fiók adatokhoz – ezeket az információkat feldolgozhatják a szerkesztések javításához vagy olyan részletek kikövetkeztetéséhez, mint az életkor vagy a fő arccsoportok helye.
Az első tesztek azt mutatják, hogy az eszköz képes megőrizni egy személy hasonlóságát még akkor is, ha a környezet változik. Eric Hal Schwartz a TechRadarnál azt mondta, hogy a fantasy-stílusú képe még mindig hasonlított rá – nem cserélte le „egy általános helyettesítőre”. Néhány eredmény azonban szerinte furcsa feltételezéseket tett. TechRadar
Ez a Google-t az OpenAI ChatGPT Images, az Adobe Firefly és a Meta AI mellé sorolja – mindegyikük saját képgeneráló vagy szöveg-alapú képszerkesztő terméket kínál. A Google azonban egy kulcsfontosságú különbségre támaszkodik: az első féltől származó kontextusra. Ha a felhasználók beleegyeznek, az eszköz hozzáférhet a Fotókhoz és más összekapcsolt alkalmazásokhoz.
A személyes intelligencia nem éppen új keletű fogalom. Már januárban bevezette a Google ezt a funkciót, amely lehetővé tette a Gemininek, hogy személyes lekérdezéseket kezeljen olyan alkalmazásokon keresztül, mint a Gmail és a Fotók. A bevezetéskor a Google megjegyezte, hogy ezek az alkalmazáskapcsolatok alapból le vannak tiltva, és a felhasználók módosíthatják a beállításokat, megszakíthatják a kapcsolatokat, vagy törölhetik a csevegési előzményeket.
Továbbra is kérdéses: hányan lesznek hajlandók ténylegesen fizetni azért, hogy összekapcsolják a Fotókat a képgeneráláshoz – és az átlagfelhasználók számára elég egyértelműek lesznek-e a forrásvezérlők? Ha az eszköz rossz családtagot választ ki, vagy egy privát fotót húz be egy promptba, az a kényelemérv gyorsan szertefoszlik.
A Google arra fogad, hogy a képgeneráló modell személyre szabása segít majd a Gemininek kitűnni az általános chatbotok közül, és valami olyanná válni, ami az egyének életéhez igazodik. A felhasználók azonban egy egyszerűbb döntés előtt állnak: választanak az élesebb, személyre szabottabb képek és aközött, hogy több fiókkontextust tartsanak távol a mesterséges intelligenciától.