AI UniverzitaYouTube8 min22. listopadu 2025

Gemini 3 Pro Image (Nano Banana Pro): co přináší nový model pro generování grafiky

Původní název videa

PROFI grafika za 30 sekund! (Nano Banana Pro)

Executive Summary

Video představuje Nano Banana Pro, tedy Gemini 3 Pro Image – nový model pro generování a úpravu obrázků s podporou reasoningu. Oproti předchůdci zvládá výstupy až ve 4K, práci s až 14 referenčními obrázky, konzistenci až pěti postav a výrazně lepší generování textu v obrazech. Model je dostupný přes placenou verzi Gemini (záložka Thinking) i přes AI Studio s připojenou kartou.

6Klíčové body

1
Reasoning jako základ: model si před finálním výstupem generuje interní 'myšlenkové obrázky', které mu pomáhají doladit kompozici – uživateli se neúčtují a výrazně zlepšují výsledek.
2
Rozlišení až 4K: starý model uměl maximálně 1024×1024, nový umožňuje volbu mezi 1K, 2K a 4K výstupem.
3
Až 14 referenčních obrázků a konzistence 5 postav a 6 objektů: oproti předchůdci, který zvládal zhruba 3–5 snímků a jednu postavu dobře.
4
Generování textu v obrazech: ostrý, čitelný, stylizovaný text, podpora fontů z brand manuálu, překlad textu uvnitř existujícího obrázku pro mezinárodní kampaně.
5
Cena: přes API 30 USD za milion tokenů, jeden obrázek v 1K/2K vyjde na cca 3–4 centy, ve 4K na cca 6 centů. Uživatelé placeného Gemini (AI Plus) mají výrazně vyšší kvóty.
6
Přístup: v aplikaci Gemini přes záložku Thinking (placený tarif), dále v Google Slides, Docs, NotebookLM a přes AI Studio nebo Vertex s připojenou platební kartou.

Zeptat se AIClaude Haiku 4.5

Zeptej se na cokoliv z obsahu videa.
Např. „Co je hlavní know-how, které autor ukazuje?"

Historie chatu se neukládá. Po opuštění stránky bude smazána.

Celý článek

Nano Banana Pro je marketingový název pro Gemini 3 Pro Image – nový model Googlu pro generování a editaci obrázků. Oproti předchůdci Nano Banana 1 (Gemini 2.5 Flash Image), který byl optimalizovaný na rychlost a neformální kreativitu, je tato verze navržená pro profesionální produkci. Klíčový rozdíl je integrace reasoningu, díky které model lépe zpracovává složitější instrukce a dokáže zvládnout více změn najednou.

Prakticky to znamená, že když chcete třeba odebrat jednu osobu z fotografie více lidí a přeskupit zbytek, starý model to nezvládl v jednom kroku – nový ano. Reasoning funguje tak, že model si před finálním výstupem interně vygeneruje několik tzv. myšlenkových obrázků, které mu pomáhají doladit kompozici. Uživateli se tyto mezikroky neúčtují, jsou čistě interní součástí procesu.

Velikost výstupu je dalším výrazným posunem. Starý model generoval maximálně 1024×1024 pixelů. Nano Banana Pro umožňuje výstup v 1K, 2K nebo 4K rozlišení. Zároveň model výrazně lépe pracuje s konzistencí – zvládá až 14 referenčních obrázků na vstupu (přes API přesněji 12–14 podle způsobu přístupu), dokáže udržet konzistenci až pěti různých postav a šesti objektů napříč těmito obrázky. To je zásadní pro brand kampaně nebo jakoukoliv sériovou vizuální produkci.

Další silná stránka je generování textu uvnitř obrázků. Model zvládne ostrý, čitelný, stylizovaný text, umí pracovat s fonty z brand manuálu a dokáže přeložit text uvnitř existujícího obrázku – například pro lokalizaci reklamních materiálů do různých jazyků. Díky propojení s Google Search dokáže ověřovat fakta, což se hodí při tvorbě infografik nebo historicky zasazených scén.

Co se týká dostupnosti a ceny: v aplikaci Gemini je model k dispozici pod záložkou Thinking pro placené uživatele (tarify Gemini Pro nebo Ultra). Funguje také v Google Slides, Docs a NotebookLM. Pro vývojáře je přístupný přes AI Studio nebo Vertex, ale na rozdíl od staré verze (která je v AI Studiu stále zdarma) vyžaduje Nano Banana Pro připojenou platební kartu. Cena přes API je 30 USD za milion tokenů – v praxi jedno 1K/2K rozlišení vyjde na přibližně 3–4 centy, 4K výstup na zhruba 6 centů. Bezplatní uživatelé mají omezené kvóty a po jejich vyčerpání se model automaticky přepíná na starší verzi.

Všechny vygenerované obrázky jsou opatřeny neviditelným digitálním vodoznakem. Generování je dostupné pouze uživatelům starším 18 let. Autor videa hodnotí model jako výrazný posun oproti předchůdci a doporučuje ho vyzkoušet zejména na loga, infografiky a brand materiály.

6Klíčové body

Reasoning jako základ: model si před finálním výstupem generuje interní 'myšlenkové obrázky', které mu pomáhají doladit kompozici – uživateli se neúčtují a výrazně zlepšují výsledek.

Rozlišení až 4K: starý model uměl maximálně 1024×1024, nový umožňuje volbu mezi 1K, 2K a 4K výstupem.

Až 14 referenčních obrázků a konzistence 5 postav a 6 objektů: oproti předchůdci, který zvládal zhruba 3–5 snímků a jednu postavu dobře.

Generování textu v obrazech: ostrý, čitelný, stylizovaný text, podpora fontů z brand manuálu, překlad textu uvnitř existujícího obrázku pro mezinárodní kampaně.

Cena: přes API 30 USD za milion tokenů, jeden obrázek v 1K/2K vyjde na cca 3–4 centy, ve 4K na cca 6 centů. Uživatelé placeného Gemini (AI Plus) mají výrazně vyšší kvóty.

Přístup: v aplikaci Gemini přes záložku Thinking (placený tarif), dále v Google Slides, Docs, NotebookLM a přes AI Studio nebo Vertex s připojenou platební kartou.

Celý článek