»Strašljivo pametna« umetna inteligenca

Pripravite se na tehnološki vrtiljak, ki ga je prinesel marec! Ta mesec je bil za ljubitelje umetne inteligence prava poslastica, polna presenečenj in inovacij. Poglejmo, kaj vse se je zgodilo.

Objavljeno:

sreda, 2. April, 2025

Luka Tišler Luka Tišler, samostojni ustvarjalec vizualnih vsebin z umetno inteligenco in svetovalec

Foto
Črt Piksi

Grok 3: Novi možgani v mestu

Elon Musk je s svojo ekipo pri xAI predstavil Grok 3, najnovejši model umetne inteligence, ki obljublja, da bo »strašljivo pameten«. Grok 3 je bil treniran na superračunalniku z 10-krat večjo računsko močjo kot njegovi predhodniki, kar mu omogoča izjemne sposobnosti v matematiki, znanosti in programiranju.

Gemini 2.0 Flash: Hitrost sreča zmogljivost

Google ni ostal zadaj in je predstavil Gemini 2.0 Flash, najnovejši model v družini Gemini. Ta model je zasnovan za hitre in vsakodnevne naloge, hkrati pa prinaša izboljšano zmogljivost in podporo za multimodalne vnose. Z njim lahko uporabniki vnesejo avdio, slike, video in besedilo ter prejmejo besedilne ali slikovne odgovore. Dostopen je preko Google AI Studio in je trenutno popolnoma brezplačen.

Model Context Protocol (MCP): Standardizacija komunikacije med modeli

Anthropic je uvedel Model Context Protocol (MCP), odprti standard, ki omogoča enostavno povezovanje AI asistentov z različnimi podatkovnimi viri in orodji. MCP deluje kot »USB-C priključek« za UI-aplikacije, saj standardizira način, kako modeli pridobivajo kontekst iz zunanjih virov. Eden od privlačnejših primerov je povezava med Claude MCP in Blenderjem (3D program), s katero nam MCP na podlagi ene slike ustvari vrhunsko 3D-sceno.

Reve: Nov slikovni model za uredniške vizualije

Reve je nov slikovni model, ki je v prvih tednih navdušil predvsem fotografe in vizualne ustvarjalce. Odlikujeta ga nadpovprečna kakovost pri editorial fotografijah in zelo dobro razumevanje ukazov. Močan je pri kompoziciji, atmosferi in detajlih, nekoliko manj pa pri stilizaciji, kjer mu manjka ustvarjalne svobode. Ključna prednost? Trenutno je še brezplačen, kar ga naredi idealnega za testiranje in igranje.

Runway Gen-4: Revolucija v generiranju videoposnetkov

Ko smo že vsi malo obupali nad podpovprečnimi kreacijami Gen3, je Runway objavil Gen-4 – nov video model, ki se je po prvih testih znova zavihtel na čelo tekme. Razumevanje ukazov je vrhunsko, kakovost slike ostaja konsistentna skozi celoten posnetek, model pa preseneti tudi z izvrstnim razumevanjem fizike gibanja in interakcij med objekti. Gen-4 trenutno vodi dirko na vseh frontah: od vizualne estetike do narativne zanesljivosti.

ChatGPT in Sora Images: Prava mala revolucija v ustvarjanju slik

Nova funkcija v ChatGPT omogoča generiranje, urejanje in stilizacijo slik neposredno znotraj pogovora. Model GPT-4o zdaj konkurira vodilnim platformam, kot so Midjourney, Leonardo in Ideogram. Uporabniki lahko preprosto naložijo sliko, jo preuredijo z besedilnim ukazom (npr. »naredi bolj barvito«), odstranijo ozadje ali uporabijo poljuben vizualni slog. Na voljo je tudi prenos sloga iz ene slike na drugo, združevanje dveh slik v eno, generiranje likov v slogih, kot so Minecraft, GTA 5 ali South Park, pa celo ustvarjanje infografik in animiranih 3D-modelov. Glavna prednost? Vse to brez znanja modulov ComfyUI, ControlNet ali Lora. Gre za intuitiven, pogovoren vmesnik, ki se obnaša kot oblikovalski partner z umetniško intuicijo. Funkcija je trenutno dostopna v plačljivih paketih (Plus in Pro), brezplačna različica pa je bila zaradi preobremenjenosti strežnikov za zdaj odložena.

Pred povsem novo sezono

Marec je torej prinesel obilico inovacij in presenečenj na področju umetne inteligence in vizualne ustvarjalnosti. In čeprav smo stavek »igra se je spremenila« že slišali, je zdaj prvič videti, kot da se res začne povsem nova sezona.

VIR: MM

Dolžina:	2 minutno branje
Objavljeno:	02. Apr. 2025