»Strašljivo pametna« umetna inteligenca
Pripravite se na tehnološki vrtiljak, ki ga je prinesel marec! Ta mesec je bil za ljubitelje umetne inteligence prava poslastica, polna presenečenj in inovacij. Poglejmo, kaj vse se je zgodilo.
Objavljeno:
sreda, 2. April, 2025
Luka Tišler Luka Tišler, samostojni ustvarjalec vizualnih vsebin z umetno inteligenco in svetovalec
Foto
Črt Piksi
Elon Musk je s svojo ekipo pri xAI predstavil Grok 3, najnovejši model umetne inteligence, ki obljublja, da bo »strašljivo pameten«. Grok 3 je bil treniran na superračunalniku z 10-krat večjo računsko močjo kot njegovi predhodniki, kar mu omogoča izjemne sposobnosti v matematiki, znanosti in programiranju.
Google ni ostal zadaj in je predstavil Gemini 2.0 Flash, najnovejši model v družini Gemini. Ta model je zasnovan za hitre in vsakodnevne naloge, hkrati pa prinaša izboljšano zmogljivost in podporo za multimodalne vnose. Z njim lahko uporabniki vnesejo avdio, slike, video in besedilo ter prejmejo besedilne ali slikovne odgovore. Dostopen je preko Google AI Studio in je trenutno popolnoma brezplačen.
Anthropic je uvedel Model Context Protocol (MCP), odprti standard, ki omogoča enostavno povezovanje AI asistentov z različnimi podatkovnimi viri in orodji. MCP deluje kot »USB-C priključek« za UI-aplikacije, saj standardizira način, kako modeli pridobivajo kontekst iz zunanjih virov. Eden od privlačnejših primerov je povezava med Claude MCP in Blenderjem (3D program), s katero nam MCP na podlagi ene slike ustvari vrhunsko 3D-sceno.
Reve je nov slikovni model, ki je v prvih tednih navdušil predvsem fotografe in vizualne ustvarjalce. Odlikujeta ga nadpovprečna kakovost pri editorial fotografijah in zelo dobro razumevanje ukazov. Močan je pri kompoziciji, atmosferi in detajlih, nekoliko manj pa pri stilizaciji, kjer mu manjka ustvarjalne svobode. Ključna prednost? Trenutno je še brezplačen, kar ga naredi idealnega za testiranje in igranje.
Ko smo že vsi malo obupali nad podpovprečnimi kreacijami Gen3, je Runway objavil Gen-4 – nov video model, ki se je po prvih testih znova zavihtel na čelo tekme. Razumevanje ukazov je vrhunsko, kakovost slike ostaja konsistentna skozi celoten posnetek, model pa preseneti tudi z izvrstnim razumevanjem fizike gibanja in interakcij med objekti. Gen-4 trenutno vodi dirko na vseh frontah: od vizualne estetike do narativne zanesljivosti.
Nova funkcija v ChatGPT omogoča generiranje, urejanje in stilizacijo slik neposredno znotraj pogovora. Model GPT-4o zdaj konkurira vodilnim platformam, kot so Midjourney, Leonardo in Ideogram. Uporabniki lahko preprosto naložijo sliko, jo preuredijo z besedilnim ukazom (npr. »naredi bolj barvito«), odstranijo ozadje ali uporabijo poljuben vizualni slog. Na voljo je tudi prenos sloga iz ene slike na drugo, združevanje dveh slik v eno, generiranje likov v slogih, kot so Minecraft, GTA 5 ali South Park, pa celo ustvarjanje infografik in animiranih 3D-modelov. Glavna prednost? Vse to brez znanja modulov ComfyUI, ControlNet ali Lora. Gre za intuitiven, pogovoren vmesnik, ki se obnaša kot oblikovalski partner z umetniško intuicijo. Funkcija je trenutno dostopna v plačljivih paketih (Plus in Pro), brezplačna različica pa je bila zaradi preobremenjenosti strežnikov za zdaj odložena.
Marec je torej prinesel obilico inovacij in presenečenj na področju umetne inteligence in vizualne ustvarjalnosti. In čeprav smo stavek »igra se je spremenila« že slišali, je zdaj prvič videti, kot da se res začne povsem nova sezona.
VIR: MM
Dolžina: | 2 minutno branje |
Objavljeno: | 02. Apr. 2025 |