/b/ - Uus avoin kuvamalli Imagen 4

>>

Anonyymi 06/08/26(Mon)13:09:24 No. 14318 >>14320 >>14327

File design_arena.png - ( 5000x2813, 905.45 KB PNG )

Tätä Ideogram 4 mallia pitäs varmaan kokeilla seuraavaksi. Jos sillä saisi vaikka hyviä mainosbannereita tehtyä.

>Ideogram 4 is Ideogram's first open-weight text-to-image model. It is a state-of-the-art foundation model trained from scratch — not a fine-tune of any existing model. It introduces a new structured JSON prompting interface, with best-in-class multilingual text rendering, deep language understanding, explicit bounding-box layout and color-palette controls, and native 2k resolution images.

https://github.com/ideogram-oss/ideogram4

Replies: >>14320 >>14327

>>

Anonyymi 06/08/26(Mon)13:14:35 No. 14320

File reve-2-0.png - ( 1048x487, 72.81 KB PNG )

>>14318
Reve 2 pitäs kanssa olla ihan hyvä uusi tohon, mutta se on suljettu malli, niin...

>Every image is built from a layout: a structured map of the objects, text, and regions in a scene. That means you can reach in and change any part of it. Move a subject, rewrite the sign on the wall, or swap a background, and the rest of the scene adjusts around your edit. It’s the difference between describing a picture and directing one.
https://blog.reve.com/posts/announcing-reve-2.0/

>>

Anonyymi 06/08/26(Mon)13:16:32 No. 14321 >>14322

File ideogram-v4.png - ( 1065x771, 132.21 KB PNG )

Olis pitäny ottaa heti isompi ruutukaappaus, niin olis näkyny toi Ideogram 4.0 siinä kanssa, mikä on sijalla 9. text-to-image areenassa.
https://arena.ai/leaderboard/text-to-image

Replies: >>14322

>>

Anonyymi 06/08/26(Mon)13:25:03 No. 14322

>>14321
ottasitko vielä yhen kuvakaappauksen jossa näkyis ideogram 3.2.6 ja rave 1.6 ja image 3.6.0.9?

>>

Anonyymi 06/08/26(Mon)13:33:59 No. 14327

File ComfyUI_temp_hnsaa_00036_.png - ( 1024x1024, 2.62 MB PNG )

>>14318

>>

Anonyymi 06/08/26(Mon)16:40:54 No. 14352 >>14356

File image.png - ( 2048x2048, 9.86 MB PNG )

Tarkoitat varmaan Ideogram 4? Koska Imagen on suljettu malli.

Kokeilen uutta mallia yleensä tähän tyyliin
>a photo of a village in Iron Age Finland in summer
koska aiheesta ei varmasti ole koulutusaineistossa yhtään kuvaa niin testaa hyvin mallin maailmanymmärryksen tasoa. Melko hyvä lopputulos, parempi kuin mitä olen nähnyt millään avoimella mallilla.

Replies: >>14356

>>

Anonyymi 06/08/26(Mon)17:16:43 No. 14356

File ComfyUI_temp_hnsaa_00045_.png - ( 1024x1024, 2.75 MB PNG )

>>14352
juu se, muistin väärin nimen

vaatii paljon kikkailemista jsonin kanssa, noi mun kuvat kelpaa ehkä ComfyUissa workflowna, ellei tää foorumi ole rikkonut niitä. Sensuroitu todella pahasti, mutta sensuurin ohi voi kikkailla bounding boxien suurella määrällä, niiku oon tehny workflowssa

>>

Anonyymi 06/08/26(Mon)17:23:34 No. 14359

File HKMHOzUbEAATc0b.jpg - ( 1364x861, 146.23 KB JPG )

Miten hyvin se tekee tekstiä? Jos vaikka yrität tehdä jonkun mainosbannerin, missä on kuvia ja tekstiosia, niin onnistuuko semmonen kuinka hyvin?

Toihan on perinteisesti ollut hyvin haastava tekoälylle.

Name
Email
Subject
Message
File	Drop, paste, or click to select files
Embed

Password	(for post and file deletion if you lose your account)
Oekaki	Size: × px
File Options	Randomize filename Remove EXIF data
User	Show username

Ebinlauta

User

Boards

Friends