Google Imagen menggunakan AI untuk mengambar melalui text

Google kembali membuat heboh dengan terobosan inovasi nya yang terbaru dalam pembuatan model Artificial Intelligence yaitu Imagen. Apa itu Imagen? Imagen merupakan sebuah model Artificial Intelligence (AI) yang dapat merubah tulisan menjadi gambar yang realistis. Proses perubahan tersebut diawali dengan merubah text menjadi gambar lalu resolusi gambar tersebut ditinggikan secara bertahap, berikut merupakan visualisasi dan penjelasan dari proses tersebut:

Pertama, kalimat yang di input oleh user akan di proses melalui Frozen Text Encoder. Dalam Frozen Text Encoder, setiap kata yang ada di kalimat tersebut akan diberikan nilai untuk dapat dimengerti oleh komputer. Kalimat yang telah di berikan nilai pun akan di proses dalam Text-To-Image Diffusion Model dan Super Resolution Diffusion Model.

Kedua, dalam Text-To-Image Diffusion Model, kalimat yang telah di beri nilai/label akan direalisasikan menjadi gambar oleh A.I model yang berasal dari Imagen. Tetapi, gambar yang di hasilkan dari model A.I tersebut merupakan gambar yang bersolusi rendah yaitu 64 x 64 px. Sehingga resolusi dari gambar tersebut di tinggikan melalui Super-Resolution Diffusion Model. Dalam model ini, gambar yang awalnya punya resolusi 64 x 64 px menjadi 256 x 256 px lalu 1024 x 1024 px. 

Tentunya terobosan baru ini akan mempunyai dampak yang besar dalam pembuatan karya seni. Salah satu contoh dampak positif adalah untuk memudahkan orang untuk mendapatkan gambar yang sesuai imajinasinya tanpa perlu mempunyai kemampuan dalam berseni. Saat ini, pengelolaan teknologi ini masih dalam masa pertumbuhan. Sehingga, perkembangan teknologi ini terlihat menjanjikan dalam pengaplikasian teknologi untuk karya seni.

DAFTAR PUSTAKA


  • Penulis: Diven Clementius
  • Editor: Fisalma Maradita, M. Ihsan Rafi