GPT-4o & Imej: Gelombang Kedua ‘ChatGPT’ Dah Mula

Ingat lagi tak masa ChatGPT mula-mula keluar dulu tahun 2022? Riuh satu dunia kan? Rasa macam magic bila AI boleh sembang dengan kita, tulis macam-macam. Ramai kata itu “ChatGPT Gelombang” pertama.
Nah, sekarang ni… brace yourself. Ada yang kata “ChatGPT Gelombang” kedua dah tiba, dan kali ni, ia mungkin lagi besar impaknya.
Apa Maksud ‘Native Image Generation’?
OpenAI baru je umum update terbaru untuk model AI dorang, nama dia GPT-4o. Apa yang power sangat pasal GPT-4o ni? Jawapannya: dia sekarang boleh generate gambar secara native.
Kejap, kejap. “Native” tu apa pulak? Maksudnya, model AI tu sendiri yang ‘lukis’ gambar tu, bukan macam dulu dia macam ‘pass’ kerja kat tool lain (macam DALL-E) untuk buat gambar. Sekarang, kebolehan melukis tu dah sebati dalam ‘otak’ GPT-4o tu sendiri.
Kenapa ini penting sangat? Sebab ini buka pintu kepada macam-macam benda power yang kita tak terfikir sebelum ni!
Apa Benda Power Yang GPT-4o Boleh Buat Dengan Gambar?
Okay, kalau setakat cakap memang tak nampak best. Jom tengok contoh apa yang dia boleh buat:
- Tukar Style Gambar Ikut Suka Hati: Nak tukar jadi style anime Jepun Ghibli? Nak jadi style kartun Disney? Boleh! Yang bestnya, semua detail asal macam posisi badan, warna, ekspresi muka, dia cuba kekalkan (mungkin bukan 100% sama). Bukan main tangkap muat je. Contoh: Tukar gambar ini kepada gaya Studio Ghibli

- Action Figure Style: Selain style Ghibli yang viral tu, style real life action figure ni juga antara yang popular. Prompt: raw a picture of me as a real-life action figure of me. Be as specific as possible based on google ad specialist, and put multiple interesting things that represent google ads professional who he is inside the packaging.

- Tukar pakaian model: Untuk korang yang biat bisnes fesyen mesti suka ni! Just masukkan model dan pakaian yang korang nak model tu pakai. Prompt: Let the model wear the red dress

- Hidupkan Lukisan: Ada lukisan conteng-conteng? Bagi kat GPT-4o, dia boleh ‘hidupkan’ lukisan tu jadi imej yang nampak realistik atau ikut style yang korang nak.

- Mewarnakan Gambar: Pernah terfikir nak tengok gambar lama yang hitam putih tu jadi berwarna? Ini pun boleh.

- Letak Teks Cantik Gambar & Sebagai Iklan: Benda ni nampak senang, tapi sebenarnya susah gila untuk AI sebelum ni. Nak letak teks dalam gambar selalunya jadi herot-berot atau tak lawa dan jadikan sebagai iklan produk korang. GPT-4o dah makin pandai buat benda ni.

- Jadikan gambar kartun kepada orang sebenar: Ini lagi best dan ramai yang suka guna. Letak simple prompt untuk transformkan kartun ke, anime ke, GPT-4o boleh generate ‘real people’ tu terus! Prompt: Turn the image into photorealism

Dan banyak lagi korang boleh explore di luar sana. Untuk generate image selain di website ChatGPT korang juga boleh generate di website Sora.com, untuk free user hanya 3 kali generations sahaja sehari.

Pendek kata, macam-macam benda yang dulu perlukan skill design atau software mahal, sekarang boleh jadi semudah menaip arahan (prompt).
Okay, Tapi Kan AI Lukis Gambar Dah Lama Ada? Apa Bezanya?
Betul tu. Kita dah ada MidJourney, DALL-E, Stable Diffusion dah bertahun. Tapi, kebanyakannya guna teknik nama dia Diffusion. Secara mudah, teknik ni macam start dengan gambar ‘noise’ (macam TV takde signal), lepas tu sikit-sikit dia ‘bersihkan’ noise tu sampai jadi gambar berdasarkan prompt kita. Power memang power, tapi kadang-kadang dia susah sikit nak faham arahan yang kompleks atau nak gabungkan banyak elemen dengan tepat.
GPT-4o pulak guna pendekatan lain, dipanggil Autoregressive. Cara ni lebih kurang macam mana ChatGPT generate teks – dia ‘predict’ perkataan seterusnya berdasarkan perkataan sebelumnya. Untuk gambar, dia ‘predict’ pixel seterusnya berdasarkan pixel sebelumnya dan prompt kita.
Yang paling penting, GPT-4o ni multimodal sejati. Maksudnya, ‘otak’ dia tu boleh proses dan faham teks, gambar, audio, semua sekali dalam satu model. Dia tak tengok gambar dan teks sebagai benda asing. Bagi dia, konsep ‘anjing’ tu sama je, tak kira korang sebut perkataan “anjing” atau tunjuk gambar anjing. Bila AI dah ‘faham’ macam ni, dia jadi super pandai ikut arahan yang gabungkan teks dan imej, atau ubah suai imej berdasarkan input yang kompleks.
Senang cerita:
- Model Lama (Diffusion): Pandai buat gambar cantik, tapi macam ‘ikut arahan secara kasar’.
- GPT-4o (Autoregressive + Multimodal): Bukan setakat buat gambar cantik, tapi dia betul-betul ‘faham’ konteks dan arahan detail. Macam ada designer peribadi yang super pantas.
Jadi, Apa Kesannya Kat Kita Semua? Siapa Yang Terasa Bahangnya?
Okay, ini bahagian yang serius sikit.
- Startup AI Gambar/Video: Platform macam MidJourney, Runway, Pika yang fokus kat image generation guna teknik lama mungkin kena goyang sikit. Kelebihan dorang pada kualiti visual mungkin dah tak cukup kuat bila GPT-4o datang dengan ‘kepandaian’ multimodal ni. Nak lawan? Kena ada model multimodal sendiri, yang mana kosnya… fuh, berjuta-juta dolar! Mungkin kita akan nampak startup ni kena pivot (ubah haluan) atau kena acquire (beli) oleh syarikat besar macam OpenAI atau Google.
- Pekerja Kreatif (Designer, Artis, Marketer, Freelancer): Haa, ini yang paling terasa. Kerja-kerja yang dulunya perlukan skill khusus, masa berjam-jam atau berhari-hari, dan software macam Photoshop atau Figma, sekarang dah boleh dibuat dengan prompt dalam beberapa saat atau minit je.
Adakah ini bermakna kerja korang akan hilang? Jawapannya kompleks. Tidak semestinya hilang, tapi PASTI akan berubah.
Kalau dulu ChatGPT ubah cara kita berinteraksi dengan teks, GPT-4o dengan kebolehan imej native ni berpotensi mengubah industri visual secara besar-besaran. Ia secara langsung ‘makan’ workflow kerja kreatif yang bernilai tinggi.
- Prototaip UI/UX mungkin tak perlu tool macam Figma dah.
- Team marketing mungkin jadi lebih kecil.
- Agensi pengiklanan mungkin kena fikir semula model bisnes.
Kesimpulan: Nak Takut Ke Nak Excited?
Dua-dua pun boleh! Memang patut rasa risau kalau kerja korang dalam bidang yang terkesan. Tapi, sejarah dah tunjuk, teknologi tak pernah tunggu sesiapa. Pasaran tak peduli perasaan kita.
Yang penting sekarang, jangan panik dan jangan buat tak tahu. Kena cepat belajar, cepat adaptasi. Jadikan AI ni tool untuk tingkatkan lagi skill dan kreativiti korang.
Ini baru permulaan. GPT-4o dengan kebolehan imej ni baru tip of the iceberg. Kita mungkin akan tengok lebih banyak lagi benda awesome (dan mungkin menakutkan) dalam masa terdekat.
Jadi, bersedialah. “ChatGPT Gelombang” kedua dah ada kat sini, dan ia melibatkan gambar!
