Meta memperkenalkan Emu Edit dan Emu Video: alat AI untuk mengedit gambar dan video
Melihat booming kecerdasan buatan (AI), Meta Platforms telah melakukan upaya untuk memasukkan teknologi ini ke dalam rangkaian produknya, dan penawaran terbarunya mencakup editor gambar bertenaga AI, serta generator video. Produk-produk ini mengikuti peluncuran chatbot AI multi-persona yang disebut AI Personas yang diluncurkan pertama kali oleh perusahaan pada acara Connect 2023 bulan lalu. Perusahaan juga mengumumkan Emu, model dasar pertamanya untuk menghasilkan gambar. Alat AI baru yang diumumkan oleh Meta didasarkan pada model yang sama. Inilah yang kami ketahui tentang hal itu.
Alat meta AI
Dalam postingan blog, Meta mengumumkan dua alat AI baru – Emu Video, dan Emu Edit, dan keduanya didasarkan pada model dasar Emu.
1. Edit Emu – Alat ini adalah editor gambar bertenaga AI yang menjanjikan untuk menyederhanakan tugas manipulasi gambar dan memperkenalkan pengeditan gambar yang presisi. Perusahaan mengklaim mereka akan mampu “mengubah gambar secara tepat berdasarkan input teks.” Melalui Emu Edit, pengguna dapat melakukan berbagai tugas seperti pengeditan lokal dan global, menghapus dan menambahkan latar belakang, transformasi warna dan geometri, deteksi dan segmentasi, dan banyak lagi. Untuk melatih model AI, Meta menggunakan 10 juta sampel yang disintesis, termasuk gambar masukan, perintah, dan hasil keluaran.
Meta berkata, “Dalam evaluasi kami, Emu Edit menunjukkan kinerja yang lebih unggul dibandingkan metode saat ini, menghasilkan hasil baru yang canggih baik dalam evaluasi kualitatif dan kuantitatif untuk berbagai tugas pengeditan gambar.”
2. Video Emu – Emu Video menawarkan kemampuan pembuatan teks-ke-video berdasarkan model difusi. Menurut Meta, alat ini menawarkan beberapa opsi masukan – hanya teks, hanya gambar, dan teks serta gambar. Pembuatan video memerlukan pendekatan terpisah. Pertama, gambar dihasilkan berdasarkan petunjuk teks. Kemudian, Emu Video menghasilkan video berdasarkan gambar yang dibuat sebelumnya serta perintah teks. Alat ini menggunakan dua model difusi untuk menghasilkan video berdurasi empat detik 512×512 dengan kecepatan 16 frame per detik.
Meta mengatakan kedua alat tersebut berpotensi memungkinkan pengguna tanpa keahlian teknis untuk menghasilkan dan mengedit foto dan video. “Meskipun tidak ada pengganti bagi seniman dan animator profesional, Emu Video, Emu Edit, dan teknologi baru seperti mereka dapat membantu orang mengekspresikan diri mereka dengan cara baru—mulai dari direktur seni yang membuat konsep baru atau pencipta yang menghidupkan film terbaru mereka hingga sahabat berbagi ucapan selamat ulang tahun yang unik”, kata perusahaan itu.