Apakah pembuat video AI memimpikan San Pedro? Madonna merupakan salah satu pengguna awal gelombang AI berikutnya

Apakah pembuat video AI memimpikan San Pedro?  Madonna merupakan salah satu pengguna awal gelombang AI berikutnya

Road.co.id

Setiap kali Madonna menyanyikan lagu hit tahun 1980-an “La Isla Bonita” dalam tur konsernya, gambar bergerak awan berwarna matahari terbenam diputar di layar arena raksasa di belakangnya.

Untuk mendapatkan tampilan halus itu, legenda pop ini menggunakan cabang kecerdasan buatan generatif yang masih belum dipetakan – alat teks-ke-video. Ketikkan beberapa kata — misalnya, “awan matahari terbenam yang nyata” atau “air terjun di hutan saat fajar” — dan video instan akan dibuat.

Mengikuti jejak AI chatbots dan pembuat gambar diam, beberapa penggemar video AI mengatakan bahwa teknologi yang muncul suatu hari nanti dapat meningkatkan hiburan, memungkinkan Anda memilih film Anda sendiri dengan alur cerita dan akhir yang dapat disesuaikan. Namun masih banyak jalan yang harus ditempuh sebelum mereka dapat melakukan hal tersebut, dan masih banyak lagi kendala etika yang akan terjadi.

Bagi pengguna awal seperti Madonna, yang sudah lama mendobrak batas-batas seni, ini lebih merupakan eksperimen. Dia memperbaiki visual konser “La Isla Bonita” versi sebelumnya yang menggunakan grafik komputer yang lebih konvensional untuk membangkitkan suasana tropis.

“Kami mencoba CGI. Itu terlihat sangat hambar dan murahan dan dia tidak menyukainya,” kata Sasha Kasiuha, direktur konten Tur Perayaan Madonna yang berlanjut hingga akhir April. “Dan kemudian kami memutuskan untuk mencoba AI.”

Pembuat ChatGPT, OpenAI, memberikan gambaran sekilas tentang seperti apa teknologi teks-ke-video yang canggih ketika perusahaan tersebut baru-baru ini memamerkan Sora, sebuah alat baru yang belum tersedia untuk umum. Tim Madonna mencoba produk berbeda dari startup Runway yang berbasis di New York, yang membantu memelopori teknologi ini dengan merilis model text-to-video publik pertamanya pada bulan Maret lalu. Perusahaan ini merilis versi “Gen-2” yang lebih canggih pada bulan Juni.

CEO Runway Cristóbal Valenzuela mengatakan meskipun beberapa orang melihat alat ini sebagai “perangkat ajaib yang memungkinkan Anda mengetikkan sebuah kata dan entah bagaimana alat tersebut memunculkan apa yang ada di kepala Anda,” pendekatan yang paling efektif adalah oleh para profesional kreatif yang mencari peningkatan ke perangkat yang sudah berusia puluhan tahun. perangkat lunak pengeditan digital yang sudah mereka gunakan.

Dia mengatakan Runway belum bisa membuat film dokumenter berdurasi penuh. Tapi itu bisa membantu mengisi beberapa video latar belakang, atau b-roll — gambar dan adegan pendukung yang membantu menceritakan kisahnya.

“Itu mungkin menghemat waktu kerja selama seminggu,” kata Valenzuela. “Benang umum dari banyak kasus penggunaan adalah orang-orang menggunakannya sebagai cara untuk menambah atau mempercepat sesuatu yang bisa mereka lakukan sebelumnya.”

Target pelanggan Runway adalah “perusahaan streaming besar, perusahaan produksi, perusahaan pasca produksi, perusahaan efek visual, tim pemasaran, perusahaan periklanan. Banyak orang yang membuat konten untuk mencari nafkah,” kata Valenzuela.

Bahaya menunggu. Tanpa perlindungan yang efektif, pembuat video AI dapat mengancam negara-negara demokrasi dengan video “deepfake” yang meyakinkan tentang hal-hal yang tidak pernah terjadi, atau – seperti yang terjadi pada pembuat gambar AI – membanjiri internet dengan adegan pornografi palsu yang menggambarkan orang-orang yang tampak nyata. wajah-wajah yang bisa dikenali. Di bawah tekanan dari regulator, perusahaan teknologi besar telah berjanji untuk memberi tanda air pada keluaran yang dihasilkan AI untuk membantu mengidentifikasi apa yang sebenarnya.

Terdapat juga perselisihan hak cipta mengenai koleksi video dan gambar yang menjadi dasar pelatihan sistem AI (baik Runway maupun OpenAI tidak mengungkapkan sumber datanya) dan sejauh mana mereka mereplikasi karya bermerek dagang secara tidak adil. Dan ada kekhawatiran bahwa, pada suatu saat, mesin pembuat video dapat menggantikan pekerjaan manusia dan seni.

Untuk saat ini, klip video terpanjang yang dihasilkan AI masih diukur dalam hitungan detik, dan dapat menampilkan gerakan tersentak-sentak serta gangguan seperti tangan dan jari yang terdistorsi. Memperbaiki hal tersebut “hanyalah persoalan mengenai lebih banyak data dan lebih banyak pelatihan,” dan kekuatan komputasi yang menjadi sandaran pelatihan tersebut, kata Alexander Waibel, seorang profesor ilmu komputer di Universitas Carnegie Mellon yang telah meneliti AI sejak tahun 1970an.

“Sekarang saya bisa berkata, 'Buatkan saya video seekor kelinci berpakaian seperti Napoleon berjalan melintasi Kota New York,'” kata Waibel. “Ia mengetahui seperti apa rupa Kota New York, seperti apa rupa kelinci, seperti apa rupa Napoleon.”

Hal ini mengesankan, katanya, namun masih jauh dari menciptakan alur cerita yang menarik.

Sebelum merilis model generasi pertamanya tahun lalu, klaim Runway atas ketenaran AI adalah sebagai salah satu pengembang generator gambar Stable Diffusion. Perusahaan lain, Stability AI yang berbasis di London, telah mengambil alih pengembangan Stable Diffusion.

Teknologi “model difusi” yang mendasari sebagian besar generator AI untuk gambar dan video bekerja dengan memetakan noise, atau data acak, ke dalam gambar, secara efektif menghancurkan gambar asli dan kemudian memprediksi seperti apa gambar baru nantinya. Ia meminjam ide dari fisika yang dapat digunakan untuk menggambarkan, misalnya, bagaimana gas berdifusi keluar.

“Yang dilakukan model difusi adalah membalikkan proses tersebut,” kata Phillip Isola, profesor ilmu komputer di Massachusetts Institute of Technology. “Mereka mengambil keacakan dan menyatukannya kembali ke dalam volume. Begitulah cara beralih dari keacakan ke konten. Dan begitulah cara Anda membuat video acak.”

Menghasilkan video lebih rumit daripada gambar diam karena perlu memperhitungkan dinamika temporal, atau bagaimana elemen dalam video berubah seiring waktu dan melintasi rangkaian bingkai, kata Daniela Rus, profesor MIT lainnya yang memimpin Laboratorium Ilmu Komputer dan Kecerdasan Buatan.

Rus mengatakan sumber daya komputasi yang dibutuhkan “jauh lebih tinggi dibandingkan untuk menghasilkan gambar diam” karena “ini melibatkan pemrosesan dan menghasilkan banyak frame untuk setiap detik video.”

Hal ini tidak menghentikan beberapa perusahaan teknologi terkemuka untuk mencoba terus mengungguli satu sama lain dalam memamerkan generasi video AI berkualitas lebih tinggi dalam durasi yang lebih lama. Membutuhkan deskripsi tertulis untuk membuat sebuah gambar hanyalah permulaan. Google baru-baru ini mendemonstrasikan proyek baru bernama Genie yang dapat diminta untuk mengubah foto atau bahkan sketsa menjadi “berbagai macam” dunia video game yang dapat dijelajahi.

Dalam waktu dekat, video yang dihasilkan AI kemungkinan akan muncul dalam konten pemasaran dan pendidikan, memberikan alternatif yang lebih murah dibandingkan memproduksi rekaman asli atau mendapatkan stok video, kata Aditi Singh, peneliti di Cleveland State University yang telah melakukan survei text-to- pasar video.

Saat Madonna pertama kali berbicara dengan timnya tentang AI, “niat utamanya bukanlah, 'Oh, lihat, ini adalah video AI,'” kata Kasiuha, direktur kreatif.

“Dia bertanya kepada saya, 'Bisakah Anda menggunakan salah satu alat AI tersebut untuk membuat gambar lebih tajam, untuk memastikan gambar terlihat terkini dan terlihat beresolusi tinggi?'” Kata Kasiuha. “Dia senang jika Anda menghadirkan teknologi baru dan elemen visual jenis baru.”

Film berdurasi panjang yang dihasilkan AI sudah dibuat. Runway mengadakan festival film AI tahunan untuk memamerkan karya-karya tersebut. Namun apakah itu yang akan dipilih oleh penonton manusia masih harus dilihat.

“Saya masih percaya pada manusia,” kata Waibel, profesor CMU. “Saya masih percaya bahwa ini akan menjadi sebuah simbiosis di mana Anda mendapatkan AI mengusulkan sesuatu dan manusia memperbaiki atau membimbingnya. Atau manusia akan melakukannya dan AI akan memperbaikinya.”

Jurnalis Associated Press Joseph B. Frederick berkontribusi pada laporan ini.

Baca juga berita utama lainnya hari ini:

Carl Pei yang dipimpin Nothing akan meluncurkan smartphone kelas menengahnya, Nothing Phone 2a, di India pada tanggal 5 Maret! Beberapa detail menarik di artikel ini. Lihat disini

Moto menggoda desain dan fitur AI-nya dan mengatakan peluncuran Motorola X50 Ultra akan segera terjadi. Disebut-sebut bisa menyaingi Samsung Galaxy S24. Beberapa detail menarik di artikel ini. Lihat disini.

AS vs Tiongkok! AS sedang mengevaluasi kembali kebijakan perlindungan data di tengah kekhawatiran terhadap teknologi Tiongkok, dengan fokus pada risiko AI. Tindakan baru-baru ini yang dilakukan Presiden Biden bertujuan untuk membatasi aliran data sensitif ke luar negeri untuk mencegah spionase dan pemerasan. Baca semuanya di sini.

Satu hal lagi! Kami sekarang ada di Saluran WhatsApp! Ikuti kami di sana agar Anda tidak ketinggalan update apa pun dari dunia teknologi. ‎Untuk mengikuti saluran HT Tech di WhatsApp, klik Di Sini untuk bergabung sekarang!

You might also like