🆕 Digital Art Release: Stand With Palestine 💔 🇵🇸  – Lihat di sini

AI MusicLM: Buat Musik Otomatis Menggunakan Perintah Teks

Teksnologi

Google tengah mengembangkan teknologi AI yang dapat membuat musik secara otomatis hanya dengan menggunakan perintah berbasis teks (prompt).

Jika umumnya teknologi AI seperti ini digunakan untuk membuat gambar ilustrasi digital seperti Text to Image, namun konsep serupa juga bisa digunakan untuk menghasilkan musik yang unik dengan berbagai genre.

Sebagai contoh, kita ingin membuat sebuah musik untuk kebutuhan game arcade dengan beat yang cepat menggunakan instrumen gitar listrik di dalamnya.

Hanya dengan menggunakan perintah prompt berbasis teks berikut:

The main soundtrack of an arcade game. It is fast-paced and upbeat, with a catchy electric guitar riff. The music is repetitive and easy to remember, but with unexpected sounds, like cymbal crashes or drum rolls.

Maka dengan bantuan teknologi kecerdasan buatan, AI music generator tersebut akan dapat menghasilkan genre musik yang kiranya sesuai dengan perintah prompt tadi, seperti ini:

Selain instrumen musik, teknologi AI ini juga dapat menghasilkan suara vokal yang dapat menyesuaikan dengan genre musiknya.

Sebagai contoh, kita ingin membuat sebuah lagu ber-genre reggae dengan tempo lambat/santai. Lalu instrumen utama yang digunakan adalah drum dan gitar dengan paduan melodi dari gitar listrik.

Maka dengan mengetikkan perintah prompt berikut:

Slow tempo, bass-and-drums-led reggae song. Sustained electric guitar. High-pitched bongos with ringing tones. Vocals are relaxed with a laid-back feel, very expressive.

Akan bisa menghasilkan musik reggae dengan vokal seperti berikut:

Selain itu, MusicLM juga mampu menghasilkan musik dengan perintah berurutan. Kita bisa mengatur perintah prompt untuk mengubah musik berdasarkan durasi tertentu secara semantik. Kemampuan ini dinamakan dengan Story Mode.

Text Prompt:

  • time to meditate (0:00-0:15)
  • time to wake up (0:15-0:30)
  • time to run (0:30-0:45)
  • time to give 100% (0:45-0:60)

Hasilnya:

Selain itu, MusicLM juga dapat menghasilkan musik dengan durasi panjang hingga 5 menit lamanya:

Menariknya lagi, teknologi AI ini juga dapat menghasilkan musik berdasarkan gambar lukisan yang disertai dengan deskripsinya.

Judul lukisan dan pembuatnyaGambar lukisan (dari Wikipedia)Deskripsi lukisan
The Persistence of Memory- Salvador Dalí“His melting-clock imagery mocks the rigidity of chronometric time. The watches themselves look like soft cheese—indeed, by Dali s own account they were inspired by hallucinations after eating Camembert cheese. In the center of the picture, under one of the watches, is a distorted human face in profile. The ants on the plate represent decay.” By Gromley, Jessica. “The Persistence of Memory”. Encyclopedia Britannica, 14 Apr. 2022.

Hasilnya:

Bagaimana Teknologi AI Music Generator Ini Bekerja?

MusicLM telah dilatih menggunakan teknologi kecerdasan buatan (AI) dengan kumpulan dataset berupa 280.000 jam musik untuk mempelajari musik/lagu dengan berbagai deskripsi.

MusicLM bisa menghasilkan musik dengan frekuensi 24 kHz secara konsisten dalam beberapa menit.

Meskipun memang frekuensi ini masih tergolong rendah bila dibandingkan dengan perekaman high-definition audio (HD) seperti 48 kHz atau 96 kHz.

Google Belum Mau Merilis Teknologi Ini Untuk Publik

Saat ini MusicLM merupakan proyek eksperimen yang tengah dikembangkan oleh tim research internal Google.

Alasan kenapa Google belum mau merilis teknologi ini untuk umum adalah karena masih adanya potensi terkait pelanggaran hak cipta.

Karena dalam beberapa sample musik yang dihasilkan, ternyata masih ditemukan replikasi musik yang diambil dari lagu yang sudah pernah dirilis oleh musisi terkenal sebelumnya.

Namun untuk kebutuhan riset di masa depan, Google telah merilis MusicCaps ke publik, yaitu dataset yang terdiri dari sekitar 5,5 ribu pasangan (pair antara musik dan juga teks) dengan deskripsi teks yang disediakan oleh pakar (manusia).

Sekedar informasi, teknologi AI Music Generator buatan Google ini bukanlah yang pertama di dunia, karena sebelumnya sudah ada teknologi serupa seperti Riffusion, DanceDiffusion, Jukebox buatan OpenAI serta AudioLM yang juga proyek research Google sebelumnya.

Jika ingin mengetahui lebih lanjut, silahkan kunjungi halaman research berikut:

Follow:
Follow us on Instagram: @Teksnologi
Leave a comment

Leave a Reply

Your email address will not be published. Required fields are marked *