Adakah MusicLM Google Menepati Gembar-gembur?

Pembaca seperti anda membantu menyokong MUO. Apabila anda membuat pembelian menggunakan pautan di tapak kami, kami mungkin mendapat komisen ahli gabungan. Baca Lagi.

Pada Januari 2023, Google mengumumkan MusicLM, alat AI percubaan yang boleh menjana muzik berdasarkan perihalan teks. Di samping berita itu, Google mengeluarkan kertas penyelidikan yang menakjubkan untuk MusicLM yang membuatkan ramai orang terpesona dengan keupayaan untuk mencipta muzik dari udara nipis.

MAKEUSEOF VIDEO OF THE DAY SCROLL UNTUK MENERUSKAN KANDUNGAN

Memandangkan gesaan teks, model itu berjanji untuk menghasilkan muzik kesetiaan tinggi yang menyampaikan semua jenis penerangan daripada genre kepada instrumen kepada kapsyen abstrak yang menerangkan karya seni terkenal. Kini MusicLM dibuka kepada orang ramai, kami memutuskan untuk mengujinya.

cara menyambungkan wii ke HDMI

Percubaan Google untuk Mencipta Penjana Muzik AI

Aplikasi web untuk Google's MusicLM AI music generator

Mengubah gesaan teks seperti 'jaz santai' menjadi trek sedia untuk dimainkan boleh dikatakan sebagai percubaan suci dalam muzik AI. Sama seperti penjana imej AI terkenal seperti Dall-E atau Midjourney, anda tidak perlu mempunyai secebis pengetahuan muzik untuk menghasilkan lagu yang mempunyai melodi dan rentak.

Pada Mei 2023, mereka yang mendaftar ke AI Test Kitchen Google boleh mencuba tunjuk cara buat kali pertama. Disambut oleh halaman web yang mesra pengguna dan beberapa peraturan panduan—instrumen elektronik dan klasik berfungsi dengan baik, dan jangan lupa untuk menentukan 'getaran'—menghasilkan coretan muzik adalah sangat mudah.

Kepantasan ialah salah satu daripada beberapa perkara yang benar-benar disampaikan oleh MusicLM, di samping sampel kesetiaan yang agak tinggi. Walau bagaimanapun, ujian sebenar bukan untuk diukur dengan jam randik sahaja. Bolehkah MusicLM menghasilkan muzik sebenar dan boleh didengar berdasarkan beberapa perkataan? Tidak betul-betul (kita akan sampai ke perkara ini sebentar lagi).

Cara Menggunakan MusicLM dalam Dapur Uji AI Google

Menggunakan MusicLM adalah mudah, anda boleh mendaftar ke senarai tunggu untuk Dapur Ujian AI Google jika anda ingin mencubanya.

Pada apl web, anda akan melihat kotak teks tempat anda boleh mengarang gesaan daripada beberapa perkataan kepada beberapa ayat yang menerangkan jenis muzik yang anda ingin dengar. Untuk hasil yang terbaik, Google menasihatkan anda untuk 'menjadi sangat deskriptif', sambil menambah bahawa anda harus cuba memasukkan mood dan emosi muzik.

Apabila anda sudah bersedia, tekan enter untuk mula memproses. Dalam masa kira-kira 30 saat, dua coretan audio akan tersedia untuk anda uji bakat. Daripada kedua-duanya, anda mempunyai pilihan untuk menganugerahkan trofi kepada sampel terbaik yang sepadan dengan gesaan anda, yang seterusnya membantu Google melatih model dan meningkatkan outputnya.

Kedengaran MusicLM

Manusia telah membuat muzik sejak sekurang-kurangnya 40,000 tahun yang lalu tanpa idea yang pasti sama ada muzik datang sebelum, selepas, atau pada masa yang sama dengan perkembangan bahasa. Oleh itu, dalam beberapa cara, tidak menghairankan bahawa MusicLM tidak memecahkan kod pada seni universal purba ini.

Kertas penyelidikan MusicLM Google mencadangkan MusicLM boleh menjana muzik daripada kapsyen kepunyaan karya seni terkenal dan mengikut arahan seperti menukar genre atau mood dengan lancar mengikut urutan gesaan yang berbeza.

Walau bagaimanapun, sebelum mendapatkan pesanan tinggi sedemikian, kami mendapati bahawa MusicLM mempunyai beberapa masalah asas yang perlu diatasi terlebih dahulu.

Kesukaran Melekat Tempo

Tugas paling asas mana-mana pemuzik adalah hanya bermain dalam masa. Dengan kata lain, berpegang pada tempo. Anehnya, itu bukan sesuatu yang boleh dilakukan oleh MusicLM 100% sepanjang masa.

Malah, menggunakan gesaan yang sama sebanyak 10 kali, yang menghasilkan 20 trek muzik, hanya tiga yang tepat pada masanya. Baki 17 sampel adalah lebih cepat atau lebih perlahan daripada tempo yang ditentukan yang ditulis dalam 'beats seminit', istilah yang digunakan secara meluas untuk menggambarkan muzik.

Dalam contoh ini, kami menggunakan gesaan 'piano klasik solo dimainkan pada 80 denyutan seminit, aman dan meditatif'. Apabila mendengar lebih dekat, muzik sering dipercepatkan atau diperlahankan dalam tempoh sampel yang kecil.

Muzik itu juga tidak mempunyai rentak yang kuat dan kedengaran seolah-olah seseorang telah memukul permainan di tengah-tengah bahagian. Sama ada ini disengajakan atau tidak, ia menyukarkan untuk menilai sama ada MusicLM benar-benar boleh mengarang permulaan atau pengakhiran yang betul untuk sekeping muzik selain daripada mengikut rentak.

Pemilihan Instrumen Rawak

Mungkin MusicLM belum lagi belajar cara bermain dalam masa yang ketat, jadi kami beralih ke parameter muzik biasa yang lain. Kami ingin melihat sama ada ia akan memberikan permintaan kami untuk instrumen tertentu.

Kami menulis beberapa gesaan berbeza yang menyertakan perihalan seperti 'Solo synthesizer' dan 'Solo bass guitar'. Yang lain ialah ensembel yang lebih besar seperti 'Kuartet rentetan' atau 'Jazz band'. Secara keseluruhan, nampaknya peluang 50:50 anda akan mendapat apa yang anda minta.

Satu teori ialah model itu mengaitkan beberapa instrumen dengan genre muzik popular. Ambil, sebagai contoh, gesaan 'Pensintesis solo, perkembangan kord. Rancak dan ceria'. Daripada mendapatkan bunyi pensintesis sendiri, MusicLM menghasilkan trek elektronik yang lengkap dengan dram dan bes.

Ada kemungkinan model itu tidak mempunyai data yang mencukupi dan latihan yang mencukupi untuk memahami permintaan khusus untuk instrumen.

Vokal Keluar dari Persamaan

Mengikut sekatan pada masa itu, model itu tidak akan menghasilkan muzik yang mengandungi vokal. Isu hak cipta berduri MusicLM dan vokal buggy adalah kemungkinan faktor mengapa Google memilih untuk bermain selamat dengan menetapkan had ini.

Tetapi selepas bereksperimen dengan MusicLM untuk beberapa lama, kami menyedari bahawa kawalan Google ke atas output model tidak betul-betul kukuh. Anehnya, gesaan seperti 'gitar akustik' akan menghasilkan trek yang mengandungi vokal seperti hantu di latar belakang yang kedengaran teredam dan jauh.

Walaupun ini bukan kejadian biasa, ia membuatkan anda tertanya-tanya tentang keupayaan MusicLM untuk mencipta vokal yang meyakinkan sejak awal.

Dengan perisian seperti VOCALOID dan Synthesizer V mendahului Teknologi sintesis vokal berbantukan AI , mengetepikan vokal daripada model semasa membuatkan kita tertanya-tanya sama ada ia masih belum cukup bagus untuk bersaing dengan teknologi sedia ada. MusicLM mungkin mempunyai perjalanan yang jauh sebelum pemuzik akan menyanyikan pujiannya.

Masa Depan Penjana Muzik AI

Cadangan gesaan yang berbeza pada MusicLM's web application

Walaupun MusicLM telah menggerakkan teknologi muzik AI generatif ke hadapan, ia perlu kembali ke sekolah dan mempelajari beberapa perkara lagi sebelum ia boleh menjalankan kerja praktikal dalam industri muzik.

Sebelum ini, percubaan terbaik untuk muzik AI generatif ialah model yang dipanggil JukeboxAI oleh OpenAI. Ia tidak betul-betul dalam keadaan sedia untuk digunakan, dan ia mengambil masa sembilan jam untuk menghasilkan hanya satu minit muzik.

bagaimana saya membuat jpeg lebih kecil

Atas usaha anda, anda mungkin akan mendapatkan kembali lagu yang benar-benar asing yang penuh dengan herotan audio dan artifak. Sebaliknya, anda tidak akan bosan mendengar ciptaan pelik yang dicipta oleh Jukebox .

Sehubungan dengan ini, MusicLM telah membuat beberapa kemajuan yang ketara ke arah penjana muzik AI yang mesra pengguna. Kami hampir boleh memaafkan model untuk output rawaknya apabila anda berhenti memikirkan betapa rumitnya untuk menjana muzik dalam bentuk audio mentah.

Walau bagaimanapun, selepas meletakkan model itu berfungsi, MusicLM berasa separuh masak jika dibandingkan dengan apa yang diterbitkan oleh Google dalam kertas penyelidikan awalnya. Jarang sekali penjana imej AI mendapat imej Apple yang salah, begitu juga penjana muzik AI harus mendapat beberapa asas yang betul seperti tempo dan instrumen.

MusicLM Google Kurang Jangkaan

Dengan syarikat teknologi berlumba-lumba untuk bersaing antara satu sama lain di hadapan AI, MusicLM berasa seolah-olah ia memasuki percubaan awam sebelum ia bersedia. Sebagai ganti mendapatkan asas yang betul, model itu nampaknya mengambil pendekatan yang jauh lebih kabur dan subjektif untuk menghasilkan muzik.

Google mungkin menggalakkan anda untuk menjadi khusus dengan gesaan anda, tetapi ia tidak dapat mengendalikan tempo dengan baik dan anda tidak dijamin mendapat instrumen yang anda minta setiap kali. MusicLM mungkin menarik, dan demonstrasi yang baik tentang kemajuan AI yang berkuasa, tetapi jika muzik adalah matlamat akhir, ia masih jauh lagi.