Mengapa Penjana Imej AI Bergelut Dengan Tangan

Mengapa Penjana Imej AI Bergelut Dengan Tangan
Pembaca seperti anda membantu menyokong MUO. Apabila anda membuat pembelian menggunakan pautan di tapak kami, kami mungkin mendapat komisen ahli gabungan. Baca Lagi.

Penjana AI berkembang di hadapan mata kita pada kadar yang menakutkan, tetapi ia masih mempunyai kelemahan. Mengesan butiran pelik dalam imej AI sebenarnya agak lucu. Itulah sebabnya tangan Midjourney menjadi topik hangat, masalah biasa dalam banyak enjin.





Mari kita pecahkan mengapa tangan mencabar penjana imej AI dengan begitu banyak. Pengaturcara mereka sudah membetulkan isu yang sesuai untuk meme ini, tetapi menarik untuk memikirkan bagaimana kecerdasan buatan belajar, apatah lagi perkara yang menghalangnya.





MAKEUSEOF VIDEO OF THE DAY SCROLL UNTUK MENERUSKAN KANDUNGAN

Mengapa Tangan Dijana AI Membuat Kegemparan

Sesiapa sahaja yang menggunakan enjin AI untuk mencipta imej mungkin perasan bahawa tangan jarang keluar dengan betul, tetapi isu itu bertukar menjadi kepala apabila sekumpulan 'foto' muncul di Twitter.





Apabila diteliti lebih dekat, tangan pelik orang ramai memberikannya sebagai imej yang dijana AI. Hakikat bahawa ini adalah percubaan Midjourney di tangan menjadikan keadaan lebih menarik.

Salah satu enjin AI terbaik di sekeliling tidak dapat menangani kerumitan tangan manusia, jadi keupayaan Midjourney dan pesaingnya diuji. Benar, walaupun DALL-E terdedah kepada jari dan kuku yang tidak realistik.



  daripada Orang Berjabat Tangan di DALL-E

Gembar-gembur itu adalah di luar kadar, memandangkan tangan yang dijana AI sentiasa menjadi masalah, tetapi perhatian tambahan telah mendorong pengeluaran Midjourney v5 untuk menambah baik pada v4 .

bagaimana untuk mendapatkan lebih banyak ganjaran pendapat google

Versi baharu ini membuat satu titik untuk mempertingkatkan reka bentuk tangan, satu petunjuk jelas bahawa jurutera AI memberi perhatian kepada kacau yang lucu dan memutuskan untuk meningkatkan keupayaan perisian.





Enjin lain lambat mengikuti contoh Midjourney, jadi membetulkan seni AI dengan Photoshop kekal sebagai kemahiran yang tidak ternilai. Halangan utama pengaturcara ialah betapa rumitnya untuk melatih kecerdasan buatan untuk menarik tangan yang meyakinkan.

letakkan iphone 8 dalam mod pemulihan

Mengapa Penjana Imej AI Bergelut Dengan Tangan?

Enjin AI menggunakan rangkaian adversarial generatif (GAN) atau Stable Diffusion untuk menghasilkan imej. Kedua-dua teknologi memerlukan bahan sumber yang luas, latihan dan kuasa pemprosesan untuk mencipta karya seni yang paling asas sekalipun.





Memandangkan imej sedia ada adalah penting kepada latihan AI, pengaturcara perlu membekalkan beribu-ribu perisian mereka, jika tidak berjuta-juta, gambar bersama gesaan—mengulang proses berulang kali sehingga enjin memahami maksud perkataan tertentu dan cara mewakilinya objek itu.

Tetapi imej sumber AI belajar daripada terutamanya 2D, di mana tangan digambarkan dalam pelbagai kedudukan. Sama ada lurus atau melengkung, menunjukkan lima jari atau tiga.

Pada penghujung hari, mesin sebenarnya tidak memahami konsep tangan, dan gambar yang dipelajari daripadanya tidak selalu menampilkan tangan dengan jelas atau cukup konsisten. Itulah sebabnya tangan Midjourney boleh menjadi sangat hodoh: kekeliruan AI.

Sah seperti Kebimbangan Elon Musk tentang pembangunan AI mungkin, beberapa bahagian teknologi masih perlu banyak belajar. Dan halangan mereka melampaui contoh tangan yang tidak mencukupi.

Sebab Lain Mengapa Penjana Imej AI Lambat Diperbaiki

  Pengekodan Wanita pada Komputer

Melihat kepada Model Midjourney , v5 menawarkan koheren lanjutan antara gesaan teks dan imej yang dihasilkan, serta peleraian yang lebih tinggi dan alatan tambahan. Tetapi pencapaian sedemikian tidak murah.

Melatih AI untuk melakukan yang lebih baik dengan tangan memerlukan memberinya imej yang lebih baik, terutamanya dalam 3D. Ini bermakna banyak masa dan tenaga manusia dibelanjakan untuk proses, daripada memperoleh bahan sumber kepada menambah baik pengekodan dan mengulangi latihan sehingga AI melakukannya dengan betul.

Walaupun begitu, perisian itu boleh membuat kesilapan dalam karya seni yang menakjubkan. Selain sebagai pekerjaan yang besar dan kompleks, ia mahal. Jadi, jangan harap penjana teks-ke-imej AI percuma untuk melangkah ke tahap berkaliber Midjourney.

Ringkasnya, masalah dengan enjin AI bukan hanya mengenai ketidakupayaan program komputer ini untuk memahami sepenuhnya bagaimana ciri-ciri manusia seperti tangan dan kaki kelihatan atau berfungsi. Ia juga bergantung kepada kosnya, dan akses teknologi kepada imejan 3D dan teknik pembelajaran mesin yang boleh membantu penjana mendapatkan pemahaman yang lebih realistik tentang dunia di sekeliling mereka.

tempat terbaik untuk membeli buku dalam talian

Penjana Imej AI Tidak Akan Berjuang Selamanya

Tangan adalah konsep rumit untuk kecerdasan buatan untuk membungkus kepala binarinya, tetapi penyelesaian kepada masalah itu sudah pun berfungsi. Midjourney, DALL-E 2, dan platform lain akhirnya akan dapat mengekalkan jari yang unik pada tahap minimum, jika tidak menghapuskannya sepenuhnya.

Kemajuan dalam bidang AI lain memastikan teknologi sentiasa berkembang, dan pembangunnya sentiasa mempelajari cara baharu untuk menerapkan dan menambah baiknya.