OpenAI Memberi ChatGPT Suara untuk Membalas Gesaan dan Perintah

Pembaca seperti anda membantu menyokong MUO. Apabila anda membuat pembelian menggunakan pautan di tapak kami, kami mungkin mendapat komisen ahli gabungan. Baca Lagi.

ChatGPT ditetapkan untuk menjadi pengalaman AI generatif interaktif. OpenAI mendedahkan bahawa chatbot AI terkemuka di dunia akan dapat bercakap dan menjawab pertanyaan pengguna menggunakan suara yang disintesis, mungkin dijana AI.

Bersama-sama dengan suara baharunya, ChatGPT juga akan dapat membalas dan membincangkan imej tertentu yang dimuat naik atau diambil semasa menggunakan aplikasi ChatGPT Android atau iOS. Ciri pengecaman imej berbunyi serupa dengan Google Lens dan apl lain yang menggunakan rangkaian saraf untuk mengesan data dan maklumat dengan tepat.

cakera saya sentiasa pada 100

OpenAI Memberi ChatGPT Suara

Pada 25 September 2023, pembangun ChatGPT OpenAI didedahkan ia akan memberikan suara chatbot AI generatifnya yang terkemuka di dunia. Pengguna ChatGPT boleh bercakap terus dengan chatbot dan memintanya bercakap balik, dengan berkesan membenarkan ChatGPT bercakap secara langsung dengan suara untuk kali pertama.

Klip contoh OpenAI menampilkan seorang wanita yang meminta ChatGPT mencipta cerita sebelum tidur yang unik, yang mana ChatGPT bertindak balas dengan sewajarnya dengan suara sintesis wanita.

mengikut berwayar , model teks-ke-ucapan baharu telah dibangunkan secara dalaman. Ia boleh menjana audio 'seperti manusia' daripada teks dan beberapa saat contoh ucapan ( menggunakan model OpenAI Whisper ) dan bercakap dalam pelbagai nada dan gaya. Anda boleh menemui pelbagai sampel suara pada OpenAI's blog .

Sesetengah syarikat sudah pun menggunakan model suara baharu OpenAI untuk digunakan. Contohnya, Spotify menggunakan model teks ke pertuturan OpenAI untuk menterjemah podcast ke dalam bahasa yang berbeza, menggabungkan kehebatan terjemahan bahasa ChatGPT dengan keupayaan pertuturannya yang baharu.

Model teks-ke-ucapan baharu ChatGPT hanya tersedia kepada pelanggan Plus dan Perusahaan menggunakan apl Android dan iOS rasmi dan dijangka akan dilancarkan dalam masa dua minggu akan datang (bermula dari 25 September 2023). Tambahan pula, ciri suara baharu adalah terhad kepada bahasa Inggeris sebagai permulaan, walaupun kami menjangkakan ini akan berubah dengan cepat.

ChatGPT Boleh Mengenali dan dan Gambar

Bahagian kedua kemas kini ChatGPT OpenAI ialah keupayaan untuk menganalisis dan bercakap imej yang dimuat naik ke alat. Pilihan analisis imej visual telah dipaparkan dalam video kemas kini GPT-4 tetapi tidak banyak dibincangkan sejak masa itu ( Jurubahasa Kod ChatGPT diketepikan ).

Kini, ChatGPT memperoleh fungsi yang serupa dengan Google Lens. Anda boleh memuat naik imej ke ChatGPT atau mengambil gambar menggunakan kamera telefon pintar anda dalam apl ChatGPT, dan ia akan memperincikan imej, menambah lebih banyak konteks jika perlu.

Memanggilnya 'serupa dengan Google Lens' adakah ini satu ketidakadilan, sungguh. Keupayaan untuk berbual berulang-alik tentang imej untuk mendapatkan lebih banyak maklumat dan konteks menjadikannya sangat berguna untuk pelbagai tetapan. Walau bagaimanapun, adalah penting untuk mengambil perhatian cetakan halus, dengan OpenAI menjelaskan bahawa ia telah mengehadkan 'keupayaan ChatGPT untuk menganalisis dan membuat kenyataan langsung tentang orang' atas sebab privasi dan ketepatan. Namun, adakah alat 'Siapa Ini' yang dikuasakan oleh OpenAI boleh diusahakan untuk masa hadapan? (Mari kita berharap tidak!)

Seperti model teks-ke-ucapan baharu, OpenAI akan melancarkan pengecaman imej dalam dua minggu akan datang, walaupun ia akan tersedia pada semua platform, bukan hanya apl ChatGPT.

Privasi, Keselamatan dan Isu Lain

Implikasi daripada ChatGPT berkuasa suara adalah nyata. Pasti, ia mengujakan. Walau bagaimanapun, keupayaan untuk mencipta suara yang disintesis secara unik menggunakan hanya coretan pendek sebagai contoh mempunyai isu privasi dan keselamatan yang besar. Potensi pelakon berniat jahat untuk mengeksploitasi alat ini sangat besar, dan seperti mana-mana alat AI generatif, sebaik sahaja jin itu keluar dari botol, ia sama sekali tidak akan masuk semula. Tiada jumlah peraturan AI daripada kerajaan atau pemimpin pemikiran boleh berpatah balik air pasang.

Malah amaran OpenAI mengenai topik itu nampaknya tidak jelas walaupun menyebut isu:

Walau bagaimanapun, keupayaan ini juga menimbulkan risiko baharu, seperti potensi pelakon berniat jahat untuk menyamar sebagai tokoh awam atau melakukan penipuan. Inilah sebabnya kami menggunakan teknologi ini untuk menguasakan kes penggunaan tertentu—sembang suara.

Memandangkan ini adalah puncak gunung es, jangkakan tolak balik terhadap suara ChatGPT yang baru ditemui, terutamanya apabila terdapat peningkatan yang boleh diramal dalam tajuk berita yang tidak menyenangkan yang mendakwa ChatGPT digunakan untuk melakukan penipuan dan sebagainya.

OpenAI Menjadikan ChatGPT sebagai Apl AI Go-To

Lebih banyak OpenAI menambah ciri mesra pengguna pada ChatGPT, lebih banyak ia menjadi apl AI generatif yang sesuai. Sebagai yang pertama mencapai kemasyhuran meluas semasa ledakan AI generatif awal, ChatGPT masih mendahului dan merupakan satu-satunya apl yang digunakan, walaupun terdapat persaingan daripada Google Bard (dan berkemungkinan Google Gemini) dan Claude Anthropic.

perkhidmatan penghantaran apa yang paling banyak dibayar

Selagi OpenAI boleh terus menambah ciri yang menjadikan ChatGPT lebih mudah digunakan, ia akan membuatkan orang ramai terpikat dan semakin dekat dengan matlamatnya iaitu alat AI yang benar-benar berbilang modal.