Penelitian Microsoft Menciptakan Pengenalan Bicara yang Lebih Baik Daripada Manusia

$config[ads_kvadrat] not found

Mengenal Potensi Dasar Manusia

Mengenal Potensi Dasar Manusia
Anonim

Microsoft telah menjadi perusahaan pertama di dunia yang mengembangkan perangkat lunak pengenalan suara yang lebih akurat daripada manusia. Dalam makalah “Mencapai Kesetaraan Manusia dalam Pengenalan Bicara Percakapan” yang diterbitkan hari Senin, perangkat lunak tersebut menghasilkan transkrip yang mengandung kesalahan setengah persen lebih sedikit daripada upaya manusia, yang luar biasa mengingat betapa baiknya orang-orang baik dalam memahami pembicaraan. Terobosan membuka pintu bagi A.I baru asisten yang lebih akurat dari sebelumnya.

Sangat mengesankan seberapa jauh teknologi telah datang dalam waktu yang singkat. Belum terlalu lama bahwa pengenalan ucapan komputer adalah ceruk aneh yang tampak jauh dari harapan. Tonton demonstrasi perangkat lunak ucapan Windows Vista ini dari 2006:

Tim menggunakan uji Institut Nasional Standar dan Teknologi (NIST) 2000, digunakan di seluruh industri untuk mengukur keandalan transkripsi pidato. Percakapan terjadi antara dua peserta melalui telepon, secara bergantian, sebelum skrip yang dihasilkan dibandingkan dan diperiksa terhadap pengejaan kamus.

Di bagian switchboard, di mana dua orang asing berbicara untuk pertama kalinya, tingkat kesalahan manusia adalah sekitar 5,9 persen, sedangkan pada bagian panggilan rumah, di mana dua orang yang saling mengenal berbicara, tingkat kesalahan adalah sekitar 11,3 persen. Perangkat lunak Microsoft mencetak angka kesalahan sekitar 0,4 persen lebih rendah.

Terobosan ini akan membantu membawa bentuk-bentuk baru dari A.I yang imersif.. Pada bulan Agustus, siswa Joshua Browder mengambil bungkusnya dari obrolan DoNotPay-nya, yang dapat membantu para tunawisma mendapatkan nasihat hukum gratis. Dikombinasikan dengan kemajuan pengakuan, mudah untuk membayangkan masa depan di mana orang meminta bantuan virtual untuk perumahan dengan melakukan percakapan rutin dengan komputer mereka.

Pada tahap ini, peneliti sedang mempertimbangkan bagaimana pengenalan suara bertenaga A.I. dapat memberikan respons yang lebih cerdas. Sensay, A.I. pendeteksi kemarahan dari lab di belakang Siri, menggunakan kemampuan pengenalan canggih untuk mendeteksi jika pengguna merasa marah atau bingung, mengubah jawaban sesuai dengan situasi. Menghapus penghalang pengenalan suara yang rawan kesalahan, menciptakan peluang baru yang menarik untuk bantuan virtual.

$config[ads_kvadrat] not found