Mengapa A.I. Dapat Berjuang untuk Memahami Bahasa Arab

$config[ads_kvadrat] not found

Belajar AI (Artificial Intelligence) kembali

Belajar AI (Artificial Intelligence) kembali
Anonim

Di dunia kecerdasan buatan, data adalah raja. Semakin banyak yang Anda miliki, semakin baik alat Anda karena sistem dapat "belajar" lebih banyak tentang apa yang diharapkan. Tetapi tergantung pada platform A.I. adalah mengambil data dari, beberapa bahasa mungkin lebih terwakili daripada yang lain, menurut Miriam Redi, seorang ilmuwan penelitian untuk Yahoo Labs.

"Misalnya seperti Flickr, tempat kami mengambil data kami, beberapa bahasa sangat sedikit terwakili," kata Redi, berbicara di KTT Deep Learning London, Kamis. "Jadi kami memiliki bahasa Inggris, jutaan gambar untuk bahasa Inggris, tetapi kami mungkin memiliki 100.000 untuk bahasa Arab."

Tim Redi sedang mengerjakan alat yang dapat mengidentifikasi elemen yang tidak terlihat pada gambar, seperti nilai-nilai budaya dan konotasi emosional. Alat ini menganalisis teks yang dilampirkan ke gambar yang tersedia untuk umum di Flickr. Seiring waktu, A.I. mulai memahami mengapa seseorang dapat menandai gambar "pesta bahagia" atau "momen canggung," tetapi gagasan ini akan tumbuh semakin akurat karena alat ini menganalisis lebih banyak gambar.

"Sayangnya, akurasi untuk deteksi sentimen dalam gambar untuk bahasa Arab cenderung lebih rendah karena kami tidak memiliki cukup data," kata Redi.

Dalam bahasa yang memiliki jumlah data lebih besar, tim Redi memperhatikan beberapa pola yang menarik. Bahasa romansa seperti Prancis dan Spanyol cenderung mengekspresikan diri mereka dengan cara yang serupa, sementara bahasa Italia tampaknya menjadi satu-satunya bahasa di mana pengguna mengidentifikasi gambar dengan istilah "penggelapan pajak."

Hambatan bahasa masih menjadi masalah bagi A.I. peneliti. Siapa pun yang menggunakan Google Terjemahan akan tahu bahwa beralih bahasa tidak pernah semudah kedengarannya. Namun, perkembangan baru sedang mengubah banyak hal, dengan Facebook mengumumkan musim panas ini bahwa mereka semakin mendekati impiannya akan jejaring sosial satu bahasa, yang secara otomatis menerjemahkan teks untuk pengguna.

Perkembangan dalam menghilangkan hambatan bahasa dapat membantu mendorong komunikasi internasional, tetapi untuk proyek seperti Redi, tidak ada pengganti nyata untuk data sentimen yang dihasilkan manusia.

$config[ads_kvadrat] not found