Belajar AI (Artificial Intelligence) kembali
Di dunia kecerdasan buatan, data adalah raja. Semakin banyak yang Anda miliki, semakin baik alat Anda karena sistem dapat "belajar" lebih banyak tentang apa yang diharapkan. Tetapi tergantung pada platform A.I. adalah mengambil data dari, beberapa bahasa mungkin lebih terwakili daripada yang lain, menurut Miriam Redi, seorang ilmuwan penelitian untuk Yahoo Labs.
"Misalnya seperti Flickr, tempat kami mengambil data kami, beberapa bahasa sangat sedikit terwakili," kata Redi, berbicara di KTT Deep Learning London, Kamis. "Jadi kami memiliki bahasa Inggris, jutaan gambar untuk bahasa Inggris, tetapi kami mungkin memiliki 100.000 untuk bahasa Arab."
Tim Redi sedang mengerjakan alat yang dapat mengidentifikasi elemen yang tidak terlihat pada gambar, seperti nilai-nilai budaya dan konotasi emosional. Alat ini menganalisis teks yang dilampirkan ke gambar yang tersedia untuk umum di Flickr. Seiring waktu, A.I. mulai memahami mengapa seseorang dapat menandai gambar "pesta bahagia" atau "momen canggung," tetapi gagasan ini akan tumbuh semakin akurat karena alat ini menganalisis lebih banyak gambar.
"Sayangnya, akurasi untuk deteksi sentimen dalam gambar untuk bahasa Arab cenderung lebih rendah karena kami tidak memiliki cukup data," kata Redi.
Dalam bahasa yang memiliki jumlah data lebih besar, tim Redi memperhatikan beberapa pola yang menarik. Bahasa romansa seperti Prancis dan Spanyol cenderung mengekspresikan diri mereka dengan cara yang serupa, sementara bahasa Italia tampaknya menjadi satu-satunya bahasa di mana pengguna mengidentifikasi gambar dengan istilah "penggelapan pajak."
Hambatan bahasa masih menjadi masalah bagi A.I. peneliti. Siapa pun yang menggunakan Google Terjemahan akan tahu bahwa beralih bahasa tidak pernah semudah kedengarannya. Namun, perkembangan baru sedang mengubah banyak hal, dengan Facebook mengumumkan musim panas ini bahwa mereka semakin mendekati impiannya akan jejaring sosial satu bahasa, yang secara otomatis menerjemahkan teks untuk pengguna.
Perkembangan dalam menghilangkan hambatan bahasa dapat membantu mendorong komunikasi internasional, tetapi untuk proyek seperti Redi, tidak ada pengganti nyata untuk data sentimen yang dihasilkan manusia.
Ahli Bahasa MIT Mengatakan Bahasa Manusia Mungkin Dapat Diprediksi
Penerjemah universal adalah sci-fi trope standar: Ikan babel telah ada dalam berbagai bentuk (pikirkan: C-3P0, "Microsoft," Gibson, dan matriks linguacode). Ahli bahasa IRL telah lama menganggap penciptaan teknologi semacam itu sebagai teka-teki pamungkas dan jenis akhir dari pemecahan kode. Sekarang, para peneliti di ...
Bahasa Rohingya: Mengubah Dialek Menjadi Bahasa Digital
Sementara orang-orang Rohingya telah mengalami penindasan dengan kekerasan di Myanmar, mereka bisa mendapatkan alat baru untuk melestarikan identitas budaya mereka: bahasa digital.
Bagaimana 'Ghostbusters' Berjuang - dan Berjuang untuk Menang - Bayi Laki-Laki yang Petulant
Dengan kurang dari sebulan sebelum Ghostbusters reboot hits bioskop, Sony melakukan serangan. Setelah dua tahun kontroversi yang menjengkelkan, perusahaan ini mengambil pendekatan yang sangat komprehensif untuk berurusan dengan para misoginis yang tidak berpikiran yang telah membingungkan para wanita di waralaba komedi tahun 80-an. Ini wortel dan ...