Bisakah Neural Network "Superhuman" Google Benar-Benar Memberitahu Lokasi Gambar Apa Pun?

$config[ads_kvadrat] not found

Better brain health | DW Documentary

Better brain health | DW Documentary
Anonim

Mencari gambar lebih mudah dari sebelumnya. Tetapi jika Anda mencoba untuk menemukan gambar sesuatu di lokasi yang tidak terlalu jelas (jadi bukan piramida Mesir atau patung ibu jari raksasa di Paris), itu lebih sulit daripada yang Anda pikirkan - bahkan dengan informasi geolokasi berdasarkan apa dalam gambar.

Masukkan insinyur Google bernama Tobias Weyand dan sepasang rekannya. Menurut sebuah makalah baru di jurnal arXiv (diucapkan "arsip"), ketiganya telah membangun mesin pembelajaran mendalam yang mampu menentukan dengan tepat lokasi hampir semua foto hanya berdasarkan analisis pikselnya.

Untuk mendapatkan mesin agar berhasil menyelesaikan tugas seperti ini, Anda ingin memberikannya kemampuan untuk informasi intuitif berdasarkan petunjuk visual. Anda ingin itu berpikir, dengan kata lain, seperti manusia.

Weyand mulai mengembangkan jaringan saraf tiruan - sistem mesin yang dirancang untuk meniru jalur neurologis otak, yang memungkinkannya untuk belajar, memproses, dan mengingat informasi seperti yang dapat dilakukan manusia. Sistem baru ini, PlaNet, tampaknya mampu mengungguli manusia di menentukan lokasi gambar tidak peduli apa pengaturannya - baik itu indoor maupun outdoor, dan menampilkan segala jenis isyarat visual yang unik atau tidak jelas.

Bagaimana PlaNet bekerja? Weyand dan timnya membagi peta dunia menjadi sebuah kotak yang meletakkan lebih dari 26.000 bentuk persegi di berbagai wilayah, tergantung pada berapa banyak gambar yang diambil di tempat-tempat itu. Tempat-tempat padat di mana banyak gambar diambil dalam kotak yang lebih kecil, sementara daerah yang lebih besar dan lebih terpencil dapat dipotong menjadi kotak yang lebih besar.

Tim kemudian membuat basis data besar gambar yang sudah di-geolokasi - hampir 126 juta foto berbeda. Sekitar 91 juta digunakan sebagai dataset untuk mengajarkan PlaNet bagaimana cara mencari tahu gambar mana yang dapat ditempatkan di grid mana pada peta dunia.

Kemudian, jaringan saraf ditugaskan untuk geolokasi 34 juta gambar lain dari database. Akhirnya, PlaNet ditetapkan pada set data 2,3 juta gambar yang diberi geotag dari Flickr.

Hasil? PlaNet dapat menentukan negara asal untuk 28,4 persen dari foto dan benua untuk 48 persen. Selain itu, sistem ini dapat menunjukkan dengan tepat lokasi tingkat jalan untuk 3,6 persen dari gambar Flickr, dan lokasi tingkat kota sebesar 10,1 persen.

Dan PlaNet lebih baik dalam hal ini daripada kebanyakan manusia - bahkan para pembuat peluang global terbesar. Weyand meminta 10 orang yang bepergian untuk bersaing dengan PlaNet dalam permainan memberi label lokasi gambar yang ditemukan di Google Street View.

"Secara total, PlaNet memenangkan 28 dari 50 putaran dengan kesalahan lokalisasi rata-rata 1131,7 km, sedangkan kesalahan lokalisasi manusia rata-rata adalah 2320,75 km," tulis para peneliti. "Eksperimen skala kecil ini menunjukkan bahwa PlaNet mencapai kinerja manusia super atas tugas geolokasi adegan Street View."

Apakah ini nyata? Apakah seorang insinyur Google benar-benar baru saja mengembangkan "manusia super" A.I. sistem?

Ketika datang ke geolokasi gambar, mungkin. Dan itu tidak terlalu mengejutkan - titik A.I. tidak secara fundamental meniru otak manusia dalam segala hal, tetapi untuk melampaui keterbatasan manusia dalam beberapa cara khusus untuk menyelesaikan tugas yang jauh lebih sulit. Jadi dalam pengertian itu, apa yang ditulis para peneliti itu benar.

Namun, masih sulit untuk menyebut PlaNet sebagai "jaringan saraf". Bentuk ideal teknologi semacam itu akan mampu belajar lebih dari sekadar geolokasi gambar. A.I. sistem mampu menulis perumpamaan dan bermain Super Mario, tetapi ini adalah hal-hal kecil dibandingkan dengan sistem "master" yang ideal yang dapat secara otomatis memantau dan memelihara vital, mengelola transportasi atau infrastruktur energi, dan banyak lagi.

$config[ads_kvadrat] not found