Jaringan Saraf Tiruan AI Ini Dari Nvidia Menciptakan Gambar Palsu Fotorealistik

$config[ads_kvadrat] not found

Artificial intelligence & algorithms: pros & cons | DW Documentary (AI documentary)

Artificial intelligence & algorithms: pros & cons | DW Documentary (AI documentary)
Anonim

Sepintas, foto di atas terlihat seperti foto biasa dari jalan biasa, diambil dari dash cam atau dari seseorang yang cukup bodoh untuk berkeliaran di jalan untuk mengambil gambar pemandangan duniawi seperti itu.

Tapi lihat sedikit lebih dekat. Perhatikan bagaimana sinyal lalu lintas sedikit bengkok, atau bagaimana beberapa mobil tampak kabur? Ada yang salah di sini. Ini sama sekali bukan foto. Ini adalah gambar yang dibuat seluruhnya oleh A.I.

Ilmuwan komputer dari perusahaan teknologi Nvidia dan University of California, Berkeley telah menulis makalah penelitian, tersedia dalam cetakan di arXiv, merinci bagaimana mereka bisa mendapatkan jaringan saraf untuk menghasilkan gambar jalanan yang realistis dan potret manusia. Mereka bahkan menyertakan antarmuka pengguna yang memungkinkan Anda mengubah gambar sesuka Anda dengan menambahkan dedaunan ekstra atau bahkan mengubah cuaca.

“Permainan berkembang pesat, karena orang suka berinteraksi satu sama lain di lingkungan virtual,” Ming-Yu Liu, seorang ilmuwan senior di Nvidia, mengatakan Terbalik dalam email. “Namun, membangun dunia virtual itu mahal dengan teknologi saat ini, karena membutuhkan seniman untuk secara eksplisit memodelkan dan mensimulasikan tekstur dan pencahayaan untuk dunia yang mereka bangun. Dengan terjemahan gambar-ke-gambar, alih-alih kami dapat mencicipi dunia nyata untuk menciptakan dunia virtual."

Jaringan saraf adalah komputer yang dimodelkan untuk bekerja seperti otak manusia dengan mengambil informasi, menerapkannya, dan belajar dari hasilnya. Penelitian ini menggunakan jenis jaring saraf khusus yang diperkenalkan oleh Ian Goodfellow pada tahun 2014, yang disebut jaringan permusuhan generatif - atau GAN - yang umumnya terdiri dari dua jaringan, generator dan pembeda.

Generator diberi foto dan mulai membuat gambar sintetis yang mirip dengan yang diberikan. Ini kemudian menunjukkan campuran gambar yang diberikan dan palsu kepada pembeda, yang tugasnya adalah membedakan mereka. Seiring proses ini berlangsung, generator menjadi lebih baik dalam meniru gambar asli dan pembeda menjadi lebih baik dalam membedakan palsu. Hasilnya adalah beberapa gambar yang cukup meyakinkan - dan benar-benar palsu.

Penelitian ini didasarkan pada model GAN ​​tradisional dengan menambahkan pemisahan jaringan generator dan diskriminator ke dalam beberapa sub-jaringan, memungkinkan untuk menghasilkan gambar dengan resolusi lebih tinggi. Jaringan saraf juga dapat mengambil peta semantik - atau cetak biru bagaimana foto itu seharusnya terlihat - dan mengisi tekstur secara mandiri. Pengguna bahkan dapat masuk ke cetak biru dan mengubah hal-hal jika mereka ingin menambahkan bangunan, bukan pohon di tampilan jalan atau membuat mata lebih lebar dalam potret.

Makalah ini membandingkan hasilnya dengan percobaan serupa yang dilakukan menggunakan metode ini, yang paling terkenal adalah pix2pix. Studi Nvidia dan UC Berkeley mampu menghasilkan gambar dengan detail sekecil dan seakurat plat nomor yang dapat dibaca, sementara pix2pix menampilkan gambar yang hampir terlihat seperti lukisan cat air.

Sementara alat ini dapat digunakan untuk mendapatkan beberapa karma reddit gratis dengan beberapa foto aneh, penulis melihat potensi besar dalam memanfaatkan pendekatan ini untuk menghasilkan grafik yang realistis hanya dengan cetak biru sederhana.

Ratusan jam kerja yang sungguh-sungguh digunakan untuk menghasilkan dunia virtual untuk digunakan di Google Maps, film, dan video game. Liu mengatakan model ini bisa berfungsi sebagai cara untuk menyelesaikan sebagian besar desain tanpa kesulitan dan kemudian masuk dan mengubah detailnya nanti.

“Daripada merender dunia dengan memodelkannya secara eksplisit, kita dapat membangun dunia secara implisit dengan menggunakan terjemahan gambar-ke-gambar untuk menerjemahkan antara model dunia sederhana yang tidak mengandung tekstur atau pencahayaan, dan output foto-realistis. Kemampuan ini seharusnya membuatnya jauh lebih murah untuk membangun dunia virtual, ”katanya Terbalik.

Untuk langkah selanjutnya dalam penelitian ini, tim berharap untuk mengeksplorasi terjemahan video-ke-video, yang akan menggunakan jaring saraf untuk membuat video yang realistis. Tujuan yang Lui katakan telah menantang para peneliti di lapangan.

Sekarang Anda tahu betapa mudahnya gambar palsu dapat dibuat. Jangan percayai semua yang Anda lihat di gambar Google.

$config[ads_kvadrat] not found