Utama Berinovasi Kecerdasan Buatan Google 'Alpha Go Zero' Hanya Menekan Reset Tentang Cara Belajar How

Kecerdasan Buatan Google 'Alpha Go Zero' Hanya Menekan Reset Tentang Cara Belajar How

Horoskop Anda Untuk Besok

Ingat (samar-samar) bagaimana Anda belajar berjalan, berbicara, mengendarai sepeda, atau mengemudi? Itu berantakan dan penuh kesalahan, tetapi keterampilan yang Anda pelajari seperti itu tetap ada. Di luar sistem kehidupan, sulit untuk menyusun algoritme yang cukup kuat untuk mengambil 'pengalaman kehidupan nyata' dan mengembangkan perilaku yang melekat dan dapat disesuaikan untuk kecerdasan buatan .

Nah, Alpha Go Zero baru saja melakukannya.

'Ini dimulai dari batu tulis kosong dan hanya muncul untuk dirinya sendiri, hanya dari permainan sendiri, dan tanpa pengetahuan manusia, atau data manusia, atau fitur, atau contoh, atau intervensi dari manusia. Ia menemukan cara memainkan permainan Go dari prinsip pertama,' kata profesor DeepMind, David Silver.

AI telah memiliki beberapa iterasi, masing-masing lebih pintar dan lebih mampu daripada yang sebelumnya. Versi sebelumnya menggunakan database besar dari game-game sebelumnya bersama sekelompok algoritma yang mengarahkannya untuk menang. Pendekatan itu berujung pada kekalahan juara bertahan dunia pemain profesional Go. Dalam poker, AI Libratus baru-baru ini menguliti pemain poker top dunia hampir juta, juga dengan belajar melalui permainan mandiri alih-alih data permainan manusia.

truk greiner suami dan greiner

Sekarang, di Alpha Go versi terbaru ini, program kecerdasan buatan diajarkan diri cara bermain Go--tanpa latar belakang manusia.

Menjalankan jutaan simulasi game melawan dirinya sendiri, butuh 40 hari untuk belajar--dari awal--cara mengalahkan versi juara Dunia itu sendiri. Itu benar-benar mengubah permainan, tidak hanya untuk Go, tetapi juga untuk bagaimana pengetahuan baru ditemukan. Seberapa akurat atau lengkap keahlian domain Anda? ada banyak lebih untuk menemukan, adalah apa eksperimen menarik dalam belajar dengan Alpha Go Zero memberitahu kita.

'Ide Alpha Go bukan untuk keluar dan mengalahkan manusia, tetapi sebenarnya untuk menemukan apa artinya melakukan sains--untuk sebuah program untuk dapat belajar dari dirinya sendiri apa itu pengetahuan,' menurut Silver dalam posting YouTube tentang pencapaian.

Tim Alpha Go Zero Deep Mind menyebutnya dengan prinsip pertama, pembelajaran 'tabula rasa' (blank slate).

'Jika Anda bisa mencapai tabula rasa belajar, Anda memiliki agen yang dapat ditransplantasikan dari game Go ke domain lain mana pun, dan spesifik dari game yang Anda ikuti, Anda membuat algoritme yang sangat umum sehingga dapat diterapkan di mana saja,' katanya . Itu ide yang provokatif ketika Anda memperluas konsepnya. Pikirkan saja apa yang dapat kita lakukan dengan serangkaian algoritme pembelajaran yang kuat yang dapat secara sistematis mengatasi masalah sulit dan belajar lebih cepat daripada pengetahuan kolektif peradaban kita . . . dalam hitungan hari, bukan dekade.

kekayaan bersih bukit iman 2016

Untuk saat ini, kesimpulan besarnya adalah, 'algoritma lebih penting daripada komputasi atau data yang tersedia,' kata Silver. Ini saja merupakan pengubah permainan dalam pendekatan kami untuk memperluas dunia yang dikenal. Sementara Alpha Go berjalan dengan perangkat keras sekitar juta--ini bukan sistem yang ringan--Anda tahu para ahli AI telah lama bekerja untuk menciptakan kumpulan data yang lebih bersih dan lebih baik. Saat ini, banyak kumpulan data besar dianggap terlalu berisik--penuh dengan data buruk--untuk melatih kecerdasan buatan secara akurat. Jika AI belajar dari data, dan datanya buruk, ia tidak belajar. Masalah besar.

Bagaimana jika Anda tidak membutuhkan data yang bersih, tetapi hanya pengalaman, dan kecerdasan buatan dapat melatih dirinya sendiri?

Itulah pencapaian menarik di Alpha Go Zero. Meskipun berada di ceruk, dunia permainan berbasis aturan, itu memiliki implikasi besar di setiap industri yang bekerja dari aturan fisik - pikirkan kimia, lalu lintas, biologi, farmakologi, perjalanan, logistik, dan manufaktur. Jika kita dapat merancang aturan yang sangat fleksibel sehingga mereka dapat bekerja dari pengalaman yang lebih luas, dan sangat terarah sehingga mereka selalu menciptakan keterampilan yang lebih kuat--seperti Alpha Go Zero--maka dimungkinkan untuk mencapai kecerdasan buatan yang mendalangi sistem. Sistem ini tidak memerlukan data dari luar, tidak memiliki masalah pembersihan data, dan tidak memerlukan penurunan kecepatan manusia. Itulah sebagian alasan mengapa perusahaan induk Google, Alphabet, mempertaruhkan perusahaan pada kecerdasan buatan dan berinvestasi dalam kecerdasan buatan dengan kecepatan tinggi. (Amazon juga berinvestasi dalam kecerdasan buatan, seperti akuisisi AI terbaru BodyLabs.)

berapa umur thomas petrou 2020

Profesor Deep Mind David Silver mengatakan, 'fakta bahwa kita telah melihat sebuah program mencapai kinerja tingkat tinggi...seharusnya sekarang kita dapat mulai mengatasi beberapa masalah yang paling menantang dan berdampak bagi umat manusia.'

Posting ini telah diperbarui untuk mengklarifikasi bahwa AI Libratus baru-baru ini mengalahkan pemain poker top menggunakan strategi yang melibatkan permainan sendiri daripada data yang dimasukkan manusia.