En Çılgın ve En Korkunç Yapay Zeka Örneği – Alphazero!

“Bizden çok üstün dünyadışı varlıklar gelip bize satrancın nasıl oynandığını gösterse nasıl olurdu diye merak ediyordum. Artık biliyorum!”

Bunu söyleyen bir satranç ustası. Nielsen?

Dünyadışı varlık olarak tanımladığı şey ise uzaylılar filan değil. Bizim bildiğimiz haliyle yapay zekadan bahsediyor. Yapay zekanın en inanılmaz ve belki de en korkutucu örneğinden.

Bir maçtan bahsedeceğim size. Aklın sınırlarını zorlayan. Yapay zekanın geldiği ve bundan sonra nereye gidebileceğini bize gösteren. Geleceğin fragmanı olan bir maçtan. Bir satranç maçından…

Cidden çok ama çok acayip bir olay, o yüzden arkanıza yaslanın ve bir yere ayrılmayın.

Satranç 1500 yıldan uzun süredir oynanan bir oyun ve birçok insana göre hayatı en iyi yansıtan oyundur. Hem kendinizle hem de rakibinizle verdiğiniz bir mücadeledir. Kaç hamle sonrasını tahmin edebilirseniz, o kadar adım önde olursunuz rakibinize göre. O yüzden ihtimaller sınırsızdır ve çoğu zaman şartlar sizin beklediğiniz gibi gelişmez ve bir anda tüm planlarınızı yeniden gözden geçirmek zorunda kalabilirsiniz.

İşte tüm bu zorluklar nedeniyle bilgisayar ile insan aklının mücadelesinde de hep en çok oynanan, oynatılan oyun olmuştur.

Bunun en popüleri ise 1997 yılında dünyaca ünlü satranç ustası Kasparov ile IBM’in satranç motoru Deep Blue arasında oynanmış. İlk oyunları Kasparov kazanmış ama sonunda bilgisayar insan aklına ilk kez galip gelmiş ve belki de bugünkü makineler insanları ele geçirecek tartışmalarının alevlenmesine neden olmuştur.

Ondan sonra makinelerle insanlar arasında sayısız maç yapılmış ve artık bir noktadan sonra makinelerin insanlara karşı üstünlüğü su götürmez bir gerçek haline gelmiştir. Hatta bu konu sıkıcı bir hal de almıştır, o yüzden “makine insana karşı” gibi gazete başlıkları görmemeye başladık.

Bu satranç motorlarından en ünlüsü de 2008 yılında ilk sürümü yayınlanan Stockfish isimli satranç motorudur. Hem insanlara hem de diğer satranç motorlarına karşı ezici bir üstünlükle 2017 yılına kadar en iyi algoritma olarak görülüyordu.

Ama işte 2017 yılında bir şey oldu.

Makine öğrenmesi videomdan hatırlarsınız. Google’ın Deepmind isimli yapay zeka bölümü çok acayip işlere imza atıyor demiştik. İşte bu zamana kadar ki en acayip işini 2017 yılında gerçekleştirdi Deepmind. Daha öncesinde Alphago isimli bir algoritma ile dünyanın en iyi Go oyuncularını alt eden şirket 2017’de satranca el atmaya karar verdi ve Alphazero isimli bir yapay zeka satranç algoritması yazdı.

Amacı da dünyanın en iyi satranç algoritması olmaktı. Ve tarihin en heyecan verici maçlarından biri olan Stockfish algoritması ile Alphazero algoritması arasında bir maç ayarlandı.

Şimdi aklın sınırlarını zorlayacak notka da işte tam da burada. Stockfish zaten 10 yıldır piyasadaydı ve oynadığı binlerce oyun ile hem insan zekasından öğrenmiş hem de kendini inanılmaz geliştirmiş bir durumdaydı. Yani 1500 yıllık satranç tarihini, zekasını bünyesinde barındırıyordu diyebiliriz.

Peki Alphazero ne yaptı? Maça çıkmadan önce satranç ile ilgili hiçbir bilgisi yoktu. At, piyon, vezir nedir bilmiyordu. Satranç nedir, ne değildir hiçbir bilgisi yoktu. Ve mühendisler sadece ama sadece bu bilgileri girdiler. Klasik hamleleri, satranç kurallarını tanıttılar algoritmaya ve yapay zekayı saldılar. Bıraktılar. Kendi kendine öğrenmesi ve Stockfish ile oynamaya hazır olması için ona bir süre verdiler.

Ne kadar süre vermişlerdir sizce? Aylar? Haftalar? Günler?

Hayır. Alphazero sıfırdan başlayarak sadece 4 saatte satrancı öğrendi. Hiçbir ek girdi olmadan. Hiçbir insan müdahalesi olmadan, karmaşık algoritmalar girmeden, denetimsiz makine öğrenmesi ile kendi kendine oynayarak 4 saatte bu maça hazırlandı.

Bunun ne anlama geldiğini şöyle örnekleyebiliriz aslında. Bir insana bir Ferrari’nin bütün parçalarını verdiğinizi ve hangi parçanın nereye ait olduğunu, hangisinin hangisine monte edildiğini söylemediğinizi düşünün. Ve bu parçalardan sonunda çalışır bir Ferrari çıkarmasını isteyin. Binlerce parça ve sıfır bilgi…

İşte AlphaZero her bir parçayı olasılıklara göre deneyerek, eleyerek, tekrar tekrar deneyerek 4 saatte bu işi çözüyor.

Burada işler çok daha karmaşık aslında. Çok daha fazla ihtimalin olduğu ve bilinmezliğin de söz konusu olduğu bir oyundan bahsediyoruz.

Makine Öğrenmesi videomuzda IKEA örneği vermiştik bir de. Kurulum kılavuzu olmadan yüzlerce parçayla ne yapacağınızı düşünün.

Buraya kadar tamam da diyebilirsiniz. Öğrendi de ne oldu? Yüzyıllara denk gelen deneyime sahip Stockfish’i yenebildi mi?

Cevap: EVET. Hem de eze eze. Toplamda 100 maç yapıldı ve Alphazero bu maçların 28’ini kazandı ve diğerlerinde de berabere kaldı. Sıfır yenilgi. 4 saatlik yeni yetme, dünyanın en iyi satranç ustasına oyun bile vermeden kazandı.

Daha çarpıcı bir şey söyleyeyim mi?

Stockfish o zamana kadar en iyi satranç motoruydu çünkü – buraya dikkat – saniyede 70 milyon pozisyona bakabiliyordu. Saniyede 70 milyon.

Bu durumda Alphazero’nun bu sayıyı ikiye katladığını filan düşünüyor insan. Öyle düşünmek istiyor…

Ama Alphazero saniyede sadece ama sadece 80.000 pozisyona bakabiliyor. 70 milyon olasılığa karşı sadece 80 bin olasılık hesaplaması ile ezici bir üstünlük sağlıyor.

Burada da algoritmalarla ilgili en temel kural devreye giriyor.

En iyi algoritma bir işlemi en az kodla ve en az adımla yaptırabilen algoritmadır.

En basit işlemi yaptırabilmek için sayfalarca kod yazabilirsiniz. Ama bir mühendis çıkar tek bir satır kodla o işi yaptırır. Bu hem işlem süresi, hem işlemci ve hafıza yükü açısından çok daha avantajlıdır. O nedenle Deepmind mühendislerinin çok daha iyi iş çıkardığını çok rahat söyleyebiliriz…

Burada da bitmiyor. Alphazero hız kesmedi ve hemen bu maçtan kısa bir süre sonra 2 saatini daha ayırarak Japon Satrancı adı verilen Shogi oyununu da öğrendi ve bu oyunda dünyanın en iyisi olarak bilinen Elmo isimli oyun motorunu da yenmeyi başardı.

Burada da durmayan Deepmind mühendisleri işleri bir adım öteye de taşımaya karar verdi ve Alphastar isimli bir algoritma geliştirdi. Bu algoritmanın amacı da gerçek zamanlı bir strateji oyunu olan Starcraft II’de uzmanlaşmaktı. Bu tip bilgisayar oyunlarına gelindiğinde işler elbette çok daha zordu. Satranç, Go veya Shogi’nin tersine burada çok daha karmaşık ve anlık kararlar alarak bunları uygulamak gerekiyordu. Ayrıca insanların sahip olduğu görsel avantaj da ayrı bir konuydu. O nedenle Alphastar ilk başlarda TLO veya Nash gibi dünyanın en iyi oyuncularına karşı kaybetti. Ama ilk başlarda… Sonra? Sonra öğrendi. Makine öğrenmesi o kadar iyi çalışıyor ki sonrasında hiçbir maçını kaybetmemeye başladı Alphastar. Hatta oyun dünyasında bunun hile ile eşdeğer olduğu bile tartışılmaya başlandı. Bunun hiç adil olmadığı konuşulur oldu.

Haksızlar mı? Değiller tabiki. Bir insanın bu kadar yetenekli bir makineye karşı yapabileceği hiçbir şey yok maalesef.

Kaldı ki bu zamana kadar insanlar hep satranç oynayabilecek bir yapay zekanın insan zekasına eşdeğer hatta daha iyi olacağını düşünürlerdi. Ama demek ki öyle değilmiş. Hiç zorlanmadan bu level’ı çok basit bir şekilde geçti yapay zeka. O yüzden bir sonraki level ne diye düşünüyor insan. Yani biz sadece oyunlardan bahsettik burada ama bu kadar çabuk öğrenen ve öğrendiklerini sıfır hata ile inanılmaz bir hızla ve doğrulukla uygulayan bir “oluşum” başka neler yapabilir diye düşünüyor insan.

Kimine göre yapay zeka “akıl” ile ilgili testi geçti ve bir sonraki adım da motor beceriler. Yani artık düşünüyor ve şimdi sıra ayağa kalkıp yürümesinde. Ama bunu da zaten yapıyor şu anda… Hatırlayın makine öğrenmesi videosunu. Bu videoda anlattığım algoritmaları yazan Deepmind yakın zamanda kendi kendine yürümeyi öğrenen bir algoritma yazmıştı. Hatırladınız mı?

İşte bu noktada artık sanırım “yapay zeka” insan zekasını alt edecek mi sorusundan ziyade “ne zaman” alt edecek sorusunun yanıtını aramanın vakti geldi sanırım.

Çünkü biz henüz “acaba” diye düşünürken bu algoritmalar 4 saatte bizim yüzyıllar süren gelişimimizi hop diye öğreniveriyor.

Ki biz 4 saat diyoruz ama o 4 saat bize  göre 4 saat. Saniyede milyonlarca işlem yapan bir oluşum için zaman kavramı bizimki ile aynı mı sizce?

Yapay zeka ile ilgili daha sayısız örnek var ve her geçen gün inanılmaz bir hızla yeniliklere tanık olmaya devam ediyoruz. Ben de çok ama çok yakından takip ediyorum bu gelişmeleri. Siz de BebarBilim’i takip ederek ve etrafınıza bahsederek takipte kalmayı unutmayın. Sizin desteğiniz çok ama çok önemli…

Bir sonraki videoya kadar… Kendinize çok iyi bakın…

Sevgiler!

Bir cevap yazın

E-posta hesabınız yayımlanmayacak.