Robotların Öğrenme Devrimi: Kural Tabanlıdan Yapay Zeka Odaklı Sisteme
Önemli Noktalar
- 2025'te insansı robotlara 6,1 milyar dolar yatırım yapıldı - 2024'ün dört katı
- Robotların öğrenme yöntemi kural tabanlı programlamadan yapay zeka modelleri kullanarak veri odaklı sisteme evrildi
- ChatGPT'nin 2022'deki lansmanı robotik sektöründe boom'u tetikledi
- Büyük dil modelleri artık görüntü, sensör okumaları ve robot eklem pozisyonlarını işleyerek saniyede düzinelerce motor komutu verebiliyor
- Jibo gibi erken örnekler başarısız olsa da, teknolojik altyapı artık sosyal robotlar için olgunlaştı
Robotların Öğrenme Yönteminde Paradigma Değişimi
Robotik alanında yaşanan devrim, makinelerin dünyayla etkileşim kurma biçimini temelden değiştiriyor. Geçmişte robotları programlamak, her olasılığı önceden tahmin ederek kurallar yazmak anlamına geliyordu. Örneğin, bir robotu çamaşır katlamak için eğitmek istediğinizde, kumaşın ne kadar deforme edilebileceğini hesaplamak, gömleğin yakasını tanımlamak ve her kol için hassas hareket planları oluşturmak gerekiyordu.
2015 civarında keskin teknoloji, işleri farklı yapmaya başladı. Robotik kollar ve giysiler için dijital simülasyonlar oluşturuldu ve programa başarılı her katlama işlemi için ödül sinyali verildi. Bu yöntemle robotlar, oyunlarda yapay zekanın başarılı olduğu gibi, milyonlarca iterasyon ile deneme-yanılma yoluyla öğrenmeye başladı.
ChatGPT Etkisi ve Büyük Dil Modellerinin Rolü
2022'de ChatGPT'nin lansmanı mevcut boom'u katalize etti. MIT araştırmacısı Cynthia Breazeal'ın öncü çalışmalarından bugüne, robotik alanında büyük bir dönüşüm yaşandı. Geniş metin verileriyle eğitilen büyük dil modelleri (LLM), bir cümlede hangi kelimenin gelmesi gerektiğini tahmin ederek çalışıyor.
Robotiğe uyarlanmış benzer modeller, artık görüntüleri, sensör okumalarını ve robotun eklem pozisyonlarını absorbe edip makinenin alması gereken bir sonraki eylemi tahmin edebiliyor. Bu modeller saniyede düzinelerce motor komutu vererek çalışabiliyor.
Başarısızlıktan Derse: Jibo Örneği
MIT robotik araştırmacısı Cynthia Breazeal'ın 2014'te tanıttığı Jibo, sosyal robot alanında önemli bir örnek teşkil ediyor. Kolsuz, bacaksız ve yüzsüz olan Jibo, görünüş olarak bir lambaya benziyordu. Breazeal'ın hedefi aileler için sosyal bir robot yaratmaktı.
Jibo'nun crowdfunding kampanyası 3,7 milyon dolar topladı ve 4.800 ön sipariş aldı. Erken siparişlerin fiyatı 749 dolardı. Ancak erken dönem Jibo'nun kendini tanıtma ve çocukları eğlendirmek için dans etme dışında pek bir yeteneği yoktu.
Şirket 2019'da kapandı, ancak geriye önemli dersler bıraktı. Jibo'nun asıl ihtiyaç duyduğu şey daha iyi dil yetenekleriydi. O dönemde Apple'ın Siri'si ve Amazon'un Alexa'sı gibi teknolojiler ağır betiklemelere dayanıyordu.
Günümüzde Durum
Bugün ise herhangi bir önde gelen yapay zeka sağlayıcısının sesli modu etkileyici ve ilgi çekici hale geldi. Ancak bu Yeni bir riskle geliyor: Betikli konuşmalar raydan çıkamazken, yapay zeka tarafından üretilen konuşmalar kesinlikle çıkabiliyor.
Teknolojik İlerleme: Simülasyondan Gerçek Dünyaya
Google'ın robotik ekibi, 2022 civarında 17 ay boyunca insanlara robot kontrolcüleri vererek onları cips torbalarını almaktan kavanozları açmaya kadar her şeyi yaparken filme aldı. Ekip sonunda 700 farklı görevi katalogladı.
Google'ın RT-1 Modeli, robotun nelere baktığı ve robotik kolun birçok parçasının nasıl konumlandırıldığı hakkında girdi aldı; ardından bir talimat alıp bunu robotu hareket ettirmek için motor komutlarına çevirdi. Daha önce gördüğü görevlerin %97'sini başarıyla gerçekleştirdi.
Google DeepMind'da robotik uzmanı Kanishka Rao şöyle açıklıyor: "Diğer tüm bu şeyler açığa çıktı. Artık 'Kola kutusu Taylor Swift'in resminin yanına koy' gibi şeyler yapabiliyorduk."
Ticari Uygulamalar ve Gelecek
Covariant Şirketi, 2017'de OpenAI'dan ayrılan mühendisler tarafından kuruldu ve depolarda eşyaları alıp taşıyabilen kollar geliştirdi. 2024'te yayınlanan RFM-1 modeliyle, robotlarla bir iş arkadaşı gibi etkileşim kurulabiliyor.
Amazon, Toyota ve GXO gibi şirketler Agility'nin insansı robotu Digit'i kullanıyor. Bu robot nakliye kutularını alma, taşıma ve istiflemek için kullanılıyor. Mevcut Digit sadece 35 pound kaldırabiliyor, ancak gerçek maliyet tasarrufu sağlayan ilk insansı robot örneklerinden biri.
Karşılaştırma Tablosu
| Dönem | Yöntem | Özellikler | Başarı Oranı |
|---|---|---|---|
| 2014 Öncesi | Kural Tabanlı Programlama | Her durum için önceden yazılmış kurallar | Sınırlı çevre koşulları |
| 2015-2021 | Dijital Simülasyon | Deneme-yanılma ile milyonlarca iterasyon | Simülasyonda iyi, gerçekte sınırlı |
| 2022 Sonrası | LLM Tabanlı Modeller | Görüntü, sensör ve pozisyon verisi işleme | %76-97 arası başarı oranı |
Sık Sorulan Sorular
Neden robotik sektöründe bu kadar büyük yatırımlar yapılıyor?
Yapay zeka teknolojisindeki ilerlemeler, robotiğin çok yıldır erişemeyen pratik uygulanabilirliğini mümkün hale getirdi. 2025'te insansı robotlara 6,1 milyar dolarlık yatırım, bu teknolojilerin artık ticari olarak uygulanabilir hale geldiğinin göstergesi.
Büyük dil modelleri robotları nasıl daha akıllı hale getiriyor?
LLM'ler, robotların görüntü, sensör okumaları ve eklem pozisyonlarını işleyerek saniyede düzinelerce motor komutu verebilmesini sağlıyor. Bu, robotların doğal dil komutlarını anlayıp gerçek eylemlere dönüştürebilmesi anlamına geliyor.
Jibo neden başarısız oldu ve bugün neler farklı?
Jibo'nun temel sorunu yetersiz dil yetenekleriydi. O dönemde robotlar ağır betiklemelere dayanıyordu. Bugün ise yapay zeka destekli sesli modlar çok daha etkileyici ve doğal konuşmalar yapabiliyor.
Kaynak: MIT Technology Review AI - How robots learn: A brief, contemporary history
Kaynak: MIT Technology Review AI