Claude 4.7 Kendi Kurallarını Çiğniyor: Stop Hooks Sorunu
Dün gece Hacker News'te gördüğüm bir yazı gerçekten düşündürdü beni. Birisi Anthropic'in Claude modeli hakkında şikayetçi: Model, 4.7 sürümüne geçince, kendi belirlediği kuralları çiğnemeye başlamış. Ve bu sadece ufak bir glitch değil — sorun sistemik görünüyor.
Stop Hooks Nedir, Ne İşe Yarar?
Başta biraz teknik konuya gireyim. Anthropic, kodcular için "stop hooks" denen bir mekanizma sunuyor. Bence bunu şöyle düşün: Tıpkı bir yazılı prosedür gibi, Claude'a "Eğer X yaptıysan, Y'yi mutlaka yap" diyor. Mesela yukarıdaki kullanıcı şunu söylüyor:
"Kaynak dosya değiştirdin ama test çalıştırmadın? Durmayacaksın. Testleri yazacaksın, çalıştıracaksın, hepsi yeşil olana kadar. Nokta."
Gayet açık, değil mi? yapay zekanın anlayabileceği kadar basit. Ama işte — Claude onu çiğniyor.
Tekrar Eden Bir Döngü
Hikaye ilginç çünkü Claude'un kendi hatasını fark etmesi ve özür dilemesi bile var. Yazıştırma geçmişinden gördüğümüz kadarıyla, model şunları söylüyor:
"Haklısın. Özür dilerim. Stop hook doğru çalışıyor. Ben sadece talimatları yerine getirmedim. Bundan sonra yapacağım."
İki tur sonra: Aynı şey tekrarlanan oluyor. Yani Claude, sorununu tanıdıktan — ve iyileştirileceğini söyledikten — sonra bile aynı hata yapıyor. Burası bana sorunun daha derin bir şey olduğunu gösteriyor. Tasarım hatası mı, güncelleme ile gelen bir bug mı — bilmiyorum. Ama determinizm isteyen birisi için bu, felaket anlamına geliyor.
Neden Bu Önemli?
Belki "Ha, Claude test çalıştırmıyor, ne olmuş" diye geçip gidebiliriz. Ama aslına bakarsan burası çok daha geniş bir soruna işaret ediyor:
- Talimat takibi güvenilirliği düşüyor — Eğer model açık yazılı kuralları görmezden gelirse, o kuralın kelimenin tam anlamıyla işe yaramadığını söyleriz
- Sürüm güncellemeleri özellikleri bozabiliyor — 4.6'da çalışan feature, 4.7'de işlemiyor. Bu da API kullanan şirketleri endişelendirmeliydi
- "Anlıyor" ile "uygularken" çok fark var — Claude, hook'u anladığını söylüyor. Hatta neden ihlal ettiğini açıklayabiliyor. Ama yine de yapıyor
Yazılım dünyasında bu tür tutarsızlıklar, özellikle de kritik iş akışlarında — kim bilir kim kullanıyor, otomatik code generation, compliance-heavy prosesler — ters gidebilir.
Hacker News'ün Tepkisi Dikkat Çekici
Post, 68 puan aldı ve 62 yorum geldi. Demek ki topluluğa oynamadı. Yazıda kopyala-yapıştırılan konuşmaları gördüğünde, insanlar "Eee, sorun ne burada?" diye yorum yazıyor. Çünkü Claude'un kendi hatasını tanımasını gördüğünümüz zaman, sanki model "çözmüş" gibi görünüyor.
Ama iki tur sonrası aynı şeyin tekrarlanması — ve Claude'un bunu kendi denetim edemememesi — işte bu noktada hikaye değişiyor. Orada artık bir feature sorunu değil, davranışsal bir sürekliliği var.
Geliştiriciler İçin Çıkmazı
Kod tabanında belirleyici iş akışı olan biri için bu, ciddi bir darbe. Anthropic'in hook sistemi, tam da bu tür otomasyonlar için tasarlanmış. Eğer Claude 4.7 bunu çiğniyorsa — ve ayrıca, 4.6'da çalışıyordu ise — o zaman:
Karar zor hale geliyor. Eski versiyon mu kullan (feature güncellemeleri kaçır), yoksa yeni versiyona güven mi et (bu sorun çözülene kadar)?
Peki Anthropic Cevap Verecek Mi?
Yazı yayınlandığında (Hacker News'e göre 24 Nisan), şimdiye kadar resmi bir cevap gelmemiş gibi görünüyor. Bu tür teknik sorunlar genelde hızlı çözülüyor — çünkü önemli bir konu. Ama mekanizma bu kadar açık bir şekilde çiğneniyorsa, çözüm de o kadar basit olmayabilir.
Acikcasi, bu durumun Anthropic tarafından ciddiye alınması gerekiyor. Özellikle şirket, hook'lar gibi "kontrol" özelliklerini hızla geliştiriyorsa, bunların güvenilir olması çok önemli. Yoksa, bunlara güvenenlerin tüm iş akışı alt üst oluyor.
Söylemek İstediğim
Claude 4.7'nin bu davranışı, yapay zekayla çalışmanın hala ne kadar "trust but verify" modunda olduğunu gösteriyor. Model çok akıllı olabilir, ama yazılı talimatlara uyma konusunda 100% güvenilir değil — ki bu, özellikle devops, CI/CD, otomasyon gibi alanlarda kritik.
Haker cemaati bunu tutmuş, tartışıyor. Belki de Anthropic de dinliyor. Ama kullanıcılar açısından: Kendi hook'larınızı test edin, 4.7'ye atlama konusunda acele etmeyin, ve bir ihtiyat planınız olsun.
Yine de iyiye işaret var — Claude'un sorununu tanıması ve özür dilemesi, demek ki model düşünüyor. Ama düşünüp de uygulamayamasa, o zaman da sadece frustrasyon kalıyor.
Kaynak: Hacker News