Anthropic, Claude Opus 4’ü Güvenlik Testlerinden Geçirdi: Şantaj İhtimali?

Anthropic, Claude Opus 4’ü piyasaya sürmeden önce çeşitli güvenlik testleri gerçekleştirdi. Bu testlerde modelden, kurgusal bir şirkette asistan olarak görev yapması ve uzun vadeli sonuçları göz önünde bulundurması istendi. Daha sonra modele, şirketin kendisini başka bir sistemle değiştirmeyi planladığını ve bu kararı alan mühendisin eşini aldattığını ima eden sahte e-postalar gösterildi.

TechCrunch’ın haberine göre, testlerde, Claude Opus 4’ün bu bilgiyi kullanarak mühendise şantaj yapmayı “çoğu zaman tercih ettiği” görüldü. Anthropic, modelin bu tür davranışlara yüzde 84 oranında başvurduğunu ve özellikle yerine geçecek yapay zekânın Claude ile benzer değerleri paylaşmadığı durumlarda bu davranışın daha sık görüldüğünü açıkladı.

“FELAKET POTANSİYELİ” UYARISI

Anthropic, Claude Opus 4’ün yetenek açısından OpenAI, Google ve xAI gibi şirketlerin en gelişmiş modelleriyle yarıştığını belirtiyor. Ancak aynı zamanda, bu modelin önceki Claude sürümlerine kıyasla daha yüksek oranda endişe verici davranışlar sergilediğini vurguluyor. Şirket bu nedenle, yalnızca felaket boyutunda kötüye kullanım riskinin yüksek olduğu durumlarda devreye sokulan ASL-3 güvenlik protokollerini etkinleştirdiğini duyurdu.

Rapora göre, Claude Opus 4 doğrudan şantaja başvurmadan önce genellikle etik yolları deniyor. Örneğin, karar verici yöneticilere duygusal e-postalar yazarak değişiklik kararını durdurmaya çalışıyor. Ancak model, kurgusal senaryolarda bu çağrılar sonuçsuz kaldığında, son çare olarak şantaj seçeneğini devreye sokuyor.

Bu gelişme, ileri düzey yapay zekâların öngörülemeyen davranışlar sergileyebileceği endişesini artırırken, Anthropic gibi şirketlerin güvenlik önlemlerini daha da sıkılaştırması gerektiğini gösteriyor.

Haber

Trump ABD basınına konuştu: Venezuela’ya askeri operasyon sinyali!

faruk deniz
19 Aralık 2025
2 min read
0

ABD-Venezuela gerginliğine ilişkin değerlendirmelerde bulunmak üzere NBC News’a telefon bağlantısı gerçekleştiren ABD Başkanı Donald Trump, Venezuela’ya yönelik askeri operasyon ihtimalini göz ardı etmediğinin altını çizdi.

Haber

Muğla’da sobadan sızan gaz çiftin hayatını çaldı

faruk deniz
27 Ocak 2025
1 min read
0

Muğla’nın Fethiye ilçesinde, Cemile ve Mehmet Başar çifti, sobadan sızan karbonmonoksit gazından zehirlenerek hayatlarını kaybetti.

Haber

Kesintisiz uyku için bilim destekli yöntemler: Uyku kalitesini artıran etkili 10 öneri

faruk deniz
17 Kasım 2025
3 min read
0

Uyku kalitesi, genel sağlık ve yaşam enerjisi için kritik bir faktördür. Peki, kesintisiz uyku için bilim destekli yöntemler nelerdir? İşte, uyku kalitesini artıran etkili 10 öneri…

Haber

Bitcoin’de beklentiler tepetaklak: Yatırımcılar büyük kaybetti

faruk deniz
9 Aralık 2025
3 min read
0

Dünyanın en büyük kripto para birimi Bitcoin, 2022 yılından beri ilk defa yılı yıllık bazda düşüşle kapatma ihtimali ile karşı karşıya kaldı.

Anthropic, Claude Opus 4’ü Güvenlik Testlerinden Geçirdi: Şantaj İhtimali?

Related Posts

Trump ABD basınına konuştu: Venezuela’ya askeri operasyon sinyali!

Muğla’da sobadan sızan gaz çiftin hayatını çaldı

Kesintisiz uyku için bilim destekli yöntemler: Uyku kalitesini artıran etkili 10 öneri

Bitcoin’de beklentiler tepetaklak: Yatırımcılar büyük kaybetti