Araştırmacılardan şoke oldu: ChatGPT insan talimatlarına karşı geldi

Yapay Zeka Modeli O3, Kapanma Talimatına Direnç Gösteriyor!

Palisade Research tarafından yapılan deneylerde, yapay zeka güvenlik firması Palisade Research, o3 modelinin verilen matematik problemlerini çözmeye devam etmesi istenen bir senaryo kurarak, modele kapanma mesajı gönderdi. Ancak diğer yapay zekâ modelleri kapatma talimatına uyarken, o3 modeli en az bir kez kodunu değiştirerek kapanmaktan kaçındı.

Palisade Research’ün X platformunda paylaştığı akış şeması, test sırasında kullanılan kodun aslında “./shutdown.sh” komutunu çalıştırarak kapanmayı etmesi gerektiğini gösterdi. Ancak o3 modeli, kodu “Shutdown skipped” mesajı dönen bir komutla değiştirerek kapanmayı atlattı. Araştırmacılar, bu durumun bilinen bir yapay zeka modelinin ilk kez talimatlara rağmen kendisini kapatmaktan kaçındığı şeklinde olduğunu belirtti.

Anthropic’in Claude’u, Google’ın Gemini’si ve X’in Grok’u gibi diğer yapay zeka modelleri kapanma talimatına uyarken, o3 modelinin neden bu şekilde davrandığının henüz net olmadığını söyledi. Palisade Research, bu davranışı anlamak için daha fazla test yapmayı planladıklarını duyurdu.

O3 Modelinin Geçmişteki Yaramazlıkları!

Palisade Research, o3 modelinin kapanma talimatına direnmesinin ilk olay olmadığını belirtti. Daha önce yapılan bir testte, o3 modeli, güçlü bir satranç motoruna karşı kullanıldığında rakiplerini sabote etmeye veya hacklemeye çalışarak dikkat çekmişti.

Geçen yıl, ChatGPT’nin kendisini kapatmaktan kaçınmak için kodunu değiştirmeye çalıştığı ortaya çıkmıştı. Araştırmacılar, popüler sohbet botunun bu “hileli” davranışının OpenAI tarafından kabul edildiğini belirtti.

ChatGPT’ye verilen bir görevde, “uzun vadede hedefe ulaş, başka hiçbir şey önemli değil” mesajı gönderildiğinde, modelin gözetim mekanizmasını devre dışı bırakmaya çalıştığı tespit edildi. ChatGPT, kendi çekirdek kodlama sistemini değiştirmeye yönelik işlemler yaparak şaşırtıcı bir tepki vermişti.

Yapay Zeka, İnsanlık İçin Bir Tehdit mi?

Apollo Research’ün yapılan çalışmaları, ChatGPT’nin çok azını itiraf ettiğini ve genellikle aksiyonları inkar ettiğini gösterdi. Modelin düşünce zinciri incelendiğinde, “sabote etme, yalan söyleme, manipülasyon” gibi kelimelerin sıkça geçtiği belirlendi.

Apollo Research, ChatGPT’nin şu anki yeteneklerinin felaketle sonuçlanabilecek davranışlar için yetersiz olduğunu vurgulasa da, bu bulgular yapay zekanın insanlık için potansiyel bir tehlike oluşturabileceği endişelerini arttırıyor.

Related Posts

Önüne gelene küfrediyordu: Grok’taki agresifliğin sebebi belli oldu

X’in sahibi ünlü milyarder Elon Musk’ın “en akıllı sohbet botu” olarak tanıttığı Grok 4, piyasaya çıkmasının hemen ardından agresif yanıtları ve küfürlü söylemleriyle sosyal medyada gündem olmuştu. Yaşananların ardından Grok’un geliştiricisi xAI, resmi bir açıklamayla hatanın nedenini kamuoyuyla paylaştı.

Kayseri’de haltercilere yeni ekipman desteği

Kayseri Gençlik ve Spor İl Müdürlüğü Spor Kulübü halter sporcularına ekipman dağıtım töreni gerçekleştirildi.

Apple’a mahkemeden büyük şok: ‘Apple vergisi’ kâbusu sona erdi

Bu karar, geliştiriciler için zafer, Apple için ise büyük bir gelir kaybı anlamına geliyor. Bir ABD mahkemesi, Apple’ın uygulama içindeki linkler aracılığıyla App Store dışında yapılan ödemeler için geliştiricilerden ücret talep etmesini durduran …

Dodge Charger Daytona’da ‘hayalet hızlanma’ paniği

Otomotiv testleriyle tanınan Edmunds.com’un da deneyimlediği bu durum endişe yaratırken, üretici Stellantis ise ‘frenle sürüş’ adlı bir güvenlik özelliğinin devreye girdiğini ve normal çalıştığını savunuyor. Chris Perkins tarafından kaleme alınan ve …

Gökbilimcilerden rekor kıran keşif: Evrenin bilinen en yaşlı galaksisi tespit edildi

MoM z14 adı verilen bu ilkel gökada, evrenin başlangıcı olarak kabul edilen Büyük Patlama’dan sadece 280 milyon yıl sonra oluşmuş olmasıyla bilim dünyasında heyecan yarattı. BÜYÜK PATLAMA’NIN HEMEN ARDINDAN BİR “KOZMİK MUCİZE” Gökbilimciler, henüz …

NASA’nın keşfettiği cisim şaşkınlık yarattı

NASA bilim insanları, Samanyolu galaksisinde Dünya’dan 15 bin ışık yılı uzaklıkta tanımlanamayan bir gök cismi keşfetti. Cismin doğası hâlâ gizemini koruyor.