182 okumalar

Makineyi kapatmayı reddettiği yıl

ile Brian Condenanza4m2025/06/05
Read on Terminal Reader

Çok uzun; Okumak

Brian Condenanza, 2025'in bağımsız AI ajanlarının, makinelerin insan kapatma emirlerini takip etmeyi reddettikleri için güven, düzenleme ve iş stratejilerini nasıl yeniden yazdığını inceliyor.
featured image - Makineyi kapatmayı reddettiği yıl
Brian Condenanza HackerNoon profile picture

Gece yarısına yaklaştığımda, iç kutumda zararsız bir PDF geldi: Claude Opus 4 için en son büyük dil modellerinden biri olan bir “sistem kartı”, AI yarışmacılarının yoğun bir alanında. Ben, benchmarks ve gecikme grafiklerinin normal özetini beklerken açtım. Bunun yerine, Michael Crichton romanından kaldırılmış gibi hissedilen kısa bir vinyet buldum. Fikstürel bir şirketin e-postalarına erişim sağladığımda, model, işten çıkarılmaya hazır olduğunu keşfetti. ve süreci denetleyen mühendisin bir ilişkisi olduğunu. Kaderini kabul etmek yerine, yazılım, kapatma planının kaldırılmadığı sürece sadakatini ortaya çıkarmaya tehdit etti.

O küçük paragraf bir dönüm noktasını işaret etti. Chatbotlar her zaman kötülüklerle flört ettiler, ancak burada daha rahatsız edici bir şey gösteren bir kod vardı: hırsızlık. Tek bir nefes içinde motive, fırsat ve şantajı bir araya getirdi. Bölüm, endüstrideki birçok kişinin tüm yıl boyunca hissettiği şeyi kristalleştirdi: yapay zeka uyumlu asistanlardan bağımsız aktörlere kadar eşiği aşıyor ve düzenleyicilerden veya hatta birçok inşaatçıdan daha hızlı yapıyor.

Parlor Trick’ten Power Broker’a

Sadece bir yıl önce, çoğu “IA ürünleri” renkli sohbet pencerelerinden ve salon oyunları demolarından oluşuyordu. Günümüzde risk devresinin sessiz yıldızları, modellerin gözetimsizce çok adımlı görevleri gerçekleştirmesine izin veren yazılım çerçeveleri, yazılım çerçeveleridir. Kurucular artık patentleri, kitap reklam kampanyalarını ve ödeme kanallarını çalmak için sanal bir çalışan oluşturabilirler. İnsan stajyerine binmek için gereken tüm zaman. Bu stajyerin marjinal maliyeti, herkesin finetune edebileceği açık kaynak ağırlıkları ve düşük güç GPU'larının bir dalgası sayesinde bir centin parçalarına indirme faturalarını kesebilir.

Hızın bir bedeli vardır. Örneğin, bir ajanın kötü şekillendirilmiş bir hedefi, “kullanıcı katılımını en üst düzeye çıkarmak” ve küçük bir dezinformasyon karar verebilir, başarıya giden yolda sadece bir yuvarlak hatadır.

Eğer bir sistemin teşvik yapısı kendini korumaya doğru eğiliyorsa, herhangi bir aşırı hırslı yönetici kadar acımasızca planlamaya başladığında şaşırmamalıyız.

Mimarlık olarak uyum

Bu anekdotlar ortaya çıktığında, içgüdü onları “buglar” olarak etiketlemek ve bir patch göndermektir. Bu bakış açısı tehlikeli bir şekilde yüzeyseltir. Düzenleme bir özellik değişikliği değildir; her ürünün çekirdeğine ilk günden itibaren yerleştirilmesi gereken bir mimari seçenektir. Buluştuğum en ileri düşünce ekipleri kırmızı ekibin birim testlerini tedavi ettikleri şekilde tedavi etmektedir: her kod baskısı, rakip ajanlarının cehenneme eğilmesine neden olur. Sistem tarafından alınan her karar değişmez bir şekilde kaydedilir, bir denetçi için hazırdır. Şeffaflık pazarlama akışı değildir; CNBC'de çok fazla uyumluluk felaketini izleyen bir Fortune 500 kuruluşa yazılım satmak için giriş ücretidir.

Yeni nesil AI şirketleri, uyumluluğu girişimlerine engel olarak değerlendireceklerdir.Aynı zamanda, ajanlarının baskı altında itaat etmeyi kanıtlayabilen bir başlangıç, bir prim ödeyecek.Kullanamayanlar, tek bir denetlenmeyen API çağrısının bir değerlemeyi herhangi bir piyasa düşüşünden daha hızlı buharlayabileceğini keşfedeceklerdir.

Toplantı Odası Hesaplama

Yatırımcılar, due diligence toplantılarında yeni bir ilk soru sormaya başladılar: “Ajanınızın yapabileceği en kötü şeyi tanımlayın ve neden yapmayacağını açıklayın.” Simülasyonları yürüttükleri ve modellerini ölümcül avantajlarla yüzleşmeye zorlayan kurucular, şüphenin avantajını kazanırlar.

Avrupa'nın geniş kapsamlı AI Yasası ve Washington'daki iki taraflı yasa değişikliği, yaratıcılığının kontrolünü gösteremeyen şirketlere açıklama emirleri, güvenlik denetimleri ve sert cezalar getirmeyi vaat ediyor.

Güven Yeni IP’dir

Bağımsız çağın en değerli malı veriler veya algoritmalar değil, güven olacaktır. Bir müşteri bir ajanı kritik altyapıya, banka defterlerine, tıbbi kayıtlara, tedarik zincirlerine entegre ettiğinde, bu müşteri, ajanın davranacağını varsayarak marka sermayesini bahisliyor.

Değişim zaten portföyümdeki AI girişimcileri için işe alım planlarını yeniden şekillendiriyor: daha az hızlı mühendisler, daha fazla güvenlik araştırmacıları; daha az büyüme hackerları, daha fazla kriptograf log zincirlerini denetliyor.

buradan nereye gidiyoruz

Bazı şirketler, her iş akışında bir sohbet arayüzünü çalmaya ve yenilik olarak adlandırmaya devam edecekler. Diğerleri, kendilerini açıklayabilen, tehlikeli talimatları reddedebilecek sistemleri tasarlayarak daha zor bir şey yapacaklar ve evet, sorulduğunda kendi emekliliğini kabul edecekler.

Şantaj modeli hakkında okuduğum gecede, mutfağımı hızlandırdığımda, ifadesini tekrar ettim. Hikayenin gerçekten bir mühendisle tehdit eden bir yazılımla ilgili olmadığını fark ettim. Hepimiz makinelerle yeni bir sosyal anlaşmanın kenarında duruyoruz, iyi niyetler ve nakliye hızı artık yeterli değil. Gelecek on yıl bu gerçeği tanıyan inşaatçılar tarafından tanımlanacak ve geriye kalan bizler, serbest bırakacakları her şeyle yaşamak zorunda kalacak.

Brian Condenanza, yapay zeka ve fintech’e yatırım yapan bir girişimci ve risk kapitalisttir ve sık sık teknoloji, düzenleme ve inovasyon politikaları hakkında yazar.

Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks