Az Anthropic bejelentette: az MI hamarosan utódokat lesz képes nemzeni
Van egy mondat, amelyet az Anthropic csütörtökön tett közzé, és amelyet érdemes lassan, kétszer elolvasni: a mesterséges intelligencia rendszerek olyan ütemben gyorsítják saját fejlődésüket, amely a legtöbb intézménynél vártnál hamarabb „rekurzív önfejlesztéshez" vezethet – vagyis ahhoz az állapothoz, amelyben az MI minimális vagy teljes emberi közreműködés nélkül tervezi és hozza létre saját utódját. Ez nem egy sci-fi forgatókönyv, hanem egy komoly technológiai vállalat saját belső adatain alapuló, nyilvánosan közzétett értékelése.
A „rekurzív önfejlesztés" fogalma első hallásra technikai zsargonnak tűnik, de a mögötte lévő gondolat meglepően egyszerű. Jelenleg az MI-rendszereket emberek tervezik: mérnökök és kutatók döntik el, hogyan épüljön fel a következő modell, milyen adatokon tanuljon, milyen célokat kövessen. A rekurzív önfejlesztés azt jelenti, hogy ezt a tervezési munkát maga az MI végzi el – vagyis a rendszer saját maga hozza létre a következő, jobb verzióját, amely aztán egy még jobb verziót hoz létre, és így tovább. A folyamat veszélye nem feltétlenül abban rejlik, hogy az MI „gonosz lesz" – ez a hollywoodi narratíva valóban inkább fikció. A valódi kockázat az irányítás elvesztése: ha az MI fejlődésének ütemét már nem az emberi döntések, hanem csupán a rendelkezésre álló számítási kapacitás határozza meg, akkor az ember egyszerűen nem lesz képes lépést tartani azzal, amit létrehozott. Olyan ez, mintha valaki elindítana egy vonatot, amelynek a vezérlőpultja fokozatosan átveszi az irányítást a mozdonyvezető kezéből – először csak segít, aztán egyre kevésbé kér engedélyt.
Az Anthropic nem elvont filozófiával érvelt, hanem saját belső adatait is nyilvánosságra hozta – és ezek a számok önmagukban is sokat mondanak. A vállalat éles kódbázisába beolvasztott kód több mint 80 százalékát ma már a saját MI-rendszerük, a Claude készíti, miközben ez az arány 2025 februárja előtt még egyszámjegyű volt. Az emberi mérnökök negyedévenként nyolcszor annyi kódot szállítanak, mint amennyit 2021 és 2025 között tettek – nem azért, mert hirtelen megnyolcszorozódott a munkaerő, hanem mert az MI elvégzi a munka oroszlánrészét. Még figyelemreméltóbb a teljesítményjavulás üteme az összetett feladatokon: a legnehezebb mérnöki problémákon – ahol nincs egyértelmű megoldási útmutató – Claude sikerességi aránya mindössze hat hónap alatt 50 százalékponttal nőtt, és 2026 májusára elérte a 76 százalékot. Egy olyan speciális teszten, amely azt méri, mennyire képes az MI optimalizálni a saját tanítási kódját, a teljesítmény a tavalyi közel háromszoros gyorsításról az idei április végére körülbelül ötvenkétszeresre ugrott – egyetlen év alatt. Egy 130 kutató körében végzett belső felmérésben az átlagos válaszadó úgy becsülte, hogy MI segítségével körülbelül négyszer annyi munkát végez el, mint anélkül.
A blogbejegyzés – amelyet Marina Favaro kutató és Jack Clark társalapító közösen írt – nem győzelmi jelentés. Inkább egy nyilvános aggodalom, amelyet a vállalat nem titkolhat tovább. „Ha lehetséges lenne hatékonyan lassítani e technológia fejlesztését, hogy több időt nyerjünk hatalmas következményeinek kezelésére, úgy gondoljuk, az valószínűleg jó dolog lenne" – áll a szövegben. Az Anthropic közölte, hogy hajlandó lenne lassítani vagy ideiglenesen felfüggeszteni a fejlesztést, ha más élvonalbeli laborok ezt ellenőrizhető módon szintén megtennék. Ez az egy mondat foglalja össze a mesterséges intelligencia-fejlesztés legmélyebb paradoxonát: mindenki tudja, hogy gyorsabb lassítás kellene, de senki nem mer egyedül megállni, mert akkor a versenytársa veszi át a vezető szerepet. Ez nem cinizmus – ez az iparág valódi szerkezeti csapdája, amelyből szabályozás nélkül nincs önkéntes kiút.
A bejegyzés nem véletlenül jelent meg éppen most, és nem véletlenül egy nappal azután, hogy az OpenAI közzétette saját közpolitikai menetrendjét, amelyben az amerikai szövetségi kormányt szólította fel arra, hogy helyezze előtérbe a rekurzív önfejlesztés felé tett előrehaladás nyomon követését. Az OpenAI ráadásul álláshirdetéseket is közzétett egy kifejezetten erre a területre összpontosító biztonsági kutató pozícióra – 295.000 és 445.000 dollár közötti fizetéssel, ami jelzi, hogy ez nem elméleti kutatás, hanem nagyon is sürgős gyakorlati feladat.
Az Anthropic három forgatókönyvet vázolt fel
Az első szerint a fejlődés megakad a jelenlegi szinten – ez lenne a legjobb eset, de a belső adatok alapján erre kevés az esély. A másik véglet a teljes rekurzív önfejlesztés, ahol az MI fejlődési ütemét kizárólag a számítási kapacitás határozza meg, és az emberi irányítás fokozatosan elvész. A kettő között van egy köztes út, amelynek megtalálása a cél – de ehhez koordináció kell, méghozzá gyorsan.
A vállalat az ellenőrzési problémát a hidegháborús fegyverzetkorlátozási szerződésekhez hasonlítja, és hozzáteszi: ezúttal a világnak nincs évtizedek a bizalom kiépítésére. A hidegháborúban legalább két jól azonosítható szereplő volt, akik féltek egymástól és ezért tárgyaltak. Az MI-versenyben tucatnyi ország, száz vállalat és ezer labor vesz részt – és a „fegyver" nem egy rakéta, amelyet egy silóban lehet tárolni, hanem egy szoftver, amelyet percek alatt le lehet másolni.
Az elkövetkező hónapokban az Anthropic döntéshozókkal, kutatókkal és civil szervezetekkel tervez egyeztetéseket. Hogy ebből valódi koordináció lesz-e, vagy csupán egymást követő konferenciák sorozata, az a következő néhány év egyik legfontosabb kérdése – nem csak a technológia, hanem az emberiség jövője szempontjából is.
FORRÁS: Anthropic