MI vs. Tudomány: 1–0

A Wall Street Journal számolt be részletesen arról, hogy Aidan Toner-Rodgers, a 27 éves MIT doktoranduszból lett „csodagyerek”, rövid idő alatt a közgazdaságtan felső köreibe emelkedett, majd látványosan bukott és tűnt el. Még doktori kurzusait teljesítve írt egy, a mesterséges intelligencia (MI) munkahelyi hatásáról szóló tanulmányt, amelyet gyorsan felkapott a szakma: hivatkozták az amerikai Kongresszusban, megjelent róla portré a Wall Street Journalban, és olyan neves közgazdászok támogatták, mint Daron Acemoglu és David Autor. A tanulmány azt állította, hogy egy amerikai anyagtudományi cégnél bevezetett MI-eszköz növelte a kutatók produktivitását és az innovációt, de főleg az eleve sikeresebb tudósok profitáltak belőle, miközben sok felhasználó valójában nem szeretett az eszközzel dolgozni.

Néhány hónap után felmerült a gyanú, hogy Toner-Rodgers teljesen kitalálta a kutatását. Először Charles Elkan informatikus hívta fel a figyelmet arra, hogy a leírt technológia valószínűtlen, és a cégek sem tudtak ilyen kísérletről. Később kiderült, hogy Toner-Rodgers a corningresearch.com domaint is beregisztrálta, mintha kapcsolatban állna a vállalattal, a Corning és a 3M azonban tagadta, hogy adatot adtak volna neki. Az MIT belső vizsgálata is arra jutott, hogy nemcsak módosította, hanem feltehetően teljesen kitalálta az adatokat és a kísérletet. Egy WhatsApp-üzenetben elismerte, hogy hamis adatkezelési megállapodást készített, bár továbbra is azt sugallta, hogy az adatok valósak voltak. Az ügy sokkolta a tanszéket, és arra késztette a kutatókat, hogy szigorúbb ellenőrzési mechanizmusokat vezessenek be, mivel, ahogy Acemoglu fogalmazott, a jövőben „paranoidabbak” lesznek az ilyen esetek miatt.

A Wall Street Journal képet is közöl Toner-Rodgersről, mely egy korábbi cikkhez készült, még a „karrierje csúcsán”. A kép alapján tulajdonképpen egyértelmű, hogy miért hitt neki mindenki: búskomor tekintet, kicsit kinyúlt pulóver, kopott farmer, egy tábla előtt, melyen teljesen jelentéktelen firkák vannak. Ha szemüveges lett volna, borostás és a táblán egy egyenlőségjel is szerepelt volna, akkor valószínűleg sosem bukik le.

Felmerül a kérdés, hogyan lehetett, hogy bár Nobel-díjas konzulensén át a Kongresszusig ért el a tanulmány, az informatikai szakemberek mégis hamar gyanút fogtak. Minden bizonnyal több tényező is szerepet játszott, az akadémiai ösztönzőktől kezdve, a politikai populizmuson át, a funkcionális analfabetizmussal bezárólag.

Az MI jelenlegi formájában, elsődlegesen a nagy nyelvi modelleken (LLM) keresztül új, ismeretlen terület a fogyasztóknak, politikusoknak és tulajdonképpen a terület szakértőin kívül mindenki számára. Ezzel szöges ellentétben áll, hogy mindössze egy interneteléréssel bárki „early adopterré,” azaz korai felhasználóvá válhatott. Ugyanakkor szinte mindent MI (vagy AI, „artificial intelligence”) jelzővel kezdtek illetni a marketingesek, például az évtizedek óta létező digitális felskálázást hirtelen „AI képjavításnak” hívják a TV gyártók, de egy ügyfélszolgálat számválasztós menüjében is „AI asszisztensek” segítenek eligazodni. Kétségtelen, hogy voltak valódi áttörések és felfedezések az AI területén, de a mindent elsöprő átcímkézés is szembetűnő.

Mivel a gazdaság és a technológia minden területét átszövi az MI forradalom, akár valós, akár szimbolikus formában, a szabályozóknak is lépniük kell. Természetesen vannak rendkívül fajsúlyos kérdések, például, hogy mit lehet szabadon felhasználni az LLM modellek tanításához, vagy hogy a generatív modellek csak korábbi szerzői joggal védett műveket másolnak-e. Ugyanakkor láthatóan senki nem akar rossz színben feltűnni és egy esetleges gazdasági paradigmaváltás útjába állni. Ebből adódóan egy kutatás, mely számszerűen bizonyítja az MI hatását a termelékenységre, rendkívül jelentős támpont lehet.

Az idézett tanulmány ezért kapott rendkívül nagy figyelmet a nyilvánosságtól, azonban azt is fontos kiemelni, hogy az akadémia hirtelen elfelejtette, hogy mi is az a tudományos módszer. Ehhez az vezetett, hogy a tanulmány egy új területen volt az első, ráadásul elvileg nem egyszerű utólagos megfigyelésen, hanem kísérleten alapult, márpedig a randomizált kísérletek számítanak a legerősebb eredménynek a társadalomtudományok területén. Ezt csak megkoronázta, hogy a kutatás pontosan azt állította be szignifikáns tényként, amit mindenki hallani akart.

A kísérleteknél mindig van egy bizalmi elem, elhisszük a kutatónak, hogy tényleg lefolytatta a vizsgálatokat. Ez már többeket megkísértett, több érdekes eredményről derült ki, hogy teljes hazugság. Pedig nagyszerű lenne, ha valakit azzal becsületesebb viselkedésre lehetne sarkallni, ha már előre aláíratunk vele egy jegyzőkönyvet, mint ahogy az Francesca Gino harvardi ex-professzor kutatása javasolta. Hasonlóan, fantasztikus eredmény lenne, ha a szemét feltakarítása garantálná, hogy az emberek kevésbé legyenek rasszisták, ahogy azt Diederik Stapel állította karrierje vége előtt. Ugyanígy, remek lenne, ha az LLM modellek összességében termelékenyebbé tennék a vállalatokat.

Bár a tanulmány és Toner-Rodgers is eltűnt, úgy tűnik, hogy a szellemet kiengedte a palackból. Ugyan folyamatosan lehet arról hallani, hogy az AI vállalatok értékelése túl magas, azt manapság már senki nem kérdőjelezi meg, hogy az LLM növeli a termelékenységet, annak ellenére, hogy a jelenleg elérhető kutatások szerényebb és ellentmondásosabb következtetéseket fogalmaznak meg.

Megjegyzés: az eredeti Wall Street Journal cikk összefoglalója részben a ChatGPT segítségével készült.

Barkó Tamás


Borítókép: Google Gemini által generált