Për gati 20 vjet, një profesor i shkencave kompjuterike në Universitetin e Kentakit, i quajtur Brent Seales, u përpoq të zhvillonte softuerë për të hapur pergamenat e lashta që ishin djegur dhe groposur gjatë shpërthimit të malit Vezuv në vitin 79 pas Krishtit. Përfundimisht iu bë e qartë se puna ishte e vështirë për një ekip të vetëm, kështu që ai mendoi të përdorte përparime të shpejta në fushën e IA-së. Më pas ai kishte një ide tjetër, edhe më të guximshme: ta kthente projektin në një konkurs mbarëbotëror me burim të hapur.
Të kombinuara, këto ide nxitën një përparim. Që nga fillimi i saj në mars 2023, Sfida e Vezuvit – e financuar nga investitorët e teknologjisë Nat Friedman (ish-CEO i Github) dhe sipërmarrësi Daniel Gross, ndër të tjera – ka bërë më shumë përparim drejt zbërthimit dhe leximit të pergamenave sesa mund ta imagjinonte dikush. Të mësuarit e makinerisë automatizoi procese që do t’u duhej qenieve njerëzore dekada për t’i përfunduar, ndërsa konkurrenca gjeneroi një rrjet shumëkombësh mendjesh të ndritura që punonin së bashku dhe jo kundër njëra-tjetrës.
Talenti shpesh vjen nga vende të papritura, dhe Sfida e Vezuvit nuk ishte përjashtim. Fituesit e Çmimit të Madh të tij të lakmuar – 700,000 dollarë që u dha më 5 shkurt – nuk ishin profesorë të dalluar nga universitete prestigjioze, por tre studentë të rinj premtues, njëri prej të cilëve është ende student. Ja si e bënë.
Problemi i zbërthimit
Julian Schilliger mësoi për Sfidën e Vezuvit muajin që u shpall. Duke u mbështetur në atë që mësoi duke studiuar shkencën e të dhënave në Freie Universität Berlin dhe duke ndërtuar robotë humanoidë në kohën e tij të lirë, ai i hyri punës për problemin e parë të konkursit dhe ndoshta që i merrte më shumë kohë: segmentimi. Në zhargonin e Vezuvit, segmentimi nënkupton krijimin e kodit që mund të zbërthejë në mënyrë dixhitale skanimet CT të pergamenave, të cilat janë shumë të brishta për t’u trajtuar fizikisht, duke lejuar nga ana tjetër inteligjencën artificiale të kërkojë modele të zbehta të bojës në sipërfaqen e nxirë.
“Është një problem me shikimin e kompjuterit,” thotë ai për Freethink. “Pergamenat e papirusit të mbështjellë janë të vështira për t’u lexuar, e lëre më për t’u ekstraktuar. Softueri im përmirësoi një mjet tashmë ekzistues të zhvilluar nga EduceLab të quajtur Volume Cartographer, duke i mundësuar që të kalojë nga segmente të vogla 2 milimetrash në afërsisht 3000 centimetra katrorë – duke e përmirësuar ekstraktimin e fletës me 10,000 herë!”
Megjithëse Schilliger kishte fituar tashmë disa nga çmimet më të vogla të sfidës, ky zbulim e ndihmoi atë të vinte në kontakt me Youssef Nader-in dhe Luke Farritor-in, puna e të cilëve për zbulimin e bojës kishte zbuluar fjalët e para të lexueshme në konkurs ku ata kishin fituar çmimin e lakmuar prej 40,000 dollarësh në tetor. “Për ta ishte e qartë,” reflekton Schilliger. “Zgjidhja e problemit të segmentimit ishte një nga kërkesat e Çmimit të Madh, dhe kështu ata donin që unë të isha në ekipin e tyre.”
Duke punuar së bashku me Nader-in dhe Farritor-in, Schilliger zhvilloi ThaumatoAnakalyptor, një mjet segmentimi plotësisht i automatizuar që mund t’i zbërthejë në mënyrë dixhitale pergamenat pa i zbërthyer ato. “Funksionon duke nxjerrë pika sipërfaqësore nga skanimi CT dhe duke i grupuar pikat në fletë,” shpjegon Schilliger. “Fletët përkthehen në një rrjetë duke përdorur një rindërtim të sipërfaqes Poisson, i cili më pas mund të përdoret për të teksturuar një version të zbërthyer.
Falë ThaumatoAnakalyptor, Nader dhe Farritor tani kishin një sipërfaqe të madhe dhe të sheshtë për të punuar. Ky ishte një lajm i mrekullueshëm duke pasur parasysh se, për Çmimin e Madh, ata duhej të rikuperonin jo fjalët, por fjalitë: 4 pasazhe me 140 karaktere secila, për të qenë të saktë.
Në kërkim të bojës
Ana e zbulimit të bojës së konkurrencës paraqiste gjithashtu probleme të mëdha. “Meqenëse boja dhe papirusi janë të dy prej karboni, ato kanë pamje të ngjashme me rrezet X, kështu që nuk është e lehtë të shihet boja në skanime,” shpjegon Stephen Parsons, një studiues vizitor nga Iniciativa e Restaurimit Dixhital në Angli dhe këshilltar kërkimor për Sfidën e Vezuvit. “Në disa raste, boja është mjaft e trashë, saqë tekstura e saj mund të vërehet drejtpërdrejt, e cila i ngjan bojës së plasaritur ose baltës së krisur. Këto mund të etiketohen, duke i treguar një algoritmi që janë bojë. Algoritmet mund të trajnohen dhe përdoren për të zbuluar se ku tjetër mund të jetë boja. Duke i marrë në mënyrë të përsëritur këto parashikime dhe duke i pastruar ato, dhe duke trajnuar sërish algoritme, gradualisht ata mësojnë të zbulojnë gjurmë më delikate. Kur zbatohet në një pjesë të pergamenës, ajo do të zbulojë tekstin.”
Pengesa më e madhe, thotë Nader-i për Freethink, “ishte si të merrje më shumë shkronja. Kishte zona që ishin krejtësisht të errëta dhe ne po përpiqeshim të kuptonim pse shkronjat nuk po shfaqeshin atje. Përfundimi ynë ishte se ndoshta shkronjat nuk humbën në segmentim, por se modelet e bojës duhej të përmirësoheshin. Kalova shumë kohë duke bërë modele më të forta për t’i nxjerrë ato shkronja dhe më në fund arritëm të plotësonim kushtin fitues të lexueshmërisë prej 85%.
Për Naderin, fitimi i çmimit Shkronjat e Para e bëri të ndihej optimist dhe i kujdesshëm. “Kisha frikë,” thotë ai, “sepse e dija se kisha modelin më të mirë dhe isha përpara, por komuniteti i kësaj sfide ishte i ditur dhe me kalimin e kohës të tjerët do ta arrinin, gjë që zgjati vetëm disa javë. 85% ishte një objektiv i vështirë dhe ngadalësoi përparimin. Megjithatë, pasi kisha punuar me shkronjat e para, kisha një instinkt se si të shtyja përpara. Gjatë gjithë tetorit, nëntorit, dhjetorit, procesi i suksesit tonë ishte mjaft i luhatshëm. Në fund, megjithatë, ne fituam jo vetëm me kalimin e kohës, por edhe duke qenë skuadra e vetme që arriti kushtet e fitores.”
Në fund të vitit të tij të parë, Sfida e Vezuvit ka arritur të deshifrojë 5% të një pergamene të lashtë, duke ringjallur një tekst që nuk është lexuar për mijëvjeçarë: “Në rastin e ushqimit, ne nuk besojmë menjëherë se gjëra që janë të rralla të jen më të këndshme se ato që janë të bollshme”, thuhet në një rresht. “…sepse ne nuk përmbahemi nga vënia në dyshim e disa gjërave, por duke kuptuar/kujtuar të tjerat”, thotë një tjetër. “Dhe le të jetë e qartë për ne të themi gjëra të vërteta, siç mund të jenë dukur shpesh të dukshme!”
Robert Fowler, një profesor emeritus i greqishtes në Universitetin e Bristolit, i cili analizoi tekstin, beson se ajo është një kopje e një vepre të Filodemusit, një student i filozofit të famshëm athinas Epikurus – një përfundim që ai kishte arritur që në njoftimin e çmimit Shkronjat e Para.
Vezuvi 2024
Sfida e Vezuvit nuk ka mbaruar. Përkundrazi, sapo ka filluar, me vitin 2024 që sjell detyra më ambicioze dhe shpërblime më të mëdha. Çmimi i Madh i vitit 2024 do t’i shkojë ekipit të parë që do të arrijë të deshifrojë jo më pak se 90% të një teksti – një arritje që do t’i sjellë gjithsej 100,000 dollarë. Organizatorët e sfidës shpresojnë që, me këtë moment historik, IA-ja do të jetë në gjendje të lexojë të gjitha 1800 pergamenat që janë gjetur nga rrënojat pranë Vezuvit, dhe ndoshta mijëra të tjera që do të zbulohen – për të mos përmendur dokumente të tjera të lashta, të brishta, si p.sh. pergamenat e Detit të Vdekur.
Edhe pse shumë njerëz u habitën nga suksesi i sfidës, Seales në fakt e kishte parë atë që po vinte. “Unë mund të kem qenë zëri i vetëm që parashikon mundësinë e suksesit në 90% ose afër sigurisë,” pranon ai. “Por baza shkencore për pritshmëritë e mia ishte e qartë para se të nisnim konkursin. Besoja se ishte çështje kohe dhe përshpejtimi, gjë që ishte pikërisht ajo që ofronte konkursi.”