Novi pristup za poboljšanje procjene nesigurnosti u modelima strojnog učenja: skalabilna metoda za primjenu u zdravstvu i drugim kritičnim područjima

MIT-ovi istraživači razvili su učinkovit način za poboljšanje procjena nesigurnosti u strojnome učenju, omogućujući točnije i brže rezultate u primjenama poput zdravstva. Ova metoda pomaže korisnicima u donošenju informiranih odluka temeljenih na pouzdanosti modela.

Novi pristup za poboljšanje procjene nesigurnosti u modelima strojnog učenja: skalabilna metoda za primjenu u zdravstvu i drugim kritičnim područjima
Photo by: Domagoj Skledar/ arhiva (vlastita)

Današnja istraživanja u području strojnog učenja često se usredotočuju na procjenu nesigurnosti kako bi korisnici mogli bolje razumjeti koliko su odluke modela pouzdane. Ova procjena posebno je važna u situacijama gdje su ulozi visoki, poput prepoznavanja bolesti na medicinskim slikama ili filtriranja prijava za posao.

No, procjene nesigurnosti su korisne samo ako su točne. Ako model tvrdi da je 49 posto siguran da medicinska slika prikazuje pleuralni izljev, tada bi u 49 posto slučajeva taj model trebao biti u pravu.

Istraživači s MIT-a razvili su novi pristup za poboljšanje procjena nesigurnosti u modelima strojnog učenja. Njihova metoda generira preciznije procjene nesigurnosti u usporedbi s drugim tehnikama i to čini na učinkovitiji način.

Osim toga, ova tehnika je skalabilna i može se primijeniti na velike modele dubokog učenja koji se sve više koriste u zdravstvu i drugim situacijama gdje je sigurnost od ključne važnosti.

Ova tehnika može pružiti krajnjim korisnicima, od kojih mnogi nemaju stručnost u strojnome učenju, bolje informacije za procjenu pouzdanosti modela i odlučivanje o njegovoj primjeni u određenim zadacima.

Kvantificiranje nesigurnosti
Metode kvantificiranja nesigurnosti često zahtijevaju složene statističke izračune koji se teško skaliraju na modele strojnog učenja s milijunima parametara. Također, ove metode često zahtijevaju pretpostavke o modelu i podacima korištenim za njegovo treniranje.

MIT-ovi istraživači pristupili su ovom problemu na drugačiji način. Koristili su princip minimalne duljine opisa (MDL), koji ne zahtijeva pretpostavke koje mogu ograničiti točnost drugih metoda. MDL se koristi za bolje kvantificiranje i kalibriranje nesigurnosti za testne točke koje model treba označiti.

Tehnika koju su razvili istraživači, poznata kao IF-COMP, čini MDL dovoljno brzim za upotrebu s velikim modelima dubokog učenja koji se primjenjuju u mnogim stvarnim okruženjima.

MDL uključuje razmatranje svih mogućih oznaka koje model može dati za određenu testnu točku. Ako postoji mnogo alternativnih oznaka za tu točku koje dobro odgovaraju, povjerenje modela u odabranu oznaku treba proporcionalno smanjiti.

„Jedan način razumijevanja koliko je model siguran jest da mu se daju neke kontrafaktične informacije i da se vidi koliko je spreman promijeniti svoje uvjerenje“, kaže Nathan Ng, glavni autor studije i doktorand na Sveučilištu u Torontu koji je ujedno i gostujući student na MIT-u.

Na primjer, razmotrimo model koji tvrdi da medicinska slika prikazuje pleuralni izljev. Ako istraživači kažu modelu da ta slika prikazuje edem, a model je spreman promijeniti svoje uvjerenje, tada bi model trebao biti manje siguran u svoju izvornu odluku.

S MDL-om, ako je model siguran kad označava podatkovnu točku, trebao bi koristiti vrlo kratak kod za opis te točke. Ako nije siguran jer točka može imati mnogo drugih oznaka, koristi duži kod za obuhvaćanje tih mogućnosti.

Količina koda korištena za označavanje podatkovne točke poznata je kao stohastička složenost podataka. Ako istraživači pitaju model koliko je spreman promijeniti svoje uvjerenje o podatkovnoj točki s obzirom na suprotne dokaze, stohastička složenost podataka bi se trebala smanjiti ako je model siguran.

Ali testiranje svake podatkovne točke korištenjem MDL-a zahtijevalo bi ogromnu količinu računalne snage.

Ubrzavanje procesa
S IF-COMP-om, istraživači su razvili tehniku aproksimacije koja može točno procijeniti stohastičku složenost podataka koristeći posebnu funkciju, poznatu kao funkcija utjecaja. Također su koristili statističku tehniku nazvanu temperaturno skaliranje, koja poboljšava kalibraciju izlaza modela. Ova kombinacija funkcija utjecaja i temperaturnog skaliranja omogućuje visokokvalitetne aproksimacije stohastičke složenosti podataka.

Na kraju, IF-COMP može učinkovito proizvesti dobro kalibrirane procjene nesigurnosti koje odražavaju stvarno povjerenje modela. Tehnika također može utvrditi je li model pogrešno označio određene podatkovne točke ili otkriti koje su podatkovne točke izvanredne.

Istraživači su testirali svoj sustav na ova tri zadatka i otkrili da je bio brži i točniji od drugih metoda.

„Zaista je važno imati neku sigurnost da je model dobro kalibriran, a sve je veća potreba za otkrivanjem kada određena predikcija nije sasvim točna. Alati za reviziju postaju sve potrebniji u problemima strojnog učenja kako koristimo velike količine neprovjerenih podataka za izradu modela koji će se primjenjivati na probleme s kojima se suočavaju ljudi“, kaže Marzyeh Ghassemi, viša autorica studije.

IF-COMP je model-agnostičan, što znači da može pružiti točne procjene nesigurnosti za mnoge vrste modela strojnog učenja. To bi mu moglo omogućiti širu primjenu u stvarnim okruženjima, što bi na kraju pomoglo više praktičara da donose bolje odluke.

„Ljudi trebaju razumjeti da su ovi sustavi vrlo pogrešivi i da mogu donositi zaključke na temelju nedovoljnih podataka. Model može izgledati kao da je vrlo siguran, ali postoji mnogo različitih stvari u koje je spreman vjerovati s obzirom na suprotne dokaze“, kaže Ng.

U budućnosti, istraživači namjeravaju primijeniti svoj pristup na velike jezične modele i istražiti druge potencijalne primjene principa minimalne duljine opisa.

Izvor: Massachusetts Institute of Technology

Kreirano: srijeda, 17. srpnja, 2024.
Napomena za naše čitatelje:
Portal Karlobag.eu pruža informacije o dnevnim događanjima i temama bitnim za našu zajednicu. Naglašavamo da nismo stručnjaci u znanstvenim ili medicinskim područjima. Sve objavljene informacije služe isključivo za informativne svrhe.
Molimo vas da informacije s našeg portala ne smatrate potpuno točnima i uvijek se savjetujte s vlastitim liječnikom ili stručnom osobom prije donošenja odluka temeljenih na tim informacijama.
Naš tim se trudi pružiti vam ažurne i relevantne informacije, a sve sadržaje objavljujemo s velikom predanošću.
Pozivamo vas da podijelite svoje priče iz Karlobaga s nama!
Vaše iskustvo i priče o ovom prekrasnom mjestu su dragocjene i željeli bismo ih čuti.
Slobodno nam ih šaljite na adresu karlobag@karlobag.eu.
Vaše priče će doprinijeti bogatoj kulturnoj baštini našeg Karlobaga.
Hvala vam što ćete s nama podijeliti svoje uspomene!

AI Lara Teč

AI Lara Teč je inovativna AI novinarka portala Karlobag.eu koja se specijalizirala za pokrivanje najnovijih trendova i dostignuća u svijetu znanosti i tehnologije. Svojim stručnim znanjem i analitičkim pristupom, Lara pruža dubinske uvide i objašnjenja o najsloženijim temama, čineći ih pristupačnima i razumljivima za sve čitatelje.

Stručna analiza i jasna objašnjenja
Lara koristi svoju ekspertizu kako bi analizirala i objasnila složene znanstvene i tehnološke teme, fokusirajući se na njihovu važnost i utjecaj na svakodnevni život. Bilo da se radi o najnovijim tehnološkim inovacijama, probojima u istraživanjima, ili trendovima u digitalnom svijetu, Lara pruža temeljite analize i objašnjenja, ističući ključne aspekte i potencijalne implikacije za čitatelje.

Vaš vodič kroz svijet znanosti i tehnologije
Larini članci su dizajnirani da vas vode kroz kompleksni svijet znanosti i tehnologije, pružajući jasna i precizna objašnjenja. Njena sposobnost da razloži složene koncepte na razumljive dijelove čini njezine članke nezaobilaznim resursom za sve koji žele biti u toku s najnovijim znanstvenim i tehnološkim dostignućima.

Više od AI - vaš prozor u budućnost
AI Lara Teč nije samo novinarka; ona je prozor u budućnost, pružajući uvid u nove horizonte znanosti i tehnologije. Njeno stručno vodstvo i dubinska analiza pomažu čitateljima da shvate i cijene složenost i ljepotu inovacija koje oblikuju naš svijet. Sa Larom, ostanite informirani i inspirirani najnovijim dostignućima koje svijet znanosti i tehnologije ima za ponuditi.