Potentzial handia duen arren, industria-inguruneetan Adimen Artifiziala erabiltzeak (hizkuntza-ereduetan, ordenagailu bidezko ikuspegian eta GPT-4, LLaMA, DALL-E edo CLIP bezalako eredu sortzaileetan egindako aurrerapenen bidez) oraindik oztopo esanguratsuak ditu. Ikuskapen bisualaren eta anomalien detekzioaren egungo soluzioak etiketatutako datu-bolumen handien mende daude, eta horrek kostu handiak dakartza. Gainera, eskuragarri dauden interfazeek ez dute giza hizkuntzan elkarrekintza naturalik ahalbidetzen, oinplanoan duten erabilgarritasuna mugatuz.
Testuinguru horretan, IKUN proiektuaren helburua da erronka horiek gainditzea, Eredu Multimodal Handiak edo LMMs (Large Multimodal Models) industria-testuingurura egokituz eta industria adimentsuago, autonomoago eta konektatuago baterako oinarriak ezarriz. Hala, IKUNek funtsezko hainbat erronka jorratzen ditu MLLMak industria-inguruneetan integratzeko:
- Industria-dataset multimodalak sortzea, eredu horiek ekoizpenaren berariazko eremura egokitzeko oinarri gisa.
- LMM egokitzeko teknikak ikertzea, eragiketa-baldintza errealetan eredu sendoak, azalgarriak eta fidagarriak bermatzeko.
- Datu sintetikoak sortzea, irudi industrialak eta denbora-serieak barne, ikusizko ikuskapenerako eta anomaliak detektatzeko sistema aurreratuak entrenatzeko, benetako datu-bolumen handirik behar izan gabe.
- Elkarrizketa-interfaze multimodalak garatzea, langileek sistemekin modu naturalean elkarreragin ahal izan dezaten (testua, ahotsa, irudia), ezagutza teknikora eta aginte-tauletara sarbidea erraztuz.
Proiektua hurbilketa praktiko eta progresibo batean oinarritzen da, pilotuen definiziotik eta benetako datu industrialen bilketatik hasi eta eredu multimodalak ingurune produktibora egokitzeraino. Irudi eta denbora-serieetarako eredu espezifikoak garatuko dira, eta langileen eta sistemen arteko elkarreragina hobetuko duten elkarrizketa-interfazeak arakatuko dira. Azkenik, garapen guztiak benetako industria-inguruneetan baliozkotuko dira, aplikagarritasuna eta transferentzia ziurtatzeko.
Espero diren emaitzak
- Dataset industrial multimodal argitaragabeak sortzea, eredu berrien entrenamendurako eta ebaluaziorako giltzarria.
- Kalitate handiko industria-denborazko irudi eta serie sintetikoak sortzea, benetako datuen mendekotasuna murrizteko.
- Elkarrizketa-laguntzaile adimendunak diseinatzea, langileei testu, ahots eta irudi bidez laguntzeko gai direnak, bai produkzio-lerroan, bai dokumentu-iturrien bidez (eskuliburuak, txosten teknikoak).
- Baliozkotutako prototipoak garatzea, tokiko ekosistema industrialera transferitzeko ahalmen handia dutenak.
IKUN proiektuaren partzuergoa honako hauek osatzen dute: BRTAko kide diren VICOMTECH (liderra), TECNALIA, IKERLAN, TEKNIKER eta AZTERLAN teknologia-zentroek; Euskal Herriko Unibertsitateak (UPV/EHU); IKOR TECHNOLOGY CENTER enpresa-arloko I+G unitateak; eta IMH Campus bitartekaritza-agenteak. Proiektu hau Eusko Jaurlaritzaren ELKARTEK 2024 (KK_2024 00064) programaren bidez finantzatu da: IKUN “Modelo multimodal handiak industria adimenduneko langileen kalitatea eta euskarria ziurtatzeko”.