Machine Learning probabilistikoa Big Datan, toolbox Amidst-ekin
Bayesen estatistikan oinarritutako Machine Learningen ikuspegi probabilistikoak metodo zientifikoa jarraitzen du. Lehenengo urratsa, hipotesi multzoa modu esplizituan definitzen da lengoaia grafikoaren laguntzarekin, kausalitate erlazioa sartzen laguntzen du (adib. Birus honek sintoma hau eragiten du), mekanismo ikusezinak (birus bat egotea) ere modelatu daitezke. Ondoren, probabilitate bat esleitzen zaio hipotesi bakoitzari. Azkenik, hipotesiak testatu egiten dira ebidentzia enpirikoa oinarri hartuta (hau da, datuak) ondoren probabilitatea kalkulatuz (datuak emanda). Horrela, probabilitate hori erabilita kalkulatu genezake zein den datuak ondoen azaltzen dituen hipotesia. Ikuspegi hori inpaktu handia izaten ari da beste arlo zientifiko askotan, genomikan, minbiziaren ikerketan, ekologian, finantzetan, etab.
Solasaldi honetan Amidst Toolbox deritzonari buruz hitz egingo dugu, softwarea pakete horrek Machine Learningen eredu probabilistiko orokorrak definitzeko aukera ematen du, eta ondoren datu multzo txiki zein handiei aplikatu hardware arkitektura desberdinak ustiatuz, hala nola multi-core CPUak (Java 8koak), ehunka nodo dituzten konputagailuen Klusterrak (Apache Flink, Apache Spark eta Amazon Web servicesen oinarrituta). Gainera, ikuspegi hori benetako erabilerako testuinguruan jarriko dugu, finantza arloan, milioika bezeroren profilak aztertzen diren lekuan. Gidatze autonomoaren arloan egin daitezkeen aplikazioei buruzko eztabaida ere egongo da.
DeustoTech Mobilityk antolatuta.