FBK > IT > MPBA

Opportunities

Stage/Theses

Available projects for under graduate / Master students are available (see "Progetti di Stage e tesi" below in Italian), but candidate proposals for stage and theses in machine learning for bioinformatics and geoinformatics will be considered.

For a complete list of previous projects in this research unit see: http://mpba.fbk.eu/en/dissertations

Work Opportunities

Positions will be advertised at Jobs.

Progetti di stage e tesi presso FBK, Unita' di Ricerca “Modelli Predittivi per la Biomedicina e l'Ambiente” 

 

Per tutti questi progetti, il profilo indicato e' quello di una studentessa o studente con buone basi di calcolo numerico e di programmazione (con preferenza per C e Python) e forte interesse nel settore del machine learning o dell'elaborazione di segnale. E' indispensabile una discreta conoscenza della lingua Inglese.

Saranno messi a disposizione un posto di lavoro, tutoring da parte di un Senior Researcher e un Tecnologo di FBK, accesso a risorse di calcolo scientifico fino al livello di Cluster ad alte prestazioni. Sarà garantita un'esperienza nell'utilizzo anche applicato di metodi avanzati di machine learning a sostegno della ricerca in bioinformatica o di modellistica territoriale.

Sono disponibili altri temi vicini a questi argomenti e se ci fosse forte richiesta possiamo parlarne agli interessati direttamente. Al solito, il lavoro richiesto dipende dalle capacità degli studenti, che potrebbero completarne anche solo una parte o collaborare tra loro. Studenti particolarmente interessanti potrebbero essere candidati ad una posizione part time di programmatore scientifico al termine dello stage.

Per una lista dei progetti precedenti presso questo laboratorio, vedere: http://mpba.fbk.eu/en/dissertations

 

PROGETTI 2010

 

1.  Algoritmi di ottimizazione per kernel machines.

Gli algoritmi di classificazione/regressione basati su kernel (esempio base: Support Vector Machines) hanno dal punto di vista implementativo un'importante criticita' nell'algoritmo scelto per la massimizazione del margine, ovvero per l'ottimizzazione della soluzione del problema quadratico associato. Uno degli algoritmi piu' classici e' Sequential Minimal Optimization (SMO), ma sono stati proposti metodi alternativi con prestazioni computazionalmente migliori. In questo progetto saranno considerati ed implementati uno o piu' metodi recenti. L’attività sarà accompagnata da una fase di testing su dataset sintetici e reali, con una particolare attenzione a dati molecolari di altissima dimensione (DNA microarray). Il progetto si inserisce nel programma di sviluppo del sistema MLPY (https://mlpy.fbk.eu) , una delle principali iniziative per il machine learning open source a livello internazionale.

 

2. Metodi di randomizzazione per algebra lineare.

Gli algoritmi di fattorizzazione per matrici (es. SVD) sono componenti fondamentali di metodi di machine learning supervisionato o non. Tuttavia alcune applicazioni (es. bioinformatica) possono ora richiedere di scomporre una matrice con un numero di righe/colonne dell'ordine del milione, e sono difficilmente gestibili con metodi standard anche per calcolatori di ultima generazione. Il caso di matrici molto rumorose diventa particolarmente difficile in queste situazioni.

In questo progetto si intende studiare la tecnica della decomposizione approssimata di matrici (http://arxiv.org/abs/0909.4061) , che introduce una soluzione della SVD tramite  strutture (matrici e vettori) casuali con ottimi risultati. Si intende quindi trasferire codice esistente in una versione ad altissime prestazioni in grado di operare efficacemente su matrici originate da milioni di variabili e decine di migliaia di campioni.  Il progetto prevede un’applicazione, in collaborazione con esperti bioinformatici, a dataset di grandissime dimensioni derivati da un progetto internazionale di screening genomico dell’autismo. Per gli interessati, sarà possibile studiare implementazioni su cluster HPC o GPGPU.