SINISCALCHI SABATO MARCO
Siniscalchi Sabato Marco foto
Qualifica
Professore Ordinario
Orario di ricevimento
Basi di Dati - Ricevimento il Martedì dalle ore 11:00 alle ore 12:00 Programmazione e Laboratorio - Ricevimenti il Martedì dalle 12:00 alle 13:00
Settore Scientifico Disciplinare
ING-INF/05 - Sistemi di elaborazione delle informazioni
Settore Concorsuale
09/H1
Note biografiche
Dottore di Ricerca in Ingegneria Informatica, Automatic Speech Processing
Curriculum accademico
Note biografiche
Dottore di Ricerca in Ingegneria Informatica, Automatic Speech Processing


* Associate Professor, SSD ING-INF/05, Università degli Studi di Enna dal 05/2015-oggi
* Assistant Professor, SSD ING-INF/05, Università degli Studi di Enna dal 05/2010-04/2015
* Faculy Affiliate, Georgia Institute of Technology, Atlanta (GA), USA dal 03/2011
* Researcher,Norwegian University of Science and Technology (Trondheim, Noway) dal 01/10/2006 31/12/2010
* PostDoctoral Fellow, Georgia Institute of Technology (Atlanta, USA) dal 01/09/2005 al 28/12/2006
* Visiting Ph.D. Student, Georgia Institute of Technology, Atlanta (GA), USA dal 01/2004 al 07/2005.


Progetti Internazionali Finanziati

* RESPONSABILE SCIENTIFICO insieme al prof. T. Svendsen della NTNU per il progetto AULUS: Atomic units for language universal representation of speech. Inoltre il Prof. Siniscalchi si occuperà del coordinamento del WP4 del progetto. Project no 240282/O70. Funding Agency: Research Council of Norway - RCN .Total budget ¤ 1.34 million. Partner Accademici: Norwegian University of Science and Technology - NTNU (Norvegia), Eurecom (Francia) e Università di Enna "Kore" (Italia). I fondi di ricerca assegnati dal Research Council of Norway (Norwegian: Norges forskningsråd) sono assegnati sulla base di bandi competitivi che prevedono la revisione tra pari in modo del tutto analogo all'assegnazione dei fondi PRIN del MIUR. Il Research Council of Norway è un'agenzia governativa norvegese responsabile dell'assegnazione di contributi per la ricerca e promozione della ricerca e della scienza. Inoltre tale agenzia consiglia il governo in materia di ricerca, ed è subordinata al Ministero Norvegese dell'Istruzione e della Ricerca (https://www.forskningsradet.no/en/The_Research_Council/1138785832539). In allegato: (i) la copia conforme all'originale della lettera del Prof. Geir Egil Dahle Øien, Preside della Facoltà di Ingegneria, (ii) la copia conforme all'originale della proposta progettuale e (iii) la copia conforme all'originale della lettera di approvazione del progetto. Data di inizio progetto Gennaio 2015 - Data di fine progetto Dec 2019. Durata: 48 mesi (4 anni).

Relatore

* RELATORE INVITATO presso il Microsoft Research Center della Microsoft Research Corporation, Redmond, WA, USA 2008. Titolo della Relazione: A DETECTION BASED APPROACH TO AUTOMATIC SPEECH RECOGNITION 20/05/2008
* RELATORE INVITATO presso SIRI Speech Group della Apple Inc., Cupertino, SA, USA 2017. Titolo della Relazione: Transfer Learning and Signal Space Enhancement for Robust Automatic Speech Recognition

Direzione Gruppi di Ricerca

* DIRETTORE della struttura di ricerca per la cooperazione scientifica internazionale denominata "Laboratory fro Speech Technology Research and Machine Learning" - in breve STMLab. La struttura è stata instituita con Decreto del Presidente n. 149/2016 il 25 ottobre 2017. Link: https://www.unikore.it/index.php/presentazione-lab-stmb. Rientrano nell'ambito delle competenze del laboratorio quelle legate alla progettazione e alla realizzazione di sistemi di elaborazione atti a migliorare l'interazione persona-calcolatore e la cooperazione sociale. Tutte le attività di ricerca internazionali dirette dal Prof. Siniscalchi ed indicate nei diversi punti relativi al Titolo b della presente domanda sono a partire dall'ottobre 2016 nelle attività della struttura di ricerca. In particolare, la struttura vanta attività di cooperazione scientifica internazionale per l'elaborazione del parlato e il miglioramento dell'interazione uomo-macchina i seguenti centri/strutture di ricerca e università: * School of Electrical and Computer Engineering - ECE, Georgia Institute of Technology, Atlanta (GA) USA (Gruppo del Prof. C.-H. Lee) - Speech Group at the Norwegian University of Science and Technology - NTNU, Trondheim, Norway (Gruppo del Prof. T. Svendsen) - Research Center for Information Technology Innovation, Academia Sinica - Taipei, Taiwan (Gruppo del dott. Y. Tsao) - School of Computing della University of Eastern Finland, Joensuu, Finlandia (Gruppo del Dott. Ville Hautamaki) - Bing Speech and Language Sciences, Microsoft Corporation, Redmond, WA 98052 USA (Gruppo del dott. Jinyu Li, Principal Applied Scientist) - Siri Speech Group, Apple Ing., Cupertino, CA USA (Gruppo del dott. Alex Acero)

Responsabilità di Studi e Ricerche Scientifiche

* RESPONSABILE di Ricerche Scientifiche affidate dalla NOKIA. Le date indicate di seguito corrispondono a quelle di inizio delle ricerche scientifiche e conclusione delle attività avvenuta con la consegna del report finale. Si allega il rapporto finale di conclusione delle attività, 2015
* RESPONSABILE delle attività di studio e ricerca affidato dalla Apple Inc., multinazionale tecnologica con sede in Cupertino, California USA, relativi ai prodotti Apple abilitati dall?assistente virtuale Siri con l'obiettivo di migliorare la qualità, l?efficienza e l?efficacia delle interazioni persona-calcolatore in un ambiente intelligente. L'ambizione del Siri Speech Group della Apple Inc. è di realizzare l'assistente virtuale che possa cambiare, in modo radicale, il modo in cui le persone interagiscono con la tecnologia (human-computer interaction/interazione persona-calcolatore) al fine di abilitare una nuova classe di dispositivi ed aiutare i clienti Apple a vivere meglio le proprie vite, 2017-2018

Attività editoriale
* ASSOCIATE EDITOR - IEEE/ACM Transactions on Audio Speech and Language Processing, ISSN: 2329-9290 Link: http://signalprocessingsociety.org/publi cations-resources/ieeeacm-transactions-audio-speech-and-language-processing/editorial-board dal 2015

Partecipazione al collegio dei docenti ovvero attribuzione di incarichi di insegnamento, nell'ambito di dottorati di ricerca

* INCARICO DI INSEGNAMENTO - Lecturer in the International Ph.D. course on "Automatic speech recognition - advanced topics" (7.5 ECTS) - The Nordic Graduate School of Language Technology (NGSLT). Il corso è stato svolto presso la Norwegian University of Science and Technology (NTNU), Trondheim, Norvegia, 2008
* PARTECIPAZIONE al COLLEGIO dei DOCENTI nell'ambito del Dottorato in ARCHITETTURA DEI SISTEMI PER LA MOBILITA', Ciclo XXVIII, Università degli Studi di Enna "Kore", Enna Italia, Enna. Settore Scientifico Interessato (SSD): ING-INF/05
? PARTECIPAZIONE al COLLEGIO dei DOCENTI nell'ambito del Dottorato di Ricerca del Georgia Institute of Technology, Atlanta, GA, USA, in Computer Engineering. In particolare, il Prof. Siniscalchi ha fatto parte del collegio dei docenti che ha valutato l'attività scientifica svolta durante il programma di dottorato di Zhen Huang. La tesi è stata discussa presso il Georgia Institute of Technology il 5 Maggio del 2017.
* PARTECIPAZIONE al COLLEGIO dei DOCENTI nell'ambito di dottorati di ricerca accreditati dal Ministero, Ciclo XXXIII, Università degli Studi di Enna "Kore", Enna Italia, Enna. Ruolo: Componente del Gruppo dei 16. Qualifica: Professore Associato. Settore Concorsuale: 09/H1. Settore Scientifico Interessato (SSD): ING-INF/05. Area VQR-CUN: 09 Attività di interesse scientifico che saranno portate avanti dal Prof. Siniscalchi nell'ambito del dottorato: Sistemi informatici per la mobilità intelligente, con particolare attenzione a tutti gli aspetti di information technology e intelligenza artificiale pertinenti ai veicoli a guida autonoma

Fellowship

* FORMALE ATTRIBUZIONE DI INCARICO DI RICERCA - VISITING Ph.D. STUDENT FELLOWSHIP, Center for Signal & Image Processing (CSIP) - School of Electrical and Computer Engineering del Georgia Institute of Technology, Atlanta, GA, USA. Attività di collaborazione con il gruppo del Prof. Mark A. dal 05-01-2004 al 01-09-2005
* FORMALE ATTRIBUZIONE DI INCARICO DI RICERCA - POST-DOCTORAL FELLOWSHIP, Center of Signal and Image Processing, School of Electrical and Computer Engineering, Georgia Institute of Technology, Atlanta (GA), USA. Argomento di ricerca: Automatic Speech Recognition dal 01-09-2005 al 31-12-2006
* FORMALE ATTRIBUZIONE DI INCARICO DI RICERCA - RESEARCH SCIENTIST FELLOWSHIP, Norwegian University of Science and Technology, Trondheim, Norvegia. Argomento di Ricerca: A new machine learning framework to incorporate knowledge sources in a combined knowledge-based and data-driven paradigm dal 15-10-2006 al 31-12-2010
* FORMALE ATTRIBUZIONE DI INCARICO DI RICERCA - RESEARCH FELLOWSHIP, Georgia Institute of Technology, Atlanta, GA, USA. Tema di Ricerca: Automatic Speech Attribute Transcription dal 01-08-2007 al 10-10-2007
* FORMALE ATTRIBUZIONE DI INCARICO DI RICERCA - RESEARCH FELLOWSHIP, Georgia Institute of Technology, Atlanta, GA, USA. Tema di Ricerca: Automatic Speech Attribute Transcription dal 28-02-2009 al 09-04-2009
* VISITING RESEARCHER - School of Information Science and Technology, University of Tokyo,Tokyo, Giappone. Attività di ricerca: Applicazione di tecniche di machine learning (minimum classification error e maximal figure-of-merit) per il progetto MIREX 2008 Chord Detection Contest dal 13-04-2009 al 20-04-2009
* FORMALE ATTRIBUZIONE DI INCARICO DI RICERCA - RESEARCH FELLOWSHIP, Georgia Institute of Technology, Atlanta, GA, USA. Tema di Ricerca: Detection based continuous speech recognition (cfr. allegato e pubblicazioni) dal 01-07-2010 al 03-09-2010
* FORMALE ATTRIBUZIONE DI INCARICO DI RICERCA - RESEARCH FELLOWSHIP, Georgia Institute of Technology, Atlanta, GA, USA. Tema di Ricerca: Very Large vocabulary continuous speech recognition dal 14-03-2011 al 14-06-2011
* FORMALE ATTRIBUZIONE DI INCARICO DI RICERCA - RESEARCH FELLOWSHIP, Georgia Institute of Technology, Atlanta, GA, USA. Tema di Ricerca: Continuous speech dal 16-03-2012 al 15-06-2012


Honors & Awards

* IEEE Senior Member

* AFFILIATE PROFESSOR (Professore Affiliato) - School of Electrical and Computer Engineering, Georgia Institute of Technology, Atlanta, GA, USA. Il Georgia Institute of Technology occupa il 25° posto secondo il QS World University Rankings by Subject 2016 per i temi di interesse dell?ingegneria informatica.

* Certificate for Highly Cited Research in Computer Speech & Language. Il riconoscimento è stato conferito nel Dicembre 2016 al Prof. Siniscalchi a riconoscimento del contributo alla qualità della rivista scientifica fatta dalla pubblicazione scientifica: Siniscalchi S.M., Reed J., Svendsen T., Lee C.-H. (2013). Universal attribute characterization of spoken languages for automatic spoken language recognition. COMPUTER SPEECH AND LANGUAGE, vol. 27, p. 209-227, ISSN: 0885-2308, doi: 10.1016/j.csl.2012.05.001 La stessa pubblicazione scientifica ha ottenuto una valutazione pari ad ECCELLENTE (Punteggio 1.0) nella Campagna VQR 2011-2014 SSD (Id della pratica: 2015-PVQR-0135), Settore ING-INF/05 - Sistemi di Elaborazione delle Informazioni (corrispondente al settore concorsuale 09/H1).
Aree di interesse scientifico
Riconoscimento Automatico del Parlato, Interazione Persona-Calcolatore, Machine Learning, e Deep Neural Networks
Pubblicazioni principali

1. B. Wu, K. Li, F. Ge, Z. Huang, M. Yang, SINISCALCHI S. M, C.-H. Lee (2018). An End-to-End Deep Learning Approach to Simultaneous Speech Dereverberation and Acoustic Modeling for Robust Speech Recognition. IEEE J-STSP (Accepted)

2. Huang Z., SINISCALCHI S. M., and Lee C.-H. (2017). Hierarchical Bayesian Combination of Plug-in Maximum A Posteriori Decoders in Deep Neural Networks-based Speech Recognition and Speaker Adaptation. PATTERN RECOGNITION LETTERS, vol. 98, p. 1-7, ISSN: 0167-8655, doi: 10.1016/j.patrec.2017.08.001

3. Huang Z., SINISCALCHI S. M., and Lee C.-H. (2017). Bayesian Unsupervised Batch and Online Speaker Adaptation of Activation Function Parameters in Deep Models for Automatic Speech Recognition. IEEE/ACM TRANS. ON AUDIO SPEECH AND LANGUAGE PROCESSING, vol. 25 (1); p. 64-75, doi: 10.1109/TASLP.2016.2621669

4. SINISCALCHI S. M., and V. M. Salerno (2017). Adaptation to New Microphones using Artificial Neural Networks with Trainable Activation Functions. IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, doi:10.1109/TNNLS.2016.2550532

5. Z. Huang, SINISCALCHI S. M., and C.-H. Lee (2016). A Unified Approach to Transfer Learning of Deep Neural Networks with Applications to Speaker Adaptation in Automatic Speech Recognition. NEUROCOMPUTING, vol. 218; p. 448-459, doi:10.1016/j.neucom.2016.09.018

6. Behravan H., Hautamaki V., SINISCALCHI S. M., Kinnunen T., and Lee C.-H. (2016). i-Vector Modeling of Speech Attributes for Automatic Foreign Accent Recognition. IEEE/ACM Transactions on Audio Speech and Language Processing, vol. 24 (1); p. 29-41, ISSN: 2329-9290, doi: 10.1109/TASLP.2015.2489558

7. Lee C.-H., and SINISCALCHI S. M. (2013). An Information-Extraction Approach to Speech Processing: Analysis, Detection, Verification, and Recognition. PROCEEDINGS OF THE IEEE, vol. 101; p. 1089-1115, ISSN: 0018-9219, doi: 10.1109/JPROC.2013.2238591

8. SINISCALCHI S. M., Svendsen T., and Lee C.-H. (2013). A bottom-up modular search approach to large vocabulary continuous speech recognition. IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING, vol. 21; p. 786-797, ISSN: 1558-7916, doi: 10.1109/TASL.2012.2234115

9. SINISCALCHI S. M., Yu D., Deng L., and Lee C.-H. (2013). Speech recognition using long-span temporal patterns in a deep network model. IEEE SIGNAL PROCESSING LETTERS, vol. 20; p. 201-204, ISSN: 1070-9908, doi: 10.1109/LSP.2013.2237901

10. SINISCALCHI S. M., Li J., and Lee C.-H. (2013). Hermitian Polynomial for Speaker Adaptation of Connectionist Speech Recognition Systems. IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING, vol. 21; p. 2152-2161, ISSN: 1558-7916, doi: 10.1109/TASL.2013.2270370

11. SINISCALCHI S. M., Li J., and Lee C-H. (2013). Model-based margin estimation for hidden Markov model learning and generalisation. IET SIGNAL PROCESSING, vol. 7; p. 704-709, ISSN: 1751-9675, doi: 10.1049/iet-spr.2013.0036

12. R. E. Barone, T. Giuffrè, SINISCALCHI S. M., Morgana M. A., and Tesoriere G. (2014). Architecture for parking management in smart cities. IET INTELLIGENT TRANSPORT SYSTEMS, vol. 8; p. 445-452, ISSN: 1751-956X, doi: 10.1049/iet-its.2013.0045

13. SINISCALCHI S. M., Lyu D.-C., Svendsen T., Lee C.-H. (2012). Experiments on cross-language attribute detection and phone recognition with minimal target-specific training data. IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING, vol. 20; p. 875-887, ISSN: 1558-7916, doi: 10.1109/TASL.2011.216761

14. Birkenes O., Matsui T., Tanabe K., SINISCALCHI S. M., Myrvoll T.A., Johnsen M.H. (2010). Penalized logistic regression with HMM log-likelihood regressors for speech recognition. IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING, vol. 18; p. 1440-1454, ISSN: 1558-7916, doi: 10.1109/TASL.2009.2035151

15. SINISCALCHI S. M., Reed J., Svendsen T., and Lee C.-H. (2013). Universal attribute characterization of spoken languages for automatic spoken language recognition. COMPUTER SPEECH AND LANGUAGE, vol. 27; p. 209-227, ISSN: 0885-2308, doi: 10.1016/j.csl.2012.05.001

16. SINISCALCHI S. M., Yu D., Deng L., and Lee C.-H. (2013). Exploiting Deep Neural Networks for Detection-Based Speech Recognition. NEUROCOMPUTING, vol. 106; p. 148-157, ISSN: 0925-2312, doi: 10.1016/j.neucom.2012.11.008


17. SINISCALCHI S. M. (2012). Combining Speech Attribute Detection and Penalized Logistic Regression for Phoneme Recognition. NEUROCOMPUTING, vol. 93; p. 10-18, ISSN: 0925-2312, doi: 10.1016/j.neucom.2012.02.037


18. SINISCALCHI S. M., Lee C.-H. (2009). A study on integrating acoustic-phonetic information into lattice rescoring for automatic speech recognition. SPEECH COMMUNICATION, vol. 51; p. 1139-1153, ISSN: 0167-6393, doi: 10.1016/j.specom.2009.05.004

19. SINISCALCHI S. M., Svendsen T., and C.-H. Lee (2014). An Artificial Neural Network Approach to Automatic Speech Processing. NEUROCOMUTING, vol. 140; p. 326-338, ISSN: 0925-2312, doi: 10.1016/j.neucom.2014.03.005