Hello Campania
Dati linguistici e analisi
Raccolta e analisi di dati linguistici per il progetto "Hello Campania" (Università di Napoli Federico II e L'Orientale). Il lavoro ha trasformato registrazioni audio grezze in dataset strutturati per la ricerca e la documentazione linguistica.
Trasformare audio provenienti da contesti reali in dati linguistici strutturati e analizzabili, con alta fedeltà e coerenza dei metadati.
Pipeline ibrida: WhisperX per trascrizione automatica, allineamento e diarizzazione, poi ELAN per annotazione e segmentazione manuale multilivello.
Dataset affidabile e strutturato, pronto per analisi linguistica e documentazione, con un workflow rigoroso e replicabile per dati orali complessi.