4 dicembre 2025
In occasione del "Master in in Gestione e Conservazione dei Dati" di Trieste, i data steward di NODC, insieme ad altri rappresentanti della sezione di Oceanografia dell'OGS, hanno tenuto un seminario sul flusso di lavoro implementato dall'Istituto per la gestione dei dati, dall'acquisizione in mare all'elaborazione e alla distribuzione.
La seconda edizione del Master, organizzata da Area Science Park, ente nazionale di ricerca e innovazione, e dalla SISSA, una delle sei Scuole di Alta Formazione d'Eccellenza italiane, è iniziata il 15 settembre 2025 e proseguirà fino al 30 giugno 2026. L'obiettivo è preparare professionisti come Data Steward, Data Curator, Data Engineer e Research Data Manager per ruoli altamente richiesti all'interno di istituti di ricerca, infrastrutture scientifiche e organizzazioni private che lavorano con i big data. Il programma del Master va oltre la teoria, offrendo ai partecipanti tirocini pratici di sei mesi presso laboratori di ricerca e aziende leader.
Durante il seminario tenuto da OGS il 3 dicembre, i relatori hanno spiegato come il flusso di lavoro fornisca dati marini affidabili e quasi in tempo reale, in conformità con i principi FAIR, che richiedono che i dati siano reperibili, accessibili, interoperabili e riutilizzabili. Il flusso di lavoro è integrato con le Infrastrutture di Dati Blu (BDI) europee come SeaDataNet, l'infrastruttura paneuropea per la gestione dei dati oceanici e marini, EMODnet, la Rete Europea di Osservazione e Dati Marini, e le Infrastrutture di Ricerca Europee. Questa integrazione garantisce il rispetto dei principi FAIR, poiché l'adozione di standard, protocolli e strumenti internazionali è obbligatoria per la partecipazione ai sistemi europei di acquisizione e gestione dei dati marini.
La rete di monitoraggio marino e meteorologico del Golfo di Trieste è il primo anello del flusso di lavoro. OGS gestisce il sistema di osservatori marini per conto della Protezione Civile, della Regione Friuli Venezia Giulia e di ARPA (Agenzia Regionale per la Protezione Ambientale). I dati raccolti dalle stazioni in situ sono strutturati secondo gli standard SeaDataNet e OceanSites, arricchiti con metadati completi, e armonizzati utilizzando vocabolari controllati. Questi ultimi sono indispensabili al fine di eliminare ambiguità semantiche e automatizzare la sua distribuzione e riutilizzo a lungo termine. I dati vengono elaborati automaticamente, archiviati in un database PostgreSQL e pubblicati quasi in tempo reale tramite ERDDAP™ (Environmental Research Division Data Access Program), una piattaforma open source che supporta l'accesso e la visualizzazione dei dati multiformato. ERDDAP™ fornisce servizi web RESTful, garantendo l'interoperabilità con ambienti analitici come R e Python e facilitando flussi di lavoro automatizzati per la scoperta e il riutilizzo dei dati.
"Abbiamo ritenuto essenziale fornire agli studenti del Master in Data Management and Curation di Trieste una comprensione concreta dei processi che governano la gestione dei dati secondo i principi FAIR", afferma Elena Partescano, data steward presso NODC. Prosegue: "Il seminario, condotto da alcuni data steward di NODC e da ricercatori dell'OGS, ha illustrato in modo efficace il flusso di lavoro che, dalla raccolta dei dati in mare alla loro distribuzione, garantisce qualità, standardizzazione e interoperabilità. L'integrazione con le infrastrutture europee e l'utilizzo di piattaforme come ERDDAP™ sono esempi chiave che speriamo di trasmettere ai futuri professionisti della gestione dei dati."
Per saperne di più sul flusso di lavoro, guarda la "presentazione tenuta dall'OGS"