Posizione idrologica multiordine per l'Europa: un insieme di funzionalità per l'apprendimento automatico e l'analisi in idrologia

Notizia

CasaCasa / Notizia / Posizione idrologica multiordine per l'Europa: un insieme di funzionalità per l'apprendimento automatico e l'analisi in idrologia

May 15, 2024

Posizione idrologica multiordine per l'Europa: un insieme di funzionalità per l'apprendimento automatico e l'analisi in idrologia

Dati scientifici volume 9, numero articolo: 662 (2022) Cita questo articolo 1059 Accessi 5 Dettagli metriche altmetriche Il set di dati presentato EU-MOHP v013.1.1 fornisce informazioni multiscala sulla

Dati scientifici volume 9, numero articolo: 662 (2022) Citare questo articolo

1059 accessi

5 Altmetrico

Dettagli sulle metriche

Il set di dati presentato EU-MOHP v013.1.1 fornisce informazioni multiscala sulla posizione idrologica (MOHP) di un punto geografico all'interno della rispettiva rete fluviale e bacino idrografico come mappe a griglia. Più precisamente, comprende le tre misure “divide to stream distance” (DSD) come somma delle distanze dal corso d’acqua più vicino e dallo spartiacque, “posizione laterale” (LP) come misura relativa della posizione tra il corso d’acqua più vicino e lo spartiacque e “distanza del flusso” (SD) come distanza dal flusso più vicino. Queste tre misure sono calcolate per nove ordini idrologici per riflettere diverse scale spaziali da locale a continentale. La sua estensione spaziale copre gran parte dello Spazio economico europeo (SEE39), che coincide in gran parte anche con l’Europa fisiografica. Sebbene esistano molteplici potenziali casi d’uso, questo set di dati serve prevalentemente come prezioso descrittore ambientale statico o variabile predittiva per la modellazione idrogeologica e idrologica come attività di mappatura o previsione utilizzando l’apprendimento automatico. La generazione di questo set di dati utilizza solo software open source gratuito e pertanto può essere trasferita ad altre regioni o set di dati di input.

Misurazione(i)

dividere per distanza del flusso • posizione laterale • distanza del flusso

Tipi di tecnologia

telerilevamento

Caratteristica del campione - Ambiente

bacino idrografico • spartiacque • bacino idrografico

Caratteristica del campione: posizione

Europa

Negli ultimi anni, gli strumenti di scienza dei dati come l’apprendimento automatico sono sempre più applicati e sviluppati specificamente per sfide idro(geo)logiche e questioni di ricerca1,2. Nel campo dell’idrogeologia, l’apprendimento automatico è stato utilizzato con successo per la previsione del livello delle acque sotterranee e per una varietà di attività di mappatura3,4,5,6,7,8,9,10,11,12,13. Poiché i modelli di machine learning, ad eccezione dei modelli ibridi o guidati dalla fisica, si basano esclusivamente su dati senza alcuna conoscenza dei processi fisici, è importante fornire caratteristiche significative (chiamate anche variabili predittive o esplicative) che influenzano la variabile target in modo che l'algoritmo di apprendimento automatico può modellare la funzione tra input e target. Per i processi superficiali e vicini alla superficie, questo criterio può essere più o meno soddisfatto dalla disponibilità di dati di telerilevamento, mentre per la modellazione dei processi sotterranei, come nel caso dell’idrogeologia, ciò rappresenta una sfida seria.

La motivazione principale di questo set di dati è quella di colmare parzialmente questa lacuna fornendo una serie di funzionalità che introducono il contesto idrologico ai modelli di apprendimento automatico riguardanti la posizione orizzontale di un punto all'interno del suo bacino idrografico. Le tre misure – determinate da questa posizione orizzontale – sono calcolate per diversi cosiddetti ordini idrologici. Gli ordini idrologici rappresentano diverse scale spaziali, da locale a regionale a continentale. Pertanto, le misure fungono da proxy per le caratteristiche geofisiche dei sistemi idrologici su più scale e integrano le caratteristiche comunemente disponibili e utilizzate come l’uso e la copertura del suolo, le mappe geologiche o del suolo. Questo set di dati è fortemente ispirato da Belitz et al.14 e adatta le loro idee e metodi al "EU-Hydro - River Network Database"15 ma, al contrario, utilizza software open source gratuito e una forte attenzione alla riproducibilità. Questo concetto potrebbe essere ulteriormente esteso spazialmente applicando i metodi presentati alla rete fluviale globale o ai set di dati idrografici, come HYDRO1k16 o MERIT Hydro-Vector17. Per uno sfondo più dettagliato sul concetto e sui metodi, fare riferimento a Belitz et al.14.

Nel loro studio, Belitz et al.14 forniscono anche risultati di casi di studio per dimostrare che la posizione idrologica multiordine è una caratteristica preziosa quando si mappano diverse variabili target geofisiche utilizzando l'apprendimento automatico. Il suo vantaggio per le prestazioni dei modelli di apprendimento automatico è stato riconosciuto anche da numerosi altri studi7,18,19.

 = i are used, whereas those with stream order _public_beta_v009.gpkg” and the second with “euhydro__v011.gpkg”. The coastline data is stored in a single Shapefile (.shp) file (see Fig. 4b). All files have a total size of approximately 14 GB when unzipped./p>___.tif”. The placeholders including “<” and “>” can be theoretically replaced by any combination of the values summarized in Table 2. But not all study area polygons have a river network for each hydrologic order. For example, the study area polygon for the island of Sardinia only has rivers up to a maximum streamorder of 6 and therefore only a maximum hydrologic order of 6. This means that there are no GeoTIFF files for Sardinia for hydrologic orders 7–9. Therefore, the total number of files is \({n}_{measures}\cdot {\sum }_{i=1}^{{n}_{hydrologicorders}}{n}_{studyareapolygons,i}=3\cdot {\sum }_{i=1}^{9}{n}_{studyareapolygons,i}=192\)./p> = dsd”). If required, a potential solution to this could be to fill these NA cells with values from the nearest non-NA grid cell as a simple approximation./p>, proxy = TRUE) before applying st_crop(). To simplify some of the previous steps, we developed the R package eumohpclipr (https://github.com/MxNl/eumohpclipr/)33. This package provides functionality to mosaic, crop or clip and plot the EU-MOHP dataset20. For a fast raster cell value extraction based on polygons, the R package exactextractr (https://github.com/isciences/exactextractr)34 is recommended./p> = lp”) must be divided by 100 to obtain percentages with two decimal digits or by 10,000 to obtain values in the range from 0 to 1. The cell values of all other files represent a distance in meters and can be used as is. All files are stored using the coordinate reference system (CRS) ETRS89-extended/LAEA Europe with the EPSG code 3035./p>