Introduction


Pour une expérience comme Pomme, concernant plusieurs campagnes de plusieurs navires sur une même zone durant une année, ayant des aspects multidisciplinaires, faisant appel à plusieurs laboratoires et équipes et conduisant à des données météorologiques, physiques,  chimiques et biologiques d’aspects très hétérogènes du point de vue de l’acquisition, de la fréquence et du type de données, il est indispensable, de s’assurer de la cohérence de la géolocalisation des données et de leur référence temporelle. Comme ce travail de contrôle de la géolocalisation des données demande en général la connaissance du trajet du navire et de son calendrier de travaux, il est souhaitable que ce contrôle soit fait par le chef de mission ou toute personne ayant l’ensemble des informations pertinentes. Cette tâche est clairement identifiée en raison de l’hétérogénéité des données et du nombre de scientifique intervenant pour alimenter la base de fichier des données d’une expérience de biogéochimie. Sur un nombre restreint de variable telle que l’analyse satellitaire de la SST par exemple, cette géolocalisation est intrinsèque au traitement de donnée et ne fait pas l’objet d’un travail spécial. Il n’en est pas de même pour une campagne de biogéochimie, intrinsèquement pluridisciplinaire.


Même si le travail exécuté ici concerne le domaine restreint des données obtenues en mer dans le cadre des navires Atalante ou Thalassa pour la partie biogéochimique essentiellement, il est relativement complexe en raison de la multiplicité des paramètres concernés et leur aspect hétérogène. Le principe retenu a d’abord été de situer ce travail en aval du traitement de données primaires ou brutes, c'est-à-dire que les différents responsables de chaque secteur de données ont fourni des fichiers de leurs résultats en format libre au site Pomme Web mise en place au LODYC (LOCEAN). A différentes dates, ces données ont été chargées par la cellule de validation afin d’effectuer les travaux de référencement, lesquels ont pour but de d’assurer une localisation unique dans le temps et dans l’espace de chaque donnée, localisation qui doit être en conformité avec la route du navire et avec la séquence temporelle des travaux réalisés. Parfois dans les fichiers reçus, cette géolocalisation est assurée, mais pas nécessairement, et pas toujours avec la précision souhaitée; quelques erreurs peuvent être présentes, malgré le professionnalisme des responsables (y compris nous-même !). Dans tous les cas il s’avère nécessaire de se repérer par rapport à des trames spatiotemporelles spécifiquement adaptées au référencement unique des données.


On aura compris que ce travail de contrôle et d’homogénéisation en quelque sorte est une étape obligée vers la mise en banque de données validées et sert son utilisation ultérieure.


Il y a quelques années, avant les ordinateurs, il était classique en océanographique d’établir de tableaux des données de manière à les croiser pour un usage scientifique de recherche. Maintenant le nombre de données s’étant considérablement accru, chacun traite éventuellement plusieurs paramètres à sa convenance selon des précisions qui varient selon l’usage. Ce contrôle de cohérence des différents tableaux fournis est donc indispensable et constitue une validation en elle-même.


Ce qui suit concerne exclusivement un rapport sur la validation par référencement, donc sur la géolocalisation précise et contrôlée des données. Cependant au cours du travail de contrôle des géolocalisations déjà présentes dans les fichiers originaux ou d’ajout à ces fichiers d’une géolocalisation complète, il est apparu utile de rendre les fichiers référencés portant sur des variables issues des prélèvement sur la rosette compatibles entre eux du point de vue de leur présentation. Le référencement effectué conduit donc à des fichiers pour les données de la rosette aisément juxtaposables pour effectuer des croisements entre variables appartenant à des fichiers différents. La conséquence est que la présentation des fichiers est homogène, mais peut être différentes des fichiers originaux. Toutefois les valeurs des variables dans les fichiers résultats ne sont pas modifiées et, dans cette étape de validation par référencement, aucun flag n’a été imposé. Signalons à ce point que les méta informations du site Pomme web, non reproduites dans le CD de transmission restent valides pour les fichiers référencés en ce qui concerne la méthode de dosage ou de traitement voire de contrôle, mais le repérage des colonnes, si décrites, dans les méta -fichiers est modifiée par le référencement. En revanche ces colonnes sont repérées par le même nom que dans le fichier original et elles sont également indiquées dans le fichier compte-rendu de Caroline Pocho. Ainsi le principe de traçabilité est respecté et permet à un fournisseur de données de retrouver les siennes pour un contrôle ultérieur éventuel.