Les Scientifiques Utilisent Moins De 1% Des Données Collectées Par Le Grand Collisionneur De Hadrons - Vue Alternative

Les Scientifiques Utilisent Moins De 1% Des Données Collectées Par Le Grand Collisionneur De Hadrons - Vue Alternative
Les Scientifiques Utilisent Moins De 1% Des Données Collectées Par Le Grand Collisionneur De Hadrons - Vue Alternative

Vidéo: Les Scientifiques Utilisent Moins De 1% Des Données Collectées Par Le Grand Collisionneur De Hadrons - Vue Alternative

Vidéo: Les Scientifiques Utilisent Moins De 1% Des Données Collectées Par Le Grand Collisionneur De Hadrons - Vue Alternative
Vidéo: Des nouvelles du LHC ( le Grand Collisionneur de Hadrons ) 11 juin 2019 nathalie besson 2024, Avril
Anonim

Il est clair quand il y a un problème pour obtenir des données scientifiques. Mais il s'avère qu'il y a un problème pour les enregistrer et les traiter.

La série entière de découvertes de haut niveau faites avec le collisionneur était basée sur l'analyse de données, dont le volume est inférieur à un pour cent du volume total de données générées.

Le reste des données est irrémédiablement perdu.

Le tunnel du collisionneur de 26,7 kilomètres est utilisé pour accélérer les particules proches de la vitesse de la lumière. Deux flux de particules se déplaçant dans des directions opposées se heurtent à des points de l'espace surveillés par des capteurs sensibles. Même au niveau de densité le plus bas des faisceaux de protons contenant chacun 120 milliards de protons, le nombre de collisions est de 30 millions de collisions par seconde.

Selon les informations publiées sur le site Web de l'Organisation européenne pour la recherche nucléaire CERN, un milliard de collisions par seconde crée un flux de données de 1 pétaoctet par seconde. Et c'est le plus gros problème à l'heure actuelle, car un flux de données d'une telle vitesse est tout simplement impossible à enregistrer, et encore moins à le traiter correctement. «Au minimum 30 millions de collisions, nous avons besoin de 2 000 pétaoctets pour stocker les résultats d'une phase de collisionneur typique de 12 heures. À 150 lancements de collisionneurs par an, il faudrait 400 000 pétaoctets, 400 exaoctets de données pour stocker toutes les données, un volume énorme que nous ne pouvons même pas stocker à l'heure actuelle », explique Andreas Hoecker, scientifique au CERN.

La solution au problème d'une grande quantité de données est, bien entendu, une réduction drastique de leur volume. Et cela ne se fait pas au détriment des algorithmes de compression d'informations, pour cela, il n'y a pas assez de puissance de tous les processeurs des superordinateurs existants. Les capacités de la technologie informatique disponible au CERN permettent d'enregistrer les résultats de seulement 1200 collisions pour 30 millions de cas. Cela représente 0,004% du volume total et les 99,996% restants, comme mentionné ci-dessus, sont perdus à jamais.

Image
Image

Cet état de fait semble être un terrible gaspillage, mais tout n'est pas si triste. Les phénomènes qui présentent un réel intérêt pour les scientifiques ne surviennent pas à ce rythme. Par exemple, le boson de Higgs apparaît à une vitesse d'une fois par seconde, tandis que d'autres événements se produisent à une fréquence de dizaines ou de centaines de fois par seconde. Pour mettre en évidence le plus intéressant de tout le flux de données, des «déclencheurs» spéciaux sont impliqués, des dispositifs qui effectuent un filtrage préliminaire des données principalement au niveau matériel. Ces déclencheurs sont développés pour chaque cas spécifique et sont réglés en fonction des propriétés des particules recherchées, comme le boson de Higgs, le vrai quark, les bosons W et Z, etc.

Vidéo promotionelle:

Bien sûr, avec une telle implémentation du prétraitement des données, certaines des données intéressantes sont perdues avec une montagne de «déchets» inutiles et inintéressants. Mais les informations restantes contiennent principalement des données importantes, et son volume relativement modeste permet déjà un traitement suffisamment profond même en temps réel.

Et en conclusion, il faut noter que la solution au problème décrit ci-dessus n'est nullement d'assurer la possibilité de stocker des données pour la plupart inutiles. La solution au problème est de créer de nouveaux capteurs pour le collisionneur, qui utiliseront les dernières réalisations des technologies modernes et qui pourront pénétrer dans les profondeurs des domaines de la physique actuellement inexplorés. À propos, certains de ces capteurs apparaîtront au collisionneur au cours de sa prochaine modernisation en cours en ce moment. Et le lancement du collisionneur modernisé est prévu pour 2025.

Recommandé: