A medida que más y más sistemas de alta tecnología están expuestos al entorno espacial, la predicción del clima espacial puede brindar una mejor protección para estos dispositivos. En el sistema solar, el clima espacial está influenciado principalmente por las condiciones del viento solar. El viento solar es una corriente de partículas supersónicas cargadas de plasma que provocará tormentas geomagnéticas, afectará las comunicaciones de onda corta y amenazará la seguridad de la infraestructura eléctrica y petrolera cuando pase sobre la Tierra.

La predicción precisa de la velocidad del viento solar permitirá a las personas hacer los preparativos adecuados para evitar el desperdicio de recursos. La mayoría de los métodos existentes solo utilizan datos de una sola modalidad como entrada y no consideran la información complementaria entre las diferentes modalidades. En un artículo de investigación publicado recientemente en Space: Science & Technology, Zongxia Xie, de la Facultad de Inteligencia y Computación de la Universidad de Tianjin, propuso un método de predicción multimodal (MMP) que aprendió conjuntamente información de visión y secuencia en un marco unificado de extremo a extremo. para la predicción de la velocidad del viento solar.
En primer lugar, el autor presentó la estructura general de MMP, que incluye un extractor de funciones de visión, Vmodule, y un codificador de series temporales, Tmodule, así como un módulo Fusion. A continuación, se introdujeron las estructuras de Vmodule y Tmodule. Los datos de imagen y los datos de secuencia fueron procesados por Vmodule y Tmodule, respectivamente. Vmodule usó el modelo de GoogLeNet previamente entrenado como extractor de características para extraer características de imagen ultravioleta extrema (EUV).
Tmodule consistía en una red neuronal convolucional (CNN) y una memoria bidireccional a largo plazo (BiLSTM) para codificar características de datos de secuencia para ayudar a la predicción. Se incluyó un predictor de fusión multimodal, que permite la fusión de características y la regresión de predicción. Después de extraer características de dos módulos, los dos vectores de características se concatenaron en un vector para la fusión multimodal. Los resultados de la predicción se obtuvieron mediante un regresor de predicción multimodal. Se aplicó el método de fusión de multimodalidad para obtener información complementaria para mejorar el rendimiento general.
Luego, para verificar la efectividad del modelo MMP, el autor realizó algunos experimentos. Las imágenes EUV observadas por el satélite del observatorio de dinámica solar (SDO) y el conjunto de datos OMNIWEB medido en el punto 1 de Lagrange (L1) se adoptaron para el experimento. El autor preprocesó imágenes EUV y datos de viento solar de 2011 a 2017.
Dado que los datos de series temporales tenían continuidad en la dimensión temporal, el autor dividió los datos de 2011 a 2015 como conjunto de entrenamiento, los datos de 2016 como conjunto de validación y 2017 como conjunto de prueba. Posteriormente, se describió el montaje experimental. El autor ajustó la GoogLeNet previamente entrenada en el conjunto de datos de ImageNet para extraer características de imagen EUV.
Se utilizaron métricas como el error cuadrático medio (RMSE), el error absoluto medio (MAE) y el coeficiente de correlación (CORR) para comparar y evaluar el rendimiento de predicción continua del modelo. El RMSE se calculó tomando la raíz cuadrada de la media aritmética de la diferencia entre el valor observado y el valor predicho.
MAE representó la media del error absoluto entre el valor previsto y el observado. CORR puede representar la similitud entre la secuencia observada y la predicha. Además, se adoptó la puntuación de habilidad de Heidke para evaluar si el modelo puede capturar con precisión la velocidad máxima del viento solar.
Los experimentos comparativos mostraron que MMP logra el mejor rendimiento en muchas métricas. Además, para probar la efectividad de cada módulo en el modelo MMP, el autor realizó experimentos de ablación. Se pudo ver que la eliminación del módulo V condujo a una disminución en los resultados experimentales, especialmente para la predicción a largo plazo. A diferencia de la eliminación de Vmodule, la eliminación de Tmodule tuvo un impacto más significativo en la predicción a corto plazo.
El autor también comparó el desempeño de diferentes modelos previamente entrenados para verificar la efectividad de los mismos para capturar las características de la imagen y descubrió que GoogLeNet obtuvo la mayor cantidad y los mejores resultados de métricas. Además, se realizaron experimentos de comparación de hiperparámetros para verificar la racionalidad de la selección de parámetros de nuestro modelo.
Finalmente, el autor propuso varias direcciones prometedoras para el trabajo futuro. En primer lugar, la investigación futura se centraría en el impacto de las diferentes modalidades en el desempeño, asignaría diferentes pesos a las diferentes modalidades y usaría su relación complementaria para mejorar el desempeño. En segundo lugar, el modelo propuesto no puede capturar bien la corriente solar de alta velocidad, lo cual era muy difícil pero esencial para la aplicación. Por lo tanto, el autor se centraría en cómo mejorar la predicción de picos en el futuro.
Con información de Beijing Institute of Technology Press Co., Ltd