Cómo la inteligencia artificial está redibujando la ciencia (Informe JRC)

Milthon Lujan Monja

Informe describe el rol de la Inteligencia Artificial en la investigación científica.
El informe describe el rol de la Inteligencia Artificial en la investigación científica.

La Inteligencia Artificial (IA) ha dejado de ser una promesa futurista para convertirse en una fuerza presente y transformadora en casi todos los aspectos de nuestra vida. Pero, ¿qué ocurre cuando esta poderosa herramienta entra en el corazón mismo del descubrimiento: la investigación científica? Un reciente informe del Joint Research Centre (JRC), el servicio de ciencia y conocimiento de la Comisión Europea , titulado «The Role of Artificial Intelligence in Scientific Research», nos ofrece una visión detallada y basada en evidencia de esta revolución silenciosa.

Este artículo destila los hallazgos clave de ese informe, explorando cómo la IA está redibujando el mapa de la ciencia, qué oportunidades únicas ofrece y qué desafíos debemos navegar para asegurar que su adopción sea ética, responsable y verdaderamente innovadora. ¡Prepárate para conocer al nuevo socio inesperado del método científico!

Conclusiones clave

  • Transformación Integral: La IA está remodelando todas las etapas del proceso científico, desde generar hipótesis hasta comunicar resultados y construir comunidades.
  • Acelerador de descubrimientos: Herramientas como AlphaFold demuestran el poder de la IA para resolver problemas científicos complejos (predicción de estructura de proteínas) y acelerar la innovación (descubrimiento de materiales).
  • Open Science es clave: El progreso depende fuertemente de datos abiertos, modelos compartidos e infraestructuras colaborativas, principios fundamentales para una IA confiable en ciencia.
  • Nuevos desafíos: Surgen retos importantes como el sesgo algorítmico, las «alucinaciones» (datos fabricados), la necesidad de nuevas habilidades y la posible deriva epistémica (cambio en lo que consideramos conocimiento válido).
  • Infraestructura y talento: Se requiere inversión estratégica en computación de alto rendimiento (HPC) y en formar talento interdisciplinario que combine dominio científico y experticia en IA.

El proceso científico bajo la lupa de la IA

El informe del JRC analiza meticulosamente cómo la IA, desde el Aprendizaje Automático (ML) tradicional hasta la IA Generativa (GenAI) y los Grandes Modelos de Lenguaje (LLMs) , está interviniendo en cada fase del clásico método científico. Veamos cómo:

Hacer la pregunta correcta (Observación e Ideación)

    Tradicionalmente, identificar lagunas en el conocimiento o formular preguntas de investigación novedosas dependía de la intuición y la exhaustiva revisión bibliográfica humana. Hoy, la IA actúa como un «co-científico».

    • Generación de ideas: Herramientas de IA pueden analizar vastas cantidades de literatura para detectar áreas poco exploradas y proponer nuevos temas de investigación.
    • Identificación de gaps: Los LLMs pueden sintetizar información de campos diversos, identificando inconsistencias o conexiones no evidentes que sugieren hipótesis novedosas, un concepto conocido como Descubrimiento Basado en Literatura (LBD).
    • Socio creativo: Más allá del análisis, la IA se usa para brainstorming, sugiriendo preguntas o incluso diseñando experimentos conceptualmente nuevos, como el caso del sistema «Melvin» en óptica cuántica.

    El Reto: Existe el riesgo de que la IA refuerce paradigmas existentes o se centre en preguntas donde ya hay muchos datos , y la generación automatizada de preguntas complejas aún depende de la guía humana.

    Investigar los antecedentes (Revisión de Literatura)

      El volumen exponencial de publicaciones científicas hace casi imposible para un humano estar al día. La IA ofrece soluciones potentes:

      • Búsqueda semántica: Motores de búsqueda basados en IA (como Elicit, ORKG ASK) van más allá de las palabras clave, entendiendo el contexto y generando respuestas comparativas.
      • Resumen y extracción automatizada: La IA puede resumir artículos, extraer datos específicos (entidades, resultados experimentales) y organizar la información de forma estructurada, facilitando el metaanálisis.
      • Conexión interdisciplinar: Facilita la exploración de literatura en campos ajenos, identificando puentes conceptuales.

      El Reto: La calidad de los resultados depende de la calidad de los datos y los modelos. Una dependencia excesiva sin leer las fuentes originales puede llevar a «referencias inventadas» o correlaciones espurias («alucinaciones»).

      Construir una hipótesis

        La IA no solo ayuda a encontrar preguntas, sino también a formular posibles respuestas:

        • Hipótesis basada en literatura: Sistemas de IA pueden proponer hipótesis específicas conectando hallazgos previamente no relacionados en la literatura científica.
        • Predicción de vínculos (ML): En campos como el descubrimiento de fármacos, modelos de ML predicen interacciones (ej: fármaco-objetivo), generando hipótesis sobre nuevas moléculas candidatas. El descubrimiento del antibiótico ‘halicin’ es un ejemplo.
        • Descubrimiento teórico: La IA está empezando a proponer conjeturas incluso en matemáticas puras, identificando patrones que guían la intuición humana.
        • Regresión simbólica: Algoritmos que buscan expresiones matemáticas para ajustar datos, redescubriendo leyes físicas o proponiendo nuevas ecuaciones legibles por humanos.

        El Reto: Las hipótesis generadas por IA pueden carecer de transparencia o favorecer caminos ya explorados, limitando la originalidad. Además, existe preocupación por el plagio no detectado.

        Probar la hipótesis (Experimentación)

          La IA está automatizando y optimizando la fase experimental:

          • Diseño óptimo de experimentos: Técnicas como la optimización bayesiana ayudan a priorizar qué experimentos realizar para obtener la máxima información.
          • Laboratorios autónomos («Self-Driving Labs»): Sistemas donde la IA propone condiciones, un robot ejecuta el experimento y la IA aprende del resultado para diseñar el siguiente ciclo. Pueden multiplicar la velocidad de experimentación.
          • Simulación y generación de datos: La IA permite simulaciones a gran escala (ej: predicción del tiempo, plegamiento de proteínas con AlphaFold) o genera datos sintéticos para entrenar otros modelos.
          • Control de instrumentos: En grandes experimentos (física de partículas, astronomía), la IA gestiona instrumentos complejos y filtra datos en tiempo real para identificar eventos de interés.

          El Reto: La velocidad puede comprometer la supervisión ética. Los modelos pueden «fabricar» datos si no se validan, o propagar errores y sesgos del código o datos de entrenamiento.

          Analizar los datos

            Quizás el uso más extendido de la IA en ciencia.

            • Procesamiento automatizado: La IA maneja volúmenes y tipos de datos (texto, imagen, vídeo, sensores) que desbordan la capacidad humana.
            • Reconocimiento de patrones: Algoritmos como las Redes Neuronales Profundas (DNNs) identifican patrones sutiles en datos complejos (ej: física de partículas, clasificación de galaxias, descubrimiento de exoplanetas).
            • Minería avanzada de datos: Modelos de ML integran miles de variables (genómica, ciencia climática) para encontrar relaciones no lineales complejas.

            El Reto: Las «cajas negras» (modelos no interpretables) dificultan la validación. La sobreconfianza en la IA puede mermar el pensamiento crítico del investigador. Existe el riesgo de «ilusiones de entendimiento» si se pierde el contexto.

            Sacar conclusiones (Interpretación)

              La IA también asiste en la interpretación de los resultados:

              • Inferencia causal: Ayuda a distinguir correlación de causalidad en datos complejos, crucial para conclusiones robustas.
              • Verificación y consistencia: Puede verificar si los nuevos hallazgos son consistentes con el conocimiento existente o si violan leyes físicas conocidas.
              • Razonamiento colaborativo: LLMs afinados con conocimiento científico pueden ayudar a articular implicaciones, sugerir pruebas adicionales o proponer explicaciones alternativas.

              El Reto: La IA actual a menudo carece de juicio contextual profundo. Existe el peligro de producir más ciencia pero entender menos, cayendo en «monocultivos» metodológicos. El rol crítico del científico humano es insustituible.

              Comunicar los resultados

                La IA se está convirtiendo en una herramienta común en la escritura científica:

                • Asistente de escritura: Ayuda a redactar, editar, mejorar gramática y claridad, formatear, e incluso generar secciones (resúmenes, trabajos relacionados). Un estudio detectó un impacto sin precedentes en el estilo de escritura científica tras la aparición de ChatGPT.
                • Traducción y resumen: Facilita la comunicación a audiencias más amplias y rompe barreras lingüísticas.
                • Visualización mejorada: Asiste en la generación de gráficos e ilustraciones más efectivas.
                • Control de calidad: Herramientas de IA se usan para detectar plagio o manipulación de imágenes en publicaciones.

                El Reto: Riesgo de «alucinaciones» (citas inventadas, contenido falso). Dificultad para detectar texto generado por IA. Posible pérdida de originalidad y estilo. Surgen cuestiones sobre autoría y transparencia.

                Construir la comunidad científica

                  La ciencia es social. La IA también impacta esta dimensión:

                  • Redes de colaboración: Algoritmos que analizan publicaciones y citas para sugerir potenciales colaboradores o identificar grupos emergentes.
                  • Repositorios de conocimiento: Plataformas como Open Research Knowledge Graph (ORKG) usan IA para estructurar hallazgos publicados, creando «revisiones vivas» curadas por la comunidad.
                  • Ciencia ciudadana: La IA ayuda a prefiltrar datos o validar contribuciones de voluntarios, haciendo su esfuerzo más eficiente.
                  • Revisión por pares: Herramientas de IA asisten en la asignación de revisores o detectan problemas básicos en los manuscritos.

                  El Reto: La dependencia de herramientas de empresas privadas puede generar conflictos de interés o falta de transparencia. Es crucial que la propia comunidad científica lidere la discusión sobre cómo integrar la IA de forma responsable.

                  Inmersiones profundas: ejemplos concretos

                  El informe del JRC ilustra estos impactos con tres estudios de caso:

                  Predicción de la estructura de proteínas

                  El éxito de AlphaFold, galardonado con el Nobel, muestra cómo la IA (basada en Deep Learning y datos evolutivos) puede resolver un desafío científico de décadas con precisión casi experimental. Este avance, impulsado por datos abiertos (como el Protein Data Bank) y competiciones colaborativas (CASP), está acelerando la biomedicina. Sin embargo, persisten desafíos en la predicción de proteínas no estándar y surgen preocupaciones de bioseguridad con modelos capaces de diseñar nuevas proteínas.

                  Descubrimiento de materiales

                  La IA está cambiando el paradigma de buscar materiales probando uno a uno, hacia el «diseño inverso»: definir propiedades deseadas y usar IA Generativa (VAEs, GANs, modelos de difusión) para proponer estructuras moleculares o cristalinas que las cumplan. Bases de datos abiertas como «Materials Project» son cruciales. Aunque los modelos son más pequeños que los LLMs, la integración con laboratorios autónomos promete acelerar descubrimientos para energía, sostenibilidad, etc. Es vital mantener el rigor y evitar expectativas infladas.

                  Arqueología (Descubrimiento de sitios y restauración de inscripciones)

                  En humanidades, la IA analiza datos de sensores (LiDAR, satélite) para identificar sitios arqueológicos ocultos. Modelos como Ithaca, basados en Transformers, ayudan a restaurar inscripciones antiguas dañadas con una precisión que supera a los expertos humanos, además de atribuirles origen geográfico y temporal. El principal desafío aquí es la fragmentación de datos y la necesidad de sensibilidad cultural y ética.

                  Oportunidades y desafíos transversales

                  Más allá de las etapas específicas, el informe identifica temas cruciales:

                  • Datos, modelos e infraestructura: La ciencia abierta (datos, modelos, código) es fundamental. Se necesita inversión en infraestructura computacional (HPC) y bases de datos de alta calidad. Los modelos fundacionales científicos (grandes modelos preentrenados en datos científicos) son una tendencia emergente, pero requieren gobernanza para evitar dependencias.
                  • Habilidades e innovación: Se necesita talento interdisciplinario que combine experticia científica y en IA. Fomentar la colaboración entre academia e industria es clave.
                  • Consideraciones éticas y legales: La transparencia, explicabilidad, justicia (ausencia de sesgo) y supervisión humana son esenciales. El informe destaca el riesgo de «deriva epistémica»: que la IA, sin querer, estreche la diversidad de preguntas exploradas o separe las conclusiones de sus fuentes humanas. La responsabilidad final siempre recae en el investigador. El EU AI Act establece un marco, aunque la investigación tiene exenciones.
                  • Dimensión social y colaboraciones: La IA no solo es una herramienta, sino una fuerza social. Su uso en ciencias sociales (CSS) tiene doble filo: permite nuevos análisis pero puede reforzar sesgos o influir en la sociedad. La colaboración internacional e intersectorial es vital para abordar estos complejos desafíos.

                  Conclusión: hacia una ciencia aumentada por la IA, con responsabilidad

                  El informe del JRC deja claro que la IA es una fuerza imparable y profundamente transformadora en la ciencia. Ofrece un potencial sin precedentes para acelerar descubrimientos, resolver problemas complejos y democratizar el acceso a herramientas analíticas avanzadas.

                  Sin embargo, este potencial no se materializará positivamente por sí solo. Requiere un enfoque proactivo y coordinado. La promoción decidida de la ciencia abierta, la inversión estratégica en infraestructura y talento, y el establecimiento de marcos de gobernanza sólidos que prioricen la ética, la transparencia y la supervisión humana son condiciones indispensables.

                  Nota del editor: Para la comunidad de «Innovar o Morir», el mensaje es claro: la IA no es solo una herramienta más, es un socio estratégico en el proceso de innovación científica. Comprender sus capacidades, limitaciones y riesgos es crucial para navegar esta nueva era del descubrimiento. La pregunta ya no es si la IA cambiará la ciencia, sino cómo podemos guiar ese cambio para maximizar sus beneficios para la investigación, la competitividad y, en última instancia, para la sociedad, manteniendo siempre nuestros valores éticos y humanos en el centro.

                  Referencia (acceso abierto)
                  PURIFICATO, E., BILI, D., JUNGNICKEL, R., RUIZ SERRA, V., FABIANI, J. et al., The Role of Artificial Intelligence in Scientific Research – A Science for Policy, European Perspective, Publications Office of the European Union, Luxembourg, 2025, https://data.europa.eu/doi/10.2760/7217497, JRC143482.