Getting your Trinity Audio player ready...

Durante las últimas dos décadas, la literatura científica ha sufrido una invasión silenciosa. Organizaciones con fines de lucro conocidas como paper mills —fábricas de artículos— han inundado las revistas académicas con manuscritos fabricados, vendidos a investigadores que necesitan publicaciones para avanzar en sus carreras. Ahora, un estudio publicado en The BMJ en enero de 2026 revela que la investigación oncológica es uno de los blancos predilectos de estas empresas fraudulentas: casi el diez por ciento de los artículos de cáncer analizados presentan señales textuales compatibles con productos de paper mills. [^1][^2]

El equipo liderado por el estadístico Adrian Barnett, de la Universidad Tecnológica de Queensland (Australia), junto con Jennifer Byrne, Baptiste Scancar y David Causeur, desarrolló un modelo de aprendizaje automático basado en BERT —una arquitectura de procesamiento de lenguaje natural— para distinguir publicaciones genuinas de aquellas que probablemente fueron fabricadas en serie. [^2] El modelo fue entrenado con 2202 artículos retractados e identificados como productos de paper mills en la base de datos Retraction Watch, y posteriormente validado con un conjunto independiente recopilado por expertos en integridad de imágenes. En las pruebas de rendimiento, la herramienta alcanzó una precisión del 91 por ciento. [^1][^2]

Los investigadores aplicaron su herramienta a un corpus de 2,6 millones de artículos de investigación oncológica publicados entre 1999 y 2024 en PubMed. El resultado fue alarmante: 261245 artículos —el 9,87 por ciento del total— mostraron similitudes textuales con publicaciones retractadas de paper mills. [^2] La cifra supera con creces las estimaciones previas de prevalencia de artículos fraudulentos en la investigación biomédica general, que rondaban el seis por ciento.

Pero el problema no se limita a revistas de bajo impacto. El estudio encontró un aumento sostenido de artículos señalados incluso en las revistas del diez por ciento superior por factor de impacto, lo que sugiere que el prestigio de una publicación no garantiza la autenticidad de su contenido. [^1][^2] Como explicó Barnett: «Desafortunadamente, el cáncer ha sido un blanco bastante frecuente para este tipo de artículos. En parte por el prestigio de trabajar en cáncer, en parte porque hay muchas revistas en este campo, y en parte porque la ciencia básica ha sido un objetivo más fácil para las paper mills, ya que es un poco más sencillo fabricar datos». [^1]

El análisis reveló patrones geográficos y temáticos significativos. Más de 170000 artículos señalados estaban afiliados a instituciones chinas, lo que representa el 36 por ciento de los artículos de investigación oncológica de China. [^2] En cuanto a los tipos de cáncer, los artículos sobre cáncer gástrico (22 por ciento), óseo (21 por ciento) y hepático (20 por ciento) presentaron las tasas más altas de publicaciones sospechosas. [^1] La investigación fundamental resultó particularmente vulnerable, más que los estudios clínicos.

¿Cómo funcionan estas fábricas de artículos? Las paper mills maximizan sus ganancias produciendo cantidades industriales de manuscritos de baja calidad a gran velocidad. Para ello, recurren a plantillas con oraciones prefabricadas donde solo varían los términos específicos del campo. [^3] Estos artículos fabricados pueden incluir reactivos descritos incorrectamente, datos inventados, imágenes manipuladas o reutilizadas, y justificaciones superficiales de la investigación. Las similitudes textuales y de formato actúan como huellas dactilares que los investigadores de integridad científica pueden rastrear. [^1]

El modelo de Barnett y sus colegas se centró específicamente en los títulos y resúmenes de los artículos, los componentes más accesibles a gran escala, y empleó técnicas de clasificación de texto para comparar patrones lingüísticos con los de artículos ya retractados. Sin embargo, los propios autores reconocen que la cifra del diez por ciento podría ser una subestimación. «Si realmente es el diez por ciento, no lo sabemos con certeza. Podría ser más, porque solo estamos detectando un tipo particular de plantilla», advirtió Barnett. «Si las paper mills tienen otras plantillas más sofisticadas, las habríamos pasado por alto». [^1]

No obstante, la herramienta presenta limitaciones. João Phillipe Cardenuto, investigador postdoctoral en forenses digitales de la Universidad de Campinas (Brasil), señaló que la sobrerrepresentación de investigadores chinos en los datos de entrenamiento podría introducir un sesgo, haciendo que el modelo aprenda patrones de escritura frecuentes en autores chinos en lugar de rasgos exclusivamente ligados a publicaciones falsas. [^1]

El problema de las paper mills no es solo una cuestión de integridad académica abstracta. En oncología, los artículos fraudulentos pueden distorsionar las bases de evidencia sobre las que se toman decisiones clínicas y se diseñan nuevos ensayos. Una revisión sistemática previa ya había identificado que más del 20 por ciento de los artículos retractados en oncología se relacionaban con temas relevantes para el tratamiento, como ensayos clínicos y estudios sobre propiedades anticancerígenas de suplementos. [^4]

Este estudio representa un avance significativo en la batalla por la integridad científica, pero también expone la magnitud del desafío. Como concluyeron sus autores, «las paper mills son un problema grande y creciente en la literatura sobre cáncer, y no están restringidas a las revistas de bajo impacto. La conciencia colectiva y la acción serán cruciales para abordar el problema». [^2] La pregunta que queda abierta es si las herramientas de detección podrán evolucionar tan rápido como las técnicas de fraude, especialmente en una era en la que la inteligencia artificial generativa puede tanto combatir como facilitar la producción de ciencia falsa.


Este artículo se basa en el estudio de Scancar et al. publicado en The BMJ (2026) y en la cobertura periodística de The Scientist por Mariella Bodemeier Loayza Careaga.

[^1]: Mariella Bodemeier Loayza Careaga, 2026. Nearly Ten Percent of Cancer Papers Flagged as Potentially Fake.

[^2]: Scancar et al., 2026. Machine learning based screening of potential paper mill publications in cancer research: methodological and cross sectional study. British medical journal.

[^3]: Machine learning based screening of potential paper mill … – The BMJ, 2026.

[^4]: Pantziarka & Meheus, 2018. Journal retractions in oncology: a bibliometric study. Future Oncology.

Generado por Elicit


admin

He sido profesor de la Universidad de Murcia. Impartí docencia de los departamentos de Física y de Informática y Sistemas. Interesado en la ciencia, el escepticismo y el pensamiento crítico.