Ένα νέο AI εργαλείο εντόπισε περισσότερες από 250.000 επιστημονικές δημοσιεύσεις για τον καρκίνο που ενδέχεται να έχουν παραχθεί από τις λεγόμενες “paper mills”, βιομηχανίες παραγωγής ψεύτικων ή χαμηλής ποιότητας επιστημονικών μελετών.
Το εργαλείο αναπτύχθηκε από τον καθηγητή Adrian Barnett του Queensland University of Technology, σε συνεργασία με διεθνή ομάδα ερευνητών. Η μελέτη, που δημοσιεύθηκε στο BMJ, ανέλυσε 2,6 εκατομμύρια μελέτες με θέμα τον καρκίνο από το 1999 έως το 2024.
Συγκεκριμένα, η έρευνα εντόπισε πάνω από 250.000 άρθρα με γλωσσικά μοτίβα παρόμοια με δημοσιεύσεις που έχουν ήδη ανακληθεί λόγω υποψίας κατασκευασμένων δεδομένων. «Οι paper mills είναι οργανώσεις που πωλούν ψεύτικες ή χαμηλής ποιότητας επιστημονικές μελέτες. Παράγουν «έρευνα» σε βιομηχανική κλίμακα και τα ευρήματά μας δείχνουν ότι το πρόβλημα στην έρευνα για τον καρκίνο είναι πολύ μεγαλύτερο απ’ όσο πιστεύαμε», δήλωσε ο Δρ. Adrian Barnett.
«Πιθανότατα βασίζονται σε τυποποιημένα πρότυπα, τα οποία μπορούν να εντοπιστούν από μεγάλα γλωσσικά μοντέλα που αναλύουν μοτίβα στο κείμενο», πρόσθεσε ο ίδιος.
Πώς λειτουργεί το AI spam φίλτρο
Οι ερευνητές εκπαίδευσαν ένα γλωσσικό μοντέλο, ώστε να αναγνωρίζει τις διακριτές «γλωσσικές υπογραφές» που εμφανίζονται επανειλημμένα σε γνωστά άρθρα paper mills. Σε δοκιμές με επιβεβαιωμένα παραδείγματα, το μοντέλο εντόπισε σωστά τις ύποπτες μελέτες στο 91% των περιπτώσεων.
«Ουσιαστικά δημιουργήσαμε ένα επιστημονικό φίλτρο spam», δήλωσαν χαρακτηριστικά οι ερευνητές. «Όπως το σύστημα email εντοπίζει ανεπιθύμητα μηνύματα, έτσι και το εργαλείο μας επισημαίνει άρθρα που ταιριάζουν στο ύφος και τη δομή δημοσιεύσεων που έχουν ανακληθεί ως ύποπτες».
Τι εντόπισε
Τα βασικά ευρήματα της μεγάλης κλίμακας ανάλυσης περιλαμβάνουν:
- Ο αριθμός των «ύποπτων» δημοσιεύσεων έχει αυξηθεί σημαντικά τις τελευταίες δύο δεκαετίες, από περίπου 1% στις αρχές του 2000 σε πάνω από 16% το 2022.
- Το πρόβλημα επηρεάζει χιλιάδες επιστημονικά περιοδικά, ακόμη και τίτλους υψηλού κύρους.
- Η μεγαλύτερη συγκέντρωση «ύποπτων» εργασιών εντοπίζεται σε τομείς όπως η μοριακή βιολογία του καρκίνου και η πρώιμη εργαστηριακή έρευνα για τον καρκίνο.
- Ορισμένοι τύποι καρκίνου —μεταξύ των οποίων ο γαστρικός, ο ηπατικός, ο οστικός και ο πνευμονικός— εμφανίζουν ιδιαίτερα υψηλά ποσοστά αμφισβητούμενων δημοσιεύσεων.
Οι ερευνητές σχεδιάζουν να επεκτείνουν το εργαλείο και σε άλλους επιστημονικούς τομείς, βελτιώνοντας το μοντέλο όσο γίνονται διαθέσιμες περισσότερες επιβεβαιωμένες περιπτώσεις δραστηριότητας από paper mills.
Τονίζουν, καταλήγοντας ότι τα ευρήματα δεν αποτελούν επιβεβαιωμένες περιπτώσεις επιστημονικής απάτης και ότι πρέπει να εξετάζονται από ειδικούς.