SCIDetect против Корчевателя

Наконец-то мир спасен от псевдонаучных текстов, создана программа, которая будет бороться программой «Корчеватель». Интересно, справится ли новая программа?

История началась десять лет  назад, когда трем аспирантам Массачусетского технологического института пришло в голову создать программу SCIGen, при помощи которой можно было генерировать «наукообразные» тексты, связанные с компьютерной тематикой.

Ленивые студенты ликовали, одним нажатие кнопки стало возможным создать научную работу, в которой были и графики, и схемы, и список литературы. Отличное изобретение, но, на самом деле, смысла никакого такие работы не имели. Все они были написаны научным языком, но, достаточно было вчитаться и, становилось понятно, что содержимое работы просто набор научных фраз и словосочетаний.

Причиной создания этой программы, было желание аспирантов доказать, что организаторы конференций и редакторы некоторых журналов не стараются даже вчитаться в текст. Для демонстрации халатного отношения к научным работам аспиранты направили такой «доклад» на конференцию по информатике  WMSCI, которая состоялась в 2005 году.

Шедевр компьютерной мысли назывался «корчеватель: алгоритм типичной унификации точек доступа и избыточности». Текст был принят и авторов «работы» пригласили выступить на конференции. Авторам  SCIGen удалось доказать, что такой бред про корчеватель можно благополучно опубликовать, а уж про другие низкокачественные научные статьи и говорить нечего.

Программа была выложена в интернет, пользователи скачали ее много раз. В 2008 году SCIGen добралась и до отечественной публицистики. Один из научных журналов опубликовал у себя на страницах статью, созданную при помощи данной программы, при этом журнал состоял в списке научных журналов Министерства образования. Был грандиозный скандал — журнал потерял свой научный статус.

Такое решение относительно журнала было абсолютно правильным, потому что редакция научного журнала, которая ценит статус изданий, не допустит, чтобы подобные статьи появлялись на страницах.

Научный мир ценит журналы как Nature или Science, которые можно назвать эталонами качества научных исследований. Работа рецензентов достаточно сложная, но именно она обеспечивает доверие читателей и высокий рейтинг журнала.

Однако, авторитетные издательства не застрахованы от ошибок. Издательство Springer, в редакции которой находится 2000 научных журналов, обнаружила у себя 18 таких «троянских коней» в 2014 году.

Статьи удалили, но уязвимость никуда не делась, никто не может дать гарантии, что завтра читатель не столкнется с «корчевателем».

SCIDetect

Решением проблемы стал Кирилл Лаббэ, он несколько занимался изучением проникновения псевдостатей в научные издания. Результатом его работы стала программа SCIDetect. Алгоритм программы определяет статью, которая была создана при помощи компьютера. Но, почему пришлось создавать программу?

Ответ прост, наука постоянно развивается, ученые становятся узкоспециализированные и, порой, два ученых, которые работают в соседних лабораториях, не могут понять друг друга.

Что говорить о рецензентах, у них просто физически нет сил проверить все статьи и вникнуть в каждую тему. SCIDetect поможет снизить вероятность ошибок, программа будет работать как спам-фильтр.

Что касается научной глупости, то программу для нее еще не создали.