Skip to content

arXiv воведува едногодишна забрана за научници кои ги препуштаат трудовите на LLM

1 мин. читање
Сподели

arXiv, најголемиот отворен депозит за научни трудови пред рецензија, конечно повлече линија. Од сега натаму, ако автор поднесе труд кој очигледно покажува дека работата е оставена целосно на голем јазичен модел – наследува едногодишна забрана. И тоа е тек почеток. По завршување на забраната, секој следен труд мора прво да помине низ рецензирано научно списание пред да може да се појави на arXiv.

Сајтот веќе беше под притисок. Бројот на ниско-квалитетни, AI-генерирани трудови расте од месец во месец, и порано arXiv воведе барање – нови корисници мора да добијат препорака од познат автор. По 20 години хостинг под Корнел, организацијата сега станува независна непрофитна, што ќе ѝ дозволи да собира средства специфично за борба против AI „слоп”.

Како изгледа „incontrovertible evidence”? Томас Дитерих, претседател на компјутерската секција на arXiv, ги набројува два случаи: халуцинирани цитати (несуществувачки референци), и коментари упатени до или од голем јазичен модел кои случајно завршиле во трудот. Тоа е суров маркер дека авторот не ги читал сопствените збунувачки рецитации.

Важно е да се разбере што arXiv не забранува – не забранува користење на LLM. Дитерих е прецизен: авторите мора да преземат „целосна одговорност” за содржината, „без оглед како е генерирана”. Ако истражувач копира неточен текст, плагијаризирана содржина, грешки или измислени референци директно од Chat-GPT – сè уште е негова одговорност. Алатката не е алиби.

Системот ќе работи на „еден удар”. Модераторите ќе означуваат сомнителни трудови, претседатели на секции мораат да потврдат докази пред да се воведе казна, а авторот ќе има право на жалба. Самата процедура е оштра, но не пристрасна – вршина на ред во простор каде досега не постоеше.

Прашањето за читателот: дали една институција може да го држи стандардот на квалитет кога технологијата го прави олеснувањето евтино? Овој пристап е малиот еквивалент на тоа што Европа го прави на регулаторно ниво – не забрана, туку одговорност. Прашањето е дали тоа ќе биде доволно или ќе помине година две пред AI-генерираните трудови да се продолжат да се пројавуваат, само поадскриени.