AI代写论文现象揭秘:14%的生物医学论文藏有ChatGPT特征词
作者:微企 www.saaservice.cn 发布时间:2025-08-03 21:00:03
在学术界,AI辅助写作正逐渐成为一股不可忽视的力量。然而,这种技术的普及也带来了一系列问题,尤其是当AI生成的文本被用于学术论文时。据Nature最新报道,一项研究发现,在2024年PubMed上发表的150万篇生物医学研究摘要中,超过20万篇都频繁出现了LLM(大型语言模型)的特征词。这些词汇,如“unparalleled”、“invaluable”、“heighten”等,大多只是改变了文体,并不影响内容,但却成为了揭示AI代写论文的重要线索。
研究团队通过下载1400万篇摘要(2010年-2024年),构建词汇出现的二元矩阵,并计算每年词汇的频率,发现了这一令人惊讶的现象。在2024年之前,类似“coronavirus”的名词被超额使用;而2024年之后,则以“intricate”、“notably”等与研究内容无关的风格词为主。这些词汇中,66%是动词,如“delving”、“emphasizing”,16%为形容词,如“crucial”、“pivotal”。这些词汇的频繁出现,让使用LLM的论文极易被察觉。
通过将222个低频风格词和10个高频风格词组合计算,研究人员发现,在2024年的论文中,至少10%-11%的摘要中使用了LLM,部分子语料库中这一比例甚至高达30%。这一发现揭示了LLM在学术写作中的广泛影响,尤其是在计算领域、生物信息学等学科中,由于行业技术日新月异,研究者需要迅速掌握新技术,因此更倾向于依赖LLM协助写作。
此外,研究还发现,在不同学科、地域和期刊中,LLM的使用也存在显著差异。在中国、韩国等非英语国家中,由于需要LLM辅助英语写作,LLM使用率可达15%,相比之下,像英国、澳大利亚等英语国家的LLM使用率相对较低。一些低门槛的开放获取期刊,如MDPI旗下的《Sensors》,LLM使用率可达24%,而像《Nature》、《Science》等顶刊只有6%到8%。
然而,随着LLM使用的日益普及,一些作者也开始注意到其可能带来的问题,并开始引导LLM规避明显的AI痕迹。研究人员发现,自2024年4月起,一些已经被明确指出是ChatGPT的常用词汇,如“delve”、“intricate”等,使用频率显著下降。而ChatGPT喜欢的另一些较为常见的词汇,如“significant”、“additionally”等,使用率反而持续上升。这一现象表明,作者们正在主动调整输出,避免使用典型的LLM特征词。
尽管如此,研究人员也表示,未来他们将通过统计大量文本中常见词汇的频率来进一步估计AI对学术文献的影响,而不仅仅只针对单个短文本进行检测。因为MGT检测器虽然在一定程度上能够识别LLM生成的文本,但其准确度受不同LLM模型和文本类型影响,且作者们现在使用特定提示词修改文本,都让检测器难以准确判断论文与LLM的关系。
总而言之,LLM在科研工作中的影响力日益增长,但同时也亟需逐步完善其在学术论文中占比的量化分析。如何更好地让AI参与学术写作、AI使用的边界在哪里等问题,都值得我们重新思考。随着技术的不断进步和学术规范的日益完善,我们期待看到一个更加透明、公正的学术环境。
文章分类
最新站内文章
联系我们
联系人:点镜微信管理系统客服