随着人工智能(AI)大模型不断升级,以ChatGPT、文心一言、BingChat等为代表的生成式AI工具对教育领域产生了极大的影响。这类技术工具可以按照用户指令分析阅读材料、翻译文本、进行论文写作并润色,已经在高校学生群体中得到大量的关注与使用。
那么,生成式AI工具写作的内容文本究竟有哪些特征,局限性在哪里?就写作而言,学生借助AI写作,是否与大学开设人文通识课程的目标相悖?未来,我们有没有可能让这类生成式AI工具从“学术不端”的“帮凶”转变为人文教育的“帮手”呢?
生成式AI写作工具,给教学带来新挑战
笔者在一所中外合办大学开设“中西文化比较”课程,这是学校的一门人文通识必修课,每年会有超过4000名学生选课并参加课程考核。过去,不少大一新生会带着自己的高中作文摘抄本进入大学课堂,并在不自知的情况下进行引用,从而引发学术不端的问题。
2022年OpenAI推出ChatGPT后,众多互联网公司也纷纷推出了各自的大语言模型。2023年之后,入学的大一学生也与时俱进,开始在作业或期末论文中直接使用最新的技术进行写作。于是,学生提交上来的小论文,查重率高的现象明显减少,同时,用AI工具写作的痕迹明显增多。
几千份课程期末论文中,10%以上有明显的全文使用AI工具生成的痕迹,另有不少课程论文有局部使用AI软件代写的嫌疑。笔者在评阅作业过程中,也常发现有的学生在文末忘记删除投喂给AI的指令、忘记删除某AI写作工具试用水印,或是用英文AI工具生成内容再用翻译软件翻成中文导致奇怪语法错误的案例。
对学生而言,使用AI工具代写论文显然充满诱惑:在短短几分钟内,只需输入课程要求的论文选题,就能生成一篇还看得过去、且大概率能躲避系统查重的文章,尤其是在繁忙的期末,这为学生带来了难以抗拒的便利。根据笔者的统计,在学生提交上来的具备AI写作特点的文档中,最短编辑时间只有1分钟。但是从教学角度而言,此类AI工具的出现对老师的工作带来了许多新要求与新挑战。
AI确实在输出,却并非写作论文
近两年内,网上出现了许多内容完整、逻辑通顺的AI生成论文,甚至让人难以辨认这些作品是否由真人写作。但是在笔者面对的上千份课程期末论文中,AI写作的特征非常明显。
首先是格式与结构的雷同。这类文章往往生硬地在段首使用“首先”“其次”“最后”“总结”等词语,试图给读者形成逻辑明确、主次有序的印象。然而,在每段的阐述中,却只有寥寥几笔的空泛之言,会让人觉得“就这么点单薄的观点,还需要分一二三四这么多层次吗?!”
同时,由于生成式AI写作工具并不是真正的思考,而是依据用户输入的关键词在海量数据中检索、再重新组织出语言,因此它在生成文章时也非常强调关键词的输出,并以围绕相应关键词的答题式格式呈现出来,导致这类文本在格式与结构上的同质化。
比如,围绕主题“从教育的角度讨论中西方文化的差异”的论文,用AI写作的学生文本内容格式都非常清晰,甚至可说“对仗工整”,文本往往围绕着几个关键词,进行清晰的分点陈述。但实际上,只需要认真看一下就会发现,文章有一种生硬的、答题式的割裂感,与课程要求的“行文完整”相差甚远。
再以和教育传统有关主题的小论文为例,通过AI生成的内容中均提到中式教育和西方教育各自的特点,这些论断都是大家耳熟能详的,然而这些表述却与我们课程中相应专题所要传达的观点南辕北辙,如果学生结合了课程所学,绝对不会罗列出如此片面的表述。比如,我们在专题《书院与大学》中,就对比了两宋时期中国的书院与西方中世纪盛期随着城市兴起而逐渐诞生的大学,并为学生提供了延伸阅读的论文与书目。AI生成的小论文完全不会涉及到相关的案例与史料。
被“投喂”的答案不断加深学生刻板印象
事实上,我们的课程之所以被列为通识人文必修课,在教学目标中就涵盖了“增进学生对于中西方文化多样性的认知,在此基础上形成并坚定对自身文化的认同感”。课程通过比较研究的方法,希望可以打破学生此前的某些既有印象,获得更广阔多元的研习视角,而AI生成的内容却以无法保证准确性的同质化观点,不断加深学生的刻板印象,助长文化偏见。
究其原因,这类AI写作工具并非真正的思考主体,它们的运转机制是在人类生成的大量文本中提取数据,再通过整合生成答案,因此这些答案的生成取决于在网络世界中被“投喂”了哪些数据,以及“投喂”了多少量,很容易引发偏见问题。
同时,AI生成内容无法保证其准确性。例如,在一篇作业中,出现了将宋代诗人陆游所作《秋夜将晓出篱门迎凉有感》误写为“唐代诗人杜牧的《秋夜将晓树桑鸟》”的常识错误,还出现了“明代小说《红楼梦》”等错误说法,再搭配上查无此证的参考文献,可谓一本正经胡说八道了。
同时,AI生成的文章行文逻辑混乱无序。与内容错误并行的是行文缺乏清晰、合理、有序的逻辑,这更加剧了这类文本“胡说八道”的程度。在一篇试图从经济发展的角度讨论中西方文化差异的作业中,提到中国文化的优点在于注重家庭和社会的关系,这一观点也出现在许多AI生成的其他不同主题的作业中。更不用说,众多重复、错乱的语句,占据了全文大量篇幅。
让AI从助长“学术不端”转向“学习助手”
生成式AI工具已经越来越深地介入高校学术写作,针对此类技术进行规范治理迫在眉睫。但是笔者在面对近两年众多学生使用AI生成的文本时,还发现了一些有意思的现象,这不禁令人思考:除了在规范、制度的层面对AI工具的使用进行管理,对于教师而言,是不是可以从课程设计、教学模式等角度进行改革,从而使技术从助长“学术不端”转变为“学习助手”?
首先,这类生成式AI工具不擅长针对一些比较复杂且精细的问题输出论文。课程期末考核要求学生只需在3道题目中选择一道进行写作,有两道的题目比较宏大,一道比较具体(需要学生设定具体的历史情境与人物)。结果,所有被认定为提交了AI代写作业的学生,选择的题目均为前两道,且AI生成内容的特征非常典型。
回顾学期中作为平时作业的小论文,写作的题目均和相应专题紧密结合,且列出了学生需要读的具体文献和需要完成的实践内容。例如,关于“城市与商业”专题,学生需在观摩《平江图》、走访苏州古城、参观苏州市规划展示馆的基础上,结合国内外学者撰写的城市研究论著,讨论有关历史上中国城市规划和坊市制度演变的问题。这类主题的论文,几乎不会出现AI生成的情况。因此,在课程内容和任务设计中,教师不妨避免设置容易泛泛而谈的问题,而将问题与课程专题结合更为紧密,甚至强化实践性、体验性的要求,促成学习者更多地参与。
其次,学生选取的国外AI软件和国内AI软件所生成的论文风格有明显差异。这不禁引发一个疑问:到底是国内和国外的生成式AI工具“写作”能力不同,还是选取不同AI工具的学生本身在提问、组织文本内容时存在差异?
其实,即使在都使用了AI技术生成全文的情况下,同一主题的文章质量也有高低。所以,老师其实也可以在教学过程中,借助这一现象,从比较文化的角度引导学生对AI生成的内容进行批判性思考。例如,对比学生本人所写的内容与AI生成的内容;对比不同AI工具针对同一主题/问题所给出的答案;对比免费与付费的AI工具所生成的文本,去追问不同文本之间有何差异,为什么会出现这种差异?然后,老师可以再将这种对比与分析的过程呈现到作业之中,一方面能避免学生直接将考题喂给AI“坐享其成”,另一方面,能够在引导学生合理使用新技术的同时加深对课程专题和相应议题的理解。
面对生成式AI工具,老师与其担心学生会因其变得“懒惰”而抗拒、禁止它,不如在新的教学任务中将其转变为能够让学生发挥更多自主性、提升参与感、主动发现问题、提出问题的助手,毕竟AI生成文章内容的质量与提问的角度息息相关。
可以预见,未来会有越来越多的作业内容带有AI生成的痕迹。除了在教学过程中进行新的尝试,期待学校对AI技术的使用作出更健全的规范,在这里,我们或许可以再留一个问题:目前的生成式AI技术往往被学生一方用来代写论文,那么会不会有一天出现了能自动评阅论文的AI软件,如果学生们知道老师“用魔法对抗魔法”采用AI技术来生成分数,还会不会那么放心大胆地依赖AI进行全文代写?