公司新闻
大型语言模型已经走入了我们的生活。本文作者讲述了如何在教学任务中使用它。
2022年11月下旬,我在大学的教书生涯突然遇到了一位不速之客——ChatGPT。这是一种用海量语言数据集训练的大型语言模型(LLM)算法,具有概括、翻译、创作文本的能力。
和许多教师一样,我对这个工具的最大担忧是学生在写论文时会用它来作弊。我深知确保学生作业原创性、防止学术不端的重要性。一些美国大学,比如圣路易斯华盛顿大学,已经把ChatGPT生成的文本归类为剽窃,亚洲的多所大学,比如香港大学,也全面禁止使用ChatGPT,还有许多学校没有设立清晰的规定,比如我教授空气污染课程的英国雷丁大学。
我不认为我们能完全杜绝ChatGPT的使用,因为当前的技术已经让ChatGPT生成的文本很难被识别出来。我的学生很快就要毕业,开始工作,他们的单位可能会要求他们使用人工智能模型。如果他们不会恰当地使用这些工具,这反而会拖他们的后腿。我们不能阻止学生使用计算器或互联网,我们也不能阻止他们使用ChatGPT。最好的做法是去理解这种工具,并尝试把它融入到教学中。
前几年,我都会让学生写一篇文献综述,而今年,为了防止抄袭、鼓励原创,我让学生分成小组,去校园里采集空气质量数据。不过,学生依然需要使用统计方法分析数据,自己写论文。
当然,许多学生对于建立课题很陌生。一些学生找不到评估二氧化碳排放的正确方法,我就建议使用ChatGPT来帮他们设计课题。ChatGPT会给你几个步骤:从确定采样点到如何选择二氧化碳检测设备,再到设备安装,采集和分析数据,汇报和传播研究结果。
科研分析和论文写作都是学生自己完成的,但他们也学会了如何用LLM生成研究思路、设计通用的实验步骤。
我的学生都是环境科学或地理学专业,所以很多人都不太精通编程语言,比如R语言或Python。我有时候也无法看出这些编程语言中的错误。而ChatGPT在这方面就很擅长。比如,在我的指导下,学生会用ChatGPT创建R代码,来执行他们的统计学实验,并分析校园里自然环境(如草地)和人造环境(如教室)的二氧化碳浓度差异。我发现,只要提示足够简单,ChatGPT就能给出可用的代码,比如:
提示:写一段t检验的R代码,用来分析大学校园自然环境和人造环境的二氧化碳浓度差异
我还改变了我的评分方法,来保证我的学生能更好地理解内容,同时防止抄袭。他们不仅要写论文,还要用10分钟的演讲来分享他们的研究结果。这种方式不仅能减少作弊,还增加学生评价的交互性和参与度。我给每位学生都写了反馈,指出了需要改进的地方,并鼓励他们独立思考。
ChatGPT有很多好处。但我作为我们大学黑人、亚裔、少数族裔网络的联合主席,我认为ChatGPT会给学术机构的多样性和包容性建设带来负面影响。
有一次我在课上讲到温室气体,我让ChatGPT提供关于气候变化的书单和这些书的作者。为了防止任何种族和语言相关偏见,我特意在提示中注明了“不限种族和语言”。但是,ChatGPT推荐的都是英语书籍。十个作者里有九个是白人,十个作者里还有九个是男性。
用一些旧书和网站上的信息去训练LLM,就会导致边缘化群体的观点无法被公正、准确地呈现,同时还会放大权力掌握者的声音。Meta公司推出的LLM Galactica就是因为生成了种族主义内容而被撤下。
由于训练这些LLM的大部分数据都是英语,所以它们在英语方面也最得心应手。LLM的大范围使用会进一步扩大特权阶级本就过高的代表性,而让那些代表性不足的群体更趋边缘化。
我的大学很快就会对ChatGPT的使用做出规定。如果你的大学还没有这方面的指南,以下是对如何在课堂上有效使用ChatGPT的一些建议:
5. 测试并改进提示:用ChatGPT测试提示,再根据得到的结果改进。重复这个步骤直到取得理想的结果。吉祥坊平台吉祥坊平台