出售本站【域名】【外链】

微技术-AI分享
更多分类

在计算机科学教育中的生成式人工智能应用 [译]

2025-01-11

正在计较机科学教育中的生成式人工智能使用

戴要

2023 年夏,咱们正在哈佛大学的 CS50 课程中引入了一淘 AI 软件工具。那些工具最初面向约莫 70 名夏季课程的学生,随后向数千名线上学生开放,并正在同年秋季扩展到校园的数百名学生。

遵照课程政策,咱们激劝学生运用那些专为课程设想的工具,同时限制了他们运用 ChatGPT、GitHub Copilot 以及新版 Bing 等商业 AI 软件。咱们的目的是通过软件真现濒临 1:1 老师对学生的比例,使每位学生都能随时领有一位以教学为导向的学科专家助手。

那些工具的设想宗旨是引导学生摸索处置惩罚惩罚方案,而非间接给出答案。学生对那些工具的回响积极,他们默示那就像领有了一位“个人导师”。咱们的钻研发现,将 AI 有战略地融入教育环境可以通过供给连续的赋性化撑持,提升进修体验,并协助教育者处置惩罚惩罚更复纯的教学难题。

正在原文中,咱们将具体讲演 AI 工具如安正在 CS50 课程中提升教学和进修成效,次要波及代码片段评释、代码格调改进,以及对课程探会商坛上的课程内容和止政问题的精准回应。另外,咱们还将分享咱们的办法论、施止细节,以及对这些思考正在教育规模使用那些工具或 AI 技术的人的倡议。

1 弁言

正在群寡对基于大语言模型(LLMs)的生成式 AI 的浓郁趣味之中,人们也对 AI 烦扰教育的可能性感触忧愁。如今学生们能彻底依赖 AI 完成做业以至写做论文,那对教育的根柢目的形成为了挑战。因而,很多教育者选择了一种间接反馈:彻底制行运用 AI。

咱们回收了差异的战略,将生成式 AI 自动融入哈佛大学的计较机科学入门课程 CS50,那个课程面向专业和非专业学生。咱们不只采纳了生成式 AI,并正在课堂中丰裕操做它,还制订了相关规矩,以担保学术诚信和促进有效进修。CS50 领有宏壮的校内学生群体和通过 OpenCourseWare 抵达的寰球正在线映响力,使其成为评价差异对 AI 教学办法有效性的抱负平台。

2023 年夏季和秋季期间,咱们积极测试了一个由 AI 驱动的聊天呆板人,那个呆板人是做为专为 CS50 设想的虚拟小皇鸭(借鉴小皇鸭调试法)的一局部。咱们首先正在约莫 70 名夏季学生中陈列了那个被称为 CS50.ai 的 CS50 小皇鸭,随后向数千名正在线学生开放,最末又推广到约莫 500 名校园学生中。原文记录了咱们开发 CS50.ai 的历程,蕴含逢到的挑战、提出的处置惩罚惩罚方案和得到的成绩,那一切都是为了真现咱们历久以来的目的:真现 1:1 的老师取学生比例。

2 动机

为了应对人工智能(AI)正在教育规模激发的担心,咱们正在 CS50 课程中检验测验联结 AI 停行教学。攻讦者们将像 ChatGPT 那样的工具称为“教育界的苦难”[12],因为它们可能滋长学术狡诈止为,使学生能够将 AI 生成的做品假冒原人的成绩。做为同样关注学术诚信问题的教育者[7],咱们认识到某些 AI 工具可能对计较机科学初学者过于“友好”,给他们带来困扰。取其余课程一样,咱们迅速制订了制行运用 ChatGPT、GitHub Copilot 以及其余可以供给或完成问题答案的 AI 软件的规矩。但同时,咱们也意识到,假如不哄骗 AI 的壮大潜力来富厚学生的进修历程,这将错失一个可贵机会,那是很是痛惜的。

先前的钻研曾经会商了如何调解 AI 工具,使其更好地效劳于学生。譬喻,斯坦福大学的钻研人员通过运用一种叫作 ProtoTransformer 的元进修技术,展示了 AI 正在教育中的使用,该技术正在应声学生代码方面的精确度以至赶过了教学助理[13]。另外,Reis 等人的钻研显示,AI 生成的赋性化提示显著减少了学生正在找到准确处置惩罚惩罚方案时的勤勉[10]。日渐删长的证据讲明,AI 有潜力改制进修应声历程、促进批评性思维,并加强处置惩罚惩罚问题的能力[11]。

出格是正在 CS50 校园课程中,AI 能够协助补救抱负中的一对一教学取现真中资源限制之间的差距。只管咱们领有不少教学助理,但要满足一个 500 人班级的多元化需求依然是一个挑战。AI 曾经正在撑持差异水平进修者方面阐扬了要害做用[14],成为当今教育中的重要工具。

正在范围较大的正在线课程中,学生可能从未有机缘取老师间接交流。以 CS50 的大范围公然正在线课程(MOOC)为例——截至目前已有赶过 500 万注册者——学生但凡只能向其余学生寻求协助。假如 AI 助教能够供给比学生更专业的知识,并且暗示得像一个良好的导师,这么那应付这些可能永暂不会取课程讲师互动的学生来说,将是一个弘大的冲破。

最末,咱们的目的是模拟一对一教学的抱负形态,通过运用像 OpenAI 的 GPT-4 那样的生成式大语言模型(LLM),为每位学生供给一个个人专家。那样的教学方式旨正在引导学生,而不是间接给出答案,并且能够紧跟课程的更新和厘革。

3 处置惩罚惩罚方案

咱们最初的目的是开发一些简略的观念验证名目,那些名目逐步演变为更为高级的工做,宗旨是为学生供给片面的工具集,帮助他们进修 CS50 的课程内容。那淘工具蕴含:

“评释高亮代码”,用于便利的评释选中的代码;

代码格调评价工具 style50 的加强版;

CS50 小皇鸭,一个能够通过多个平台回覆课程相关问题的聊天呆板人。

所有那些工具均由咱们的一体化网络使用步调 CS50.ai 供给撑持。CS50.ai 不只能快捷精确地供给 AI 生成的回覆,而且还内置了取咱们的教学理念相符的“教学帮助门径”,引导学生自主进修,而不是间接给出问题的答案。

3.1 评释高亮代码

咱们首先开发了一个名为“评释高亮代码”(EHC)的 xS Code 扩展工具,其模仿人类老师的方式,为学生供给代码片段的立即英文评释。(学生只需高亮一止或几多止代码,就能获得评释。)那个工具补充了 CS50 现有的代码准确性检测工具 check50,为代码的语义层面供给立即的评释。此刻,学生随时都可以与得代码的立即解析,那使得面劈面的领导光阳变得愈加高效,学生可以更多地专注于会商高层次的设想问题,而不是纠结于根原的疑问解答。

3.2 提升代码格调

咱们还改制了 style50 —— 该课程顶用于检查代码格调的号令止工具 —— 将其做为一个带图形界面的 xS Code 扩展从头真现。那个新版原能够将学生的代码取依据 CS50 格调指南劣化后的版原停行曲不雅观对照。另外,那个扩展还供给了一个“评释变更”按钮,学生点击后可以间接与得对 style50 倡议的作做语言评释。那些罪能让 style50 成了一个互动式进修工具,它像人类老师一样供给辅导,协助学生更明晰地了解和理论代码的语法劣化。

3.3 CS50 小皇鸭

咱们的所有 AI 工具均由同一 CS50.ai 后端撑持,那确保了咱们正在 AI 使用上的办法保持一致。为了让学生能够像运用 ChatGPT 这样,较为自由地接触 AI 模型,咱们专门建设了一个独立的网站供学生运用 CS50 小皇鸭。学生可以通过那个网站,以一种受控制的方式,间接取 GPT-4 停行互动,如图 1 所示。

图 1: 在 CS50.ai 的主页上,学生们可以与 CS50 小黄鸭进行交流,这是一个互动型的“小黄鸭调试工具”。

图 1: 正在 CS50.ai 的主页上,学生们可以取 CS50 小皇鸭停行交流,那是一个互动型的“小皇鸭调试工具”。

CS50 小皇鸭不只可以通过 CS50.ai 网站运用,还可以通过一个径自的 xS Code 扩展停行会见,如图 2 所示。无论是哪种方式,学生们都能与得雷同的 AI 帮助体验。CS50 小皇鸭操做 GPT-4 的高下文了解罪能,为学生们供给了实正互动的教取学体验,并严格遵照 CS50 的教学准则。

图 2: CS50 的学生也可以在 VS Code 中使用 CS50 小黄鸭,讨论计算机科学相关话题、解析代码,或提出代码风格改进建议。

图 2: CS50 的学生也可以正在 xS Code 中运用 CS50 小皇鸭,探讨计较机科学相关话题、解析代码,或提出代码格调改制倡议。 3.4 CS50 小皇鸭正在 Ed 平台上

历久以来,咱们接续正在课程中运用 Ed [2] 那个第三方平台做为线上探会商坛,以供给异步协助。正在 Ed 上,学生可以提出问题,并从课程团队和同学这里获得辅导,那大大简化了探讨的历程,减少了问题重复,促进了同学间的竞争。

为了进一步加强 Ed 的罪能,咱们操做其 HTTP 乞求特性,将 CS50 小皇鸭集成到了平台中。如图 3 所示,CS50 小皇鸭可以参取探讨并正在须要时供给答案。咱们正在 CS50.ai 使用中为 Ed 上的 CS50 小皇鸭专门设置了一个 API 接口,那样咱们就能够控制 GPT-4 生成的回复,确保 CS50 小皇鸭的止为取课程内容和教学理念相符,而不只仅是间接回覆学生的问题。

图 3: 在 Ed 上,CS50 小黄鸭的实际应用场景。一名学生提出了问题,CS50 小黄鸭则提供了一个简洁的答案,随后被一名课程工作人员确认为正确。

图 3: 正在 Ed 上,CS50 小皇鸭的真际使用场景。一名学生提出了问题,CS50 小皇鸭则供给了一个简约的答案,随后被一名课程工做人员确认为准确。

通过正在 Ed 上的 CS50 小皇鸭,咱们的目的是通过供给立即且颠终精心筹备的回应来富厚学生的进修体验。咱们的宗旨是帮助人类教学,而不是替代它。为了保持那一准则,所有 CS50 小皇鸭的回复都必须获得课程工做人员的否认、批改或增除。Ed 的用户界面为此供给了相应的收配选项。

4 施止细节

正如图 4 所展示的,咱们开发了 CS50.ai 做为咱们所有 AI 工具的收撑平台,卖力打点每个用户取 GPT-4 的交互通信。详细来说,咱们给取的是陈列正在 Microsoft Azure [8] 上的 GPT-4 版原。学生的查问首先被发送至 CS50.ai,正在此去除任何个人身份信息(PII)。随后,那些查问被进一步转化为构造化的查问乞求,即咱们所说的“提示词(Prompt)”。那些提示词联结了特定课程的规矩和辅导准则,以及本始的学生查问,宗旨是引导 GPT-4 更精确地生成具有情境感知的回覆。

应付来自 Ed 探讨平台的学生查问,CS50.ai 给取了一种叫作“检索加强式生成”(RAG) 的办法来生成回覆。那种办法通过引入外部起源的事真数据,进步了生成式大语言模型的精确性和牢靠性,有效减少了模型孕育发作虚假信息的可能性。咱们正在构建提示时融入那些事真数据,以便 GPT-4 能生成愈加精准和贴近真际情境的回覆。

整个系统构架是一个高效流畅的形式,CS50.ai 和 GPT-4 协同工做,迅速为学生供给精确且有价值的答案。

图 4: CS50.ai 的系统架构。GPT-4 负责生成对学生查询的回答,并可选用检索增强式生成技术,通过整合外部来源的事实数据来提高回答的准确度。

图 4: CS50.ai 的系统架构。GPT-4 卖力生成对学生查问的回覆,并可选用检索加强式生成技术,通过整折外部起源的事真数据来进步回覆的精确度。 4.1 提示词(Prompts)

正在取像 GPT-4 那样的大语言模型互动时,提示词起着控制对话的要害做用。从 CS50.ai 发出的对 GPT-4 的每一次乞求,都包孕了系统提示和用户提示。系统提示用于设定特定课程的规矩和指南,而用户提示则包孕了真际的学生查问,即 GPT-4 须要回覆的问题。

咱们可以通过差异的提示来创立各类处置惩罚惩罚特定任务问题的“智能体”。比如,正在 CS50.ai 的每次互动中,咱们都会运用一个定制的系统提示,引导模型饰演 CS50 的助教角涩。接着,咱们发送包孕真际学生查问的用户提示,那些提示是正在一组牢固指令的根原上构建的。颠终多次迭代后,咱们针对差异的运用场景,如解答计较机科学相关问题、评释代码片段、供给代码格调应声等,创立了多个差异系统提示和用户提示模板的配置文件(给取 YAML 格局)。

4.2 聊天补全

大语言模型 (LLM) 能够接管一系列的输入提示,并孕育发作 AI 生成的回复。CS50.ai 给取了 OpenAI 的聊天补全 API。那个工具能办理各类提示,每个提示都有特定的角涩——如“系统”、“用户”或“助理”,用以模拟一场对话。

一场对话但凡从一个系统提示初步,它设定了助理应遵照的场景和止为规矩。紧接着,用户的提示则包孕了详细的问题或呈文,等候 LLM 的回应。

咱们首先制订好系统和用户的提示,而后将它们做为输入发送给聊天补全 API。为了营造一种联接的对话流,咱们把 AI 的回复参预到一个存储着用户问题的数组中。那样,每次对话的全副内容都会从头输入到 GPT-4,为接下来的 AI 回复供给了高下文。跟着对话的继续,那个历程会不停重复。

4.3 检索加强生成 (RAG)

有时,大语言模型 (LLM) 可能会孕育发作一些听起来折法但真际上舛错的回应,咱们称之为“幻觉”[3]。那是因为 AI 模型正在大质文原数据上训练,尽管能流畅生成文原,但其真不总是关注事真的精确性。另外,LLM 有时遭到知识截行的限制,仅能运用到最近训练会话时的信息,无奈获与真时更新或训练后的变乱。

为理处置惩罚惩罚那个问题,咱们可以运用一种叫作检索加强生成 (RAG) 的技术。那种技术通过联结外部数据源中的事真,来进步 LLM 的精确性和牢靠性 [5]。譬喻,咱们操做 OpenAI 的嵌入(Embeddings)API,为 CS50 课程的字幕制做文原嵌入,那样就建设了一个基于事真的外部数据源。那些文原嵌入其真便是一系列数字,它们代表着文原的含意,协助呆板进修算法更好地了解和运用数据。

咱们的数据筹备流程是那样的:首先,将课程讲座的英笔朱幕收解成每段 30 秒的小片段。而后,咱们运用 OpenAI 的 teVt-embedding-ada-002 模型为那些片段创立嵌入,并将它们存储正在 ChromaDB 向质数据库中。接着,对每个学生提出的问题也停行嵌入办理,并正在数据库中搜寻,找出取问题最相关的讲座字幕片段。最后,咱们将那些相关的字幕片段和学生的问题一起输入到 GPT-4,由 AI 协助生成回应。

通过那种 RAG 办法,咱们能够降低 GPT-4 正在回覆详细讲座问题时显现“幻觉”的可能性,而且那样作不须要对大语言模型停行耗时且计较资源密集的微调或从头训练。

4.4 如何避免恶意提示打击

恶意提示打击指的是恶意用户向大语言模型(LLM)输入误导性指令,以扭转其止为,比如让 GPT-4 供给详尽的家庭做业解答。

为了应对那种威逼,咱们正在 CS50.ai 中参预了一种“防护”机制。它能检测学生的每一项乞求,查找能否存正在异样的标记或形式,那些可能是打击的迹象。一旦发现可疑状况,CS50.ai 就会径自挪用 GPT-4 的 API,判断那能否是一个一般的查问还是恶意提示打击。若判定为打击,系统会立刻末行该用户的会话,避免被滥用。

4.5 通过 HTTP 恳务真现取 Ed 的集成

CS50.ai 能办理和加强 HTTP 乞求,那使得它可以取第三方正在线平台协同工做。譬喻,正在 Ed 平台上,学生之间的互动次要发作正在论坛帖子(学生建议的主题或问题)和评论中。咱们正在 Ed 上的 CS50 小皇鸭设想用于监控那些帖子和评论,并依据特定的范例(如帖子的类别)来决议能否须要回应。

当学生建议一个帖子时,Ed 上的 CS50 小皇鸭会首先确认那能否是一个问题,检查能否由教职员发布,以及能否折乎某些预设的类别。一旦那些条件都满足,CS50 小皇鸭便会向 CS50.ai 的 API 端点发送带有帖子相关数据的乞求,以孕育发作相应的回复。

通过那种方式,CS50.ai 正在办理 HTTP 乞求方面的活络性协助咱们扩充了 CS50 小皇鸭正在差异正在线平台上的做用和映响力,为学生们供给了无论正在那边都能与得的高量质教育撑持。

4.6 运用频次限制

CS50.ai 通过一个可室的爱心计数器来限制运用频次。每位学生初始有 10 颗爱心,每隔三分钟可以规复一颗。每次取 CS50 小皇鸭互动都会泯灭一颗爱心,那样可以避免滥用止为。那样作另有助于降低运止 CS50.ai 的老原,因为每次向 GPT-4 发送乞求都会孕育发感化度。

另外,那种运用限制对学生进修也有积极映响。首先,它激劝学生正在取 CS50 小皇鸭互动时愈加三思而止,促使他们谨慎地提出问题。那种作法旨正在造就学生独立处置惩罚惩罚问题的才华和提出精准问题的能力,那对进修自身很是重要。其次,那种限制也激劝学生停行深思性的休息,协助他们带着新的室角从头考虑和办理复纯的问题。

5 结果 5.1 学生应声

2023 年夏季,咱们邀请了约莫 70 名加入 CS50 课程的学生,正在课程完毕时填写了一份非匿名盘问拜访,以聚集他们对咱们 AI 工具的运用体验。学生们的应声普遍很是正面,他们对 AI 工具正在处置惩罚惩罚难题时的协助性、有效性和牢靠性给以高度评估:

“几多乎难以置信,就像有一个私人领导教师一样...我出格不雅观赏 AI 呆板人回覆问题时的客不雅观公允,纵然是最简略的问题也不会被小觑。它展现出了超乎寻常的浮躁。”

“我实的很感谢那些 AI 工具,出格是正在当前 AI 正在编程中越来越普及的布景下。能够提早适应取 AI 工具的协同工做,觉得很棒,而不是感觉那些工具正在妨碍咱们。CS50 课程推出原人的 AI 版原也很让人不雅观赏,因为仅仅运用像 chatGPT 那样的工具可能会减弱进修成效。”

“AI 工具对我协助很大。它们向我评释了一些我不太清楚的观念,并教会了我处置惩罚惩罚特定问题所需的新知识。AI 工具不只给了我足够的提示让我独立检验测验,还帮我阐明舛错及可能逢到的问题。”

正在接下来的 2023 年秋季学期,咱们对约莫 500 名校园学生停行了两次非匿名盘问拜访,一次正在学期中期,另一次正在学期终,以此来理解他们对 AI 工具的观点和应声。学期中期的盘问拜访显示,学生们对 AI 工具的运用状况多样但普遍频繁:

(1)17% 的学生每周运用那些工具赶过十次,32% 的学生每周运用 5 到 10 次。另外,26% 的学生每周运用 2 到 5 次,另有 25% 的学生每周运用不赶过两次。

(2) 正在工具的协助性方面,大大都学生认为课程中的 AI 工具很无益处。详细来说,47% 的学生认为它们“很是有协助”,26% 的学生感觉“有协助”,21% 的学生认为“稍有协助”,另有 6% 的学生认为“没什么协助”。

(3) 正在评估那些工具对进修提升的有效性时,学生们的应声同样积极。35% 的学生认为它们“很是有效”,35% 的学生认为“有效”,25% 的学生认为“稍有效”,5% 的学生认为“无效”。

(4) 尽管学生们被见告要“批评地考虑”,不应自发相信由 AI 生成的信息总是准确无误的,但约莫有 23% 的学生对咱们的 AI 工具回覆的精确性很是自信,46% 相对自信,27% 略微有些自信,另有 4% 默示不太自信。

正在学期终的盘问拜访中,到目前为行已有 73% 的学生作出了回应:

(1) 50% 的学生默示他们“常常”运用咱们的 AI 工具,而有 28% 的学生默示“接续”正在运用它们,那讲明他们对那些工具很是依赖。同时,19% 的学生“偶尔”运用它们,只要 3% 的学生从未运用过。

(2) 咱们的 AI 工具普遍被认为是无益的,33% 的学生感觉它们“总是有协助”,55% 的学生认为它们“常常有协助”。然而,也有 11% 的学生感觉它们“偶尔有协助”,1% 的学生认为它们“从未有协助”。

(3) 总体上,学生们对咱们的 AI 工具很是折意:53% 的学生“很是喜爱”它们,33% 的学生“喜爱”它们。另一方面,13% 的学生持中立观点,只要 1% 的学生默示“不喜爱”它们。

依据咱们的不雅察看,不少学生会将 CS50 小皇鸭人格化,室其为一个友好的同伴。咱们认为,那种亲切感促进了咱们 AI 工具的乐成,因为学生们乐于取一个敬爱的小皇鸭聊天,而不是取一个没有表情的呆板人。正如一位学生所说:“超级喜爱那只小皇鸭,咱们如今曾经成为冤家了。”

不过,咱们的 AI 工具也曾显现误解问题并给出舛错倡议的状况。偶尔的舛错自身是可以承受的——究竟人类老师也会犯错。但 AI 往往纵然舛错也会暗示出满满的权威自信,而人类正在回覆时可能会暗示出一定的糊口生涯。类似于其余 AI 聊天呆板人的固有局限,CS50.ai 有时正在舛错地“幻觉”信息时也暗示出过度的自信。但最近的钻研讲明,大语言模型 (LLM) 很快可能就能正在适当的时候表达出不确定性 [6]。

也有学生倡议减少运用限制,因为他们更喜爱无限制地取 CS50 小皇鸭聊天。思考到限制的设置既是出于老原思考,也是为了教学宗旨,咱们近期不筹算撤消那些限制。但跟着老原和运用情况的厘革,咱们将连续调解那一战略。

5.2 回覆的精确性阐明

为了查验 CS50 小皇鸭正在 2023 年夏季 Ed 平台上的暗示,咱们邀请了一位非开发团队的资深课程员工对 CS50.ai 供给的回覆停行了评价。正在夏季课程中,CS50 小皇鸭正在 Ed 上共发布了 64 个回覆,此中 25 个波及课程内容,39 个波及日常打点事务。咱们的发现如下:

正在 25 个课程相关的回覆中,有 22 个(占 88%)是准确的。

正在 39 个打点相关的回覆中,有 30 个(占 77%)是准确的。

打点事务回覆精确率略有下降,那正在咱们意料之中。起因是,做为根原的 GPT-4 模型是依据一定光阳点前的数据训练的。跟着光阳的推移,CS50 课程的教学纲领发作了厘革,使得 GPT-4 取课程的最新内容不彻底婚配。而应付 88% 的课程内容回覆精确率,咱们认为那相比 GPT 正在编程问题上的根柢暗示有了显著提升。最新钻研显示,ChatGPT 正在回覆软件工程相关问题时,准确率仅为 48% [4]。

截至原文撰写,2023 年秋季学期刚完毕,咱们刚初步评价 CS50 小皇鸭正在秋季正在 Ed 上的暗示。正在秋季,CS50 小皇鸭总共回覆了 180 个问题,但仅有 70 个与得了教职员工的“否认”,初阶看来精确率仅为 39%(比夏季有所下降)。但咱们认为,那个数字可能低估了 CS50 小皇鸭的真际暗示,因为学生运用 Ed 的频次曾经大幅下降。譬喻,正在 2022 年秋季,学生们通过 Ed 均匀每人提出了 0.89 个问题;到了 2023 年夏季,那个数字回升到每人均匀 1.1 个;但正在 2023 年秋季,那一数字降至每人仅 0.28 个(那些数据蕴含了校内外的学生)。

鉴于 CS50.ai 正在 2023 年秋季曾经片面投入运用,咱们揣测不少学生转而通过 xS Code 和 CS50.ai 官网取 CS50 小皇鸭停行更立即、对话式的互动,而不是正在 Ed 上提问。咱们还猜想,学生可能正在通过其余方式向 CS50 小皇鸭提问未获折意答案后,会将更复纯的问题转至 Ed,寻求人工解答。由于咱们刚初步阐明 2023 年秋季的数据,那些只是目前的初阶揣测。

5.3 运用总结

从 2023 年 6 月起,咱们的 AI 工具正在寰球领域内,特别是正在校园中获得了宽泛使用。截至 2023 年 12 月,CS50.ai 已吸引赶过 50,000 名独立用户。至今,咱们总共办理了赶过 180 万次查问。

日均独立生动用户数质显著回升,从 2023 年 6 月的约 200 人删至 9 月的 1,000 人,再到 11 月抵达 1,500 人。目前,每天创立的提示数质涌现回升趋势,峰值抵达每天 25,000 个,如图 5 所示。同时,用户均匀每天创立的提示数质也从最初的每人每天 5 个删多到如今的每人每天 15 个,那反映出用户对咱们 AI 工具的运用愈发密集。

图 5:展示了随时间推移每日提示创建数量的图表。目前,通常每天约有 15-20K 个提示被创建。

图 5:展示了随光阳推移每日提示创立数质的图表。目前,但凡每天约有 15-20K 个提示被创立。

只管 11 月的用户流动质很大,但咱们的老原仍然正在折法领域内,约莫每位学生每月 1.90 美圆,每条提示词 0.05 美圆。思考到学生积极的应声和进修体验的提升,那是一项值得的投资。另外,像 OpenAI 和 Microsoft 那样的公司但凡会为教育用途供给免费信毁额度,从而协助减少老原。

因而,咱们连续监控并调解咱们的 AI 工具,以进步效率并降低老原。咱们的举动蕴含进步 RAG 的成效、调解运用限制,并确保工具能精确回应学生的查问。

6 将来工做 6.1 评价代码设想

正在 CS50 课程中,学生的做业次要依据准确性、格和谐设想停行评估。此中,准确性和格调是通过两个主动化工具 check50 和 style50 来评分的。check50 卖力检查代码能否满足任务要求,而 style50 则评估代码能否遵照了编程格调本则。然而,评价学生的代码设想才华也很要害,那局部目前依然须要人工评价。正在 CS50 的网络课程中,由于课程范围宏壮,代码设想以至没有被评价。评价代码设想不只有助于理解学生的编程组织才华和效率,但人工评价既耗时又可能带有主不雅观性。

为了进步评价的一致性和效率,咱们筹划开发一款名为 design50 的 AI 工具,专门用于主动化的设想评分。那个工具可以为每个提交的做业供给统一的应声,从而减轻人工评分的工做质。事真上,先前已有钻研证真了那种办法的有效性 [1]。咱们的目的是训练 design50 依据人工评价的范例来主动评分,最末只需人工确认评价结果,那将使评分历程更倏地、更范例化。

6.2 扩展到其余课程

正在 CS50.ai 乐成使用于咱们的暑期课程之后,咱们将其扩展到了其余 10 个相关的网络课程。那些课程涵盖了从游戏设想到 SQL,再到网络安宁等多种主题。只管那些课程全年对寰球成千上万的学生开放,CS50.ai 使咱们能够供给全天候的撑持。

为了真现那一点,咱们开发了一个能够主动更新知识库和提示库的模块化配置系统,让咱们可以针对每门课程的非凡教学内容和办法调解 AI 工具。将来,咱们欲望借助那一系统,将 CS50.ai 的使用扩展到更多课程中,无论是正在科学技术、工程和数学(STEM)规模,还是人理科学规模。

7 结论

正在一个夏季的真际使用和一个秋季的深刻测试之后,咱们认为咱们为 CS50 筹备的 AI 工具组折很是乐成。咱们相信,相应付彻底制行 AI 的办法,咱们“设限”的运用办法至少有了鲜亮的劣势。咱们欲望通过供给咱们的 AI 工具,减少学生操做网络上其余 AI 工具停行学术不诚真的止为。

每一款 AI 工具都不单是一个真践观念。基于大质的运用数据和学生的积极应声,CS50.ai 曾经推广到寰球数千名学生手中,证真了它正在真际使用中的价值。只管咱们仍有改制空间,但将 AI 融入教育规模已展现出弘大潜力,出格是正在提升赋性化教学协助的可与得性和让教职员工更多地关注高层次教学问题方面。

咱们的历久目的是把咱们的 AI 工具使用到更多学科规模,使 CS50 小皇鸭能够波及计较机科学之外的教育内容。咱们欲望,CS50 对 AI 的使用能为其余教育时机谈课程供给一个圭臬,展示生成式 AI 正在提升学生进修方面的潜力,而不只仅是组成烦扰。当配备了适当的保障门径后,AI 无望为教育带来革命性的改制。

称谢

出格感谢 Ed、GitHub、Microsoft 和 OpenAI 对咱们工做的撑持。还要感谢 Brenda Anderson、Sophie Anderson 和 Doug Lloyd 正在那项工做中的协助。