衡宇 发自 凹非寺
量子位 | 公众号 QbitAI
这门北大数学课,学生和老师竟然都在用AI“摸鱼”?!
不仅如此,老师还是主动推荐你用,“方便跟上授课进度”。
原来,这是一位北大数学老师专门构思并落地的AI助教,不仅能当学生的课后助理,还能当老师的贴心秘书。
对学生来说,学校的冗长教案看不懂,直接扔给AI助教,马上就能划好重点,真·喂饭喂到嘴边。
而对老师来说,一拖、一拉、一拽,3步就能把自己的课程教案丢给AI助教,省去了对着人类助教大费口舌的时间。
因为使用丝滑,这个AI助教被北大数院21级本科生刘梓豪起名为Brainiac Buddy,意为“那个聪明又勤奋的家伙”(doge)。
不卖关子了,这门课叫《图像处理中的数学方法》,开课老师是北京国际数学研究中心教授、国际机器学习研究中心副主任董彬。
整个Brainiac Buddy,由董彬团队和校外公司Answer.Ai团队联合打造。
在与量子位的交流过程中,董彬表示:
OpenAI创始成员Andrej Karpathy之前讲未来是Agent Base,我深以为然。
所以想在AI助教上试试,能不能实现个性化、定制化和互动式,以此提高教学质量。
基于不同prompt“一键变身”
Brainiac Buddy(以下简称BB),基于GPT-4开发。
团队针对数学课程进行了重点优化,首先拿来试手的就是《图像处理中的数学方法》这门课。
简而言之,通过学习和分析课程大纲、参考书、讲义和代码示例,BB不仅专业知识拔尖,“大脑”也已经是数学老师的形状了。
亲身上手体验一下~
登陆后,以《机器学习》第一章绪论章为例,可以看到如下的界面:
BB界面共有三个分栏:
最左侧,是关于本章节课件的演示文档(支持多种格式),章节相关的附件及挂载的知识库;中间栏呈现了课件文件的渲染,提供在线浏览功能;最右侧则是与BB的对话界面,可以与课件、知识库进行问题的讨论以帮助学习了解课程内容。
在右侧分栏直接提问,可以从embedding教案后的课程知识库中检索出该问题的解答。
众所周知,大模型具有通用知识,但针对具体的领域可能不是很精准。
于是基于大模型的基座模型,当前BB是基于GPT-4,把课程存储到向量数据库中,方便学生在学习知识的过程中,得到大模型的支持,帮助他们分解知识难点,使不同基础的学生都可以得到适合自己的解读方式。
不过董彬也谈到,作为研究者,其实是比较喜欢大模型幻觉(hallucination)的,“因为幻觉和创造/创新其实只有一线之隔。”
通过不同的prompt,BB能够调用不同的具体服务。
BB提供给教师最大的灵活度,让他们能够充分利用大模型优点的同时,给予最大程度的自定义prompt,让课程的交互性和交互过程按照不同的课程,呈现不同的效果。
比如调用测试模式:
又或者总结文件主要内容:
整体感受,BB没有什么花里胡哨的UI界面,使用起来和一般的AI Chatbot比较类似。
“AI Agent=大模型+记忆+主动规划+工具使用,基本上呈现出的就是现在大家看到的这个样子。”董彬说道。
至于后续对BB还有什么完善(的想法),他表示,希望能让BB能围绕一个数据库来准确提取信息,并根据问题判断,到底应该用数据库信息来回答问题,应该调用内外部工具,还是调用通用能力回答问题。
AI 辅助数学学习
目前AI工具这么多,为什么要专门做这样一个AI助教?
其中当然有现实的掣肘。
最基础的,就算只把《图像处理中的数学方法》这门课的教案丢给GPT,也已经超出了GPT系列的token限制。
但更多来源于董彬本人的认知和实践。这也是他寻求与校外公司Answer.AI合作,做出BB,并实际运用到课程中的主要原因。
董彬虽然是数学专业出身,但2016年起转向机器学习,现在的主要研究领域为科学计算、机器学习及其在计算成像和数据分析中的应用。
他自称从大模型大显威力的第一天起,就是其忠实追随者,根本没有国内外那些大学“先禁用再应用”的心态转变。
尤其是GPT-4问世后,董彬成为了大模型高频率的重度依赖用户,“它很大的作用,不是帮我干杂事,而是我通过它来学东西”。
董彬的切身体验是,只要问题问得好,回答的质量就会非常高。无论何时何地,只要有突发奇想,就可以跟领域内最博学的“人”交流,并且从不觉得他提出的问题蠢。
有了这样的体验,董彬脑子里冒出一个念头:
不行,要给我的学生也配备这样一个工具。
“学习就是跟作者交流,听作者讲课,接受知识的形式是非常被动的。”董彬解释,“听课或看书的过程中,会产生各种各样的疑问和想法。但老师的认知、精力、耐心都是有限的。”在他看来,如果无法跟作者交互,学习就会变得非常低效,特别是还无法1v1答疑解惑的情况下。
但AI 助教,或者说大模型,就遍读全人类知识,且精力和耐心永远充沛,能够“极大程度上提升教育的效率,以及个性化和定制化。”
有了自己的想法,恰巧教过的两位学生——数学学院21级本科生刘梓豪和20级本科生唐艺铭,想跟随董彬做一些暑期项目。
于是,BB被提上日程。
这时候董彬了解到了Answer.AI。这家创业公司旨在利用智能助教(AI Tutor)让广大学生享有到最优质的教育资源和最好的学习体验。他们的教育产品发布后,在很短时间内取得美区iOS教育榜单第三名的成绩。
恰巧,他们也希望与各个学校和机构一起探索全新的教学方式,并提供成熟的产品和技术方案。
和Answer.AI接触后,董彬带着刘梓豪和唐艺铭与其工程师团队交流了自己的想法,双方一拍即合。
而后,Answer.AI 为BB提供了产品化方案。并且在工程师的帮助下,最终完成了BB的计划、设计、数据处理、自然语言编程、UI制作等。
后续可能做“学会提问”主题在线分享
最后,正式介绍一下这位热情邀请学生在课程中使用AI助教的数学老师。
董彬,北京大学北京国际数学研究中心长聘教授、国际机器学习研究中心副主任、国家生物医学成像科学中心研究员。
2003年,他在北京大学数学科学学院拿下学士学位,两年后,在新加坡国立大学数学系获得硕士学位。
后来,董彬又远赴UCLA数学系,并于2009年获得博士学位。
他表示,希望更多的同僚同侪参与使用BB,能够从中得到更多反馈和启发。
根据目前得到的一些反馈来看,最令董彬“痛心疾首”的,就是学生在对AI提问能力上的欠缺——既不爱提问题,也不擅长提问(prompt)。
普遍来讲,学生总是爱直接把问题本身丢给AI。
这本身没什么问题,但还达不到事半功倍的效果。
在量子位的追问下,董彬分享了自己常用的提问模式。在他每一次针对具体问题的提问中,往往含有好几步过程:
相比于直接把问题本身丢给AI,然后不停追问,这样的方式可能两三轮就能很好地解答一个问题。
董彬举了个近期的例子。
最近,他和基础数学家何旭华在arXiv上挂了一篇用机器学习辅助数学前沿探索的论文。第二天,何旭华的一位合作者看到论文,发来一封邮件,开头是“et tu Brutus”。
董彬此前从未见过这个表述,于是去问了Claude。
对比可见,只有完整告诉Claude背景信息,它的解读才会正确,还给人一种“情商很高”的感觉。
作为AI重度用户,董彬在日常和做报告时发现,好的提问和不好的提问,得到的答案差异其实有明显差异。
往后会考虑开设课程或进行在线分享,让学生学会如何提问。
通过BB,董彬使用prompt的经验和方法论也可以更方便的沉淀给学生,通过教师功能,可以方便的为每个章节设置独特的prompt。
据了解,后续BB会为学生提供prompt预设功能,并针对学生提供快捷输入prompt的功能,以提高使用体验。
以及现阶段,董彬刚在arXiv上挂出了一篇论文《Prompt Engineering Through the Lens of Optimal Control》,有关从最优控制视角解读交互工程,感兴趣的小伙伴可以阅读一下~
arXiv:https://arxiv.org/pdf/2310.14201.pdf
Answer.ai邮箱:business@answerai.pro
— 联系作者—
— 完—
「量子位2023人工智能年度评选」开始啦!
今年,量子位2023人工智能年度评选从企业、人物、产品/解决方案三大维度设立了5类奖项!欢迎扫码报名
MEET 2024大会已启动!点此了解详情。
点这里👇关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~