国科大实践课题：只会基本编程的本科生也能开发 AI Agent

bojieli commented 6 months ago

https://01.me/2024/02/ucas-ai-agents-project/

Personal blog of Bojie Li

bigeagle commented 6 months ago

感觉应该做成 GPTs 发布出来，最好再把 prompt 开源了 :)

bojieli commented 6 months ago

@bigeagle 感觉应该做成 GPTs 发布出来，最好再把 prompt 开源了 :)

有几个团队要拿他们的成果发论文，申专利，所以暂时还没有开源，等到论文发表了会开源的～

shaodongyan commented 6 months ago

可以跟着老师学习吗？以前高中也做过NOI，现在是兽医学博士在读，做生物信息学方向，很想把生物信息学同AI结合起来，开发一些应用

bojieli commented 6 months ago

@shaodongyan 可以跟着老师学习吗？以前高中也做过NOI，现在是兽医学博士在读，做生物信息学方向，很想把生物信息学同AI结合起来，开发一些应用

我在创业，事情比较多，不过可以先加微信 bojustc，欢迎交流～这篇文章里面的 project 我也没有写 sample code 指导他们，你也可以根据上面的内容自己做一做这些 project，会有收获的。我的 blog 里面也有很多 AI 相关的资源，比如这个 reading list：https://01.me/2023/12/llm-reading-list/

Everloom-129 commented 6 months ago

哈哈，感觉这些学生已经干的比很多人机交互论文好了

bojieli commented 6 months ago

@Everloom-129 哈哈，感觉这些学生已经干的比很多人机交互论文好了

不会吧，这些人机交互论文这么水的吗？也可能是国科大的本科生比较聪明～

TracyYXChen commented 5 months ago

@bojieli

@Everloom-129 哈哈，感觉这些学生已经干的比很多人机交互论文好了

不会吧，这些人机交互论文这么水的吗？也可能是国科大的本科生比较聪明～

人机交互领域的确有和以上课题相似的顶会论文，比如说手机语音助手， Google Research去年有一篇 “Enabling Conversational Interaction with Mobile UI using Large Language Models”；角色扮演游戏： “Personalized Quest and Dialogue Generation in Role-Playing Games: A Knowledge Graph- and Language Model-based Approach”

但这些课题和正式的人机交互论文有一些区别，比如我们需要motivate最开始这些features，一般是user persona或者用户采访。其次是evaluation，人机交互领域很少用到benchmark dataset，需要自己设计evaluation dimensions.

最重要的是，人机交互领域其实不太看重prototype的完成度，而更在乎你的findings有没有给读者带来启发。比如说，最近有一篇很有影响力的论文叫 “Why Johnny Can’t Prompt: How Non-AI Experts Try (and Fail) to Design LLM Prompts”，也就是说，如果作者把旁观这些课题的经历写成一篇人机交互论文，说不定影响力比这几个项目论文加起来都要大😂

bojieli commented 4 months ago

@TracyYXChen

@bojieli

@Everloom-129 哈哈，感觉这些学生已经干的比很多人机交互论文好了

不会吧，这些人机交互论文这么水的吗？也可能是国科大的本科生比较聪明～

人机交互领域的确有和以上课题相似的顶会论文，比如说手机语音助手， Google Research去年有一篇 “Enabling Conversational Interaction with Mobile UI using Large Language Models”；角色扮演游戏： “Personalized Quest and Dialogue Generation in Role-Playing Games: A Knowledge Graph- and Language Model-based Approach”

但这些课题和正式的人机交互论文有一些区别，比如我们需要motivate最开始这些features，一般是user persona或者用户采访。其次是evaluation，人机交互领域很少用到benchmark dataset，需要自己设计evaluation dimensions.

最重要的是，人机交互领域其实不太看重prototype的完成度，而更在乎你的findings有没有给读者带来启发。比如说，最近有一篇很有影响力的论文叫 “Why Johnny Can’t Prompt: How Non-AI Experts Try (and Fail) to Design LLM Prompts”，也就是说，如果作者把旁观这些课题的经历写成一篇人机交互论文，说不定影响力比这几个项目论文加起来都要大😂

谢谢分享这几个相关工作，这个 Why Johnny Can’t Prompt: How Non-AI Experts Try (and Fail) to Design LLM Prompts 确实很有意思。

bqingAll commented 1 month ago

能问下这几个应用使用的AI Agent框架是哪个吗，尤其是前3个

bojieli commented 1 month ago

@bqingAll 能问下这几个应用使用的AI Agent框架是哪个吗，尤其是前3个

没有用 AI Agent 框架，就直接用 OpenAI API。写起来也不是很困难，几百行代码就可以了。

bojieli commented 1 month ago

@Everloom-129 这么久过去都过时了吧哈哈

从去年 4 月的 GPT-4 到现在的 SOTA（GPT-4o 或者 Claude 3.5），模型能力并没有本质的提升，所以去年做的 Agent 目前也没有过时。

bojieli / homepage-comments

国科大实践课题：只会基本编程的本科生也能开发 AI Agent | Bojie Li #178