bojieli / homepage-comments

Comments for my homepage
1 stars 0 forks source link

国科大实践课题:只会基本编程的本科生也能开发 AI Agent | Bojie Li #178

Open bojieli opened 6 months ago

bojieli commented 6 months ago

https://01.me/2024/02/ucas-ai-agents-project/

Personal blog of Bojie Li

bigeagle commented 6 months ago

感觉应该做成 GPTs 发布出来,最好再把 prompt 开源了 :)

bojieli commented 6 months ago

@bigeagle 感觉应该做成 GPTs 发布出来,最好再把 prompt 开源了 :)

有几个团队要拿他们的成果发论文,申专利,所以暂时还没有开源,等到论文发表了会开源的~

shaodongyan commented 6 months ago

可以跟着老师学习吗?以前高中也做过NOI,现在是兽医学博士在读,做生物信息学方向,很想把生物信息学同AI结合起来,开发一些应用

bojieli commented 6 months ago

@shaodongyan 可以跟着老师学习吗?以前高中也做过NOI,现在是兽医学博士在读,做生物信息学方向,很想把生物信息学同AI结合起来,开发一些应用

我在创业,事情比较多,不过可以先加微信 bojustc,欢迎交流~ 这篇文章里面的 project 我也没有写 sample code 指导他们,你也可以根据上面的内容自己做一做这些 project,会有收获的。 我的 blog 里面也有很多 AI 相关的资源,比如这个 reading list:https://01.me/2023/12/llm-reading-list/

Everloom-129 commented 6 months ago

哈哈,感觉这些学生已经干的比很多人机交互论文好了

bojieli commented 6 months ago

@Everloom-129 哈哈,感觉这些学生已经干的比很多人机交互论文好了

不会吧,这些人机交互论文这么水的吗?也可能是国科大的本科生比较聪明~

TracyYXChen commented 5 months ago

@bojieli

@Everloom-129 哈哈,感觉这些学生已经干的比很多人机交互论文好了

不会吧,这些人机交互论文这么水的吗?也可能是国科大的本科生比较聪明~

人机交互领域的确有和以上课题相似的顶会论文,比如说手机语音助手, Google Research去年有一篇 “Enabling Conversational Interaction with Mobile UI using Large Language Models”;角色扮演游戏: “Personalized Quest and Dialogue Generation in Role-Playing Games: A Knowledge Graph- and Language Model-based Approach”

但这些课题和正式的人机交互论文有一些区别,比如我们需要motivate最开始这些features,一般是user persona或者用户采访。其次是evaluation,人机交互领域很少用到benchmark dataset,需要自己设计evaluation dimensions.

最重要的是,人机交互领域其实不太看重prototype的完成度,而更在乎你的findings有没有给读者带来启发。比如说,最近有一篇很有影响力的论文叫 “Why Johnny Can’t Prompt: How Non-AI Experts Try (and Fail) to Design LLM Prompts”, 也就是说,如果作者把旁观这些课题的经历写成一篇人机交互论文,说不定影响力比这几个项目论文加起来都要大😂

bojieli commented 4 months ago

@TracyYXChen

@bojieli

@Everloom-129 哈哈,感觉这些学生已经干的比很多人机交互论文好了

不会吧,这些人机交互论文这么水的吗?也可能是国科大的本科生比较聪明~

人机交互领域的确有和以上课题相似的顶会论文,比如说手机语音助手, Google Research去年有一篇 “Enabling Conversational Interaction with Mobile UI using Large Language Models”;角色扮演游戏: “Personalized Quest and Dialogue Generation in Role-Playing Games: A Knowledge Graph- and Language Model-based Approach”

但这些课题和正式的人机交互论文有一些区别,比如我们需要motivate最开始这些features,一般是user persona或者用户采访。其次是evaluation,人机交互领域很少用到benchmark dataset,需要自己设计evaluation dimensions.

最重要的是,人机交互领域其实不太看重prototype的完成度,而更在乎你的findings有没有给读者带来启发。比如说,最近有一篇很有影响力的论文叫 “Why Johnny Can’t Prompt: How Non-AI Experts Try (and Fail) to Design LLM Prompts”, 也就是说,如果作者把旁观这些课题的经历写成一篇人机交互论文,说不定影响力比这几个项目论文加起来都要大😂

谢谢分享这几个相关工作,这个 Why Johnny Can’t Prompt: How Non-AI Experts Try (and Fail) to Design LLM Prompts 确实很有意思。

bqingAll commented 1 month ago

能问下这几个应用使用的AI Agent框架是哪个吗,尤其是前3个

bojieli commented 1 month ago

@bqingAll 能问下这几个应用使用的AI Agent框架是哪个吗,尤其是前3个

没有用 AI Agent 框架,就直接用 OpenAI API。写起来也不是很困难,几百行代码就可以了。

bojieli commented 1 month ago

@Everloom-129 这么久过去都过时了吧哈哈

从去年 4 月的 GPT-4 到现在的 SOTA(GPT-4o 或者 Claude 3.5),模型能力并没有本质的提升,所以去年做的 Agent 目前也没有过时。