zhuomingla / zhuomingla.github.io

博客
0 stars 0 forks source link

一个简易的llm试用 | 无妄p的小站 #5

Open zhuomingla opened 3 months ago

zhuomingla commented 3 months ago

https://zhuomingla.github.io/2024/06/28/%E4%B8%80%E4%B8%AA%E7%AE%80%E6%98%93%E7%9A%84llm%E8%AF%95%E7%94%A8/?

之前在bilibili看到一个简易的llm: 虽然没完全看懂,不过还是先试着运行一下。 不过问题来了,我没有显卡,用cpu训练又太慢。于是就打算在coloab平台上训练。 将文件夹上传到谷歌硬盘,再在coloab中装载。不知为何相对路径没有用,就用绝对路径了。(估计是我填错了) 先准备数据集,用了自带的. 运行train.py 这里已经训练过两轮了大小居然要1.7G…

zhuomingla commented 3 months ago

正在考虑训练一个足够在浏览器里运行的小模型,这样就能部署在博客上了。 不觉得很酷吗,非常符合我对ai的想象