Open zhuomingla opened 3 months ago
https://zhuomingla.github.io/2024/06/28/%E4%B8%80%E4%B8%AA%E7%AE%80%E6%98%93%E7%9A%84llm%E8%AF%95%E7%94%A8/?
之前在bilibili看到一个简易的llm: 虽然没完全看懂,不过还是先试着运行一下。 不过问题来了,我没有显卡,用cpu训练又太慢。于是就打算在coloab平台上训练。 将文件夹上传到谷歌硬盘,再在coloab中装载。不知为何相对路径没有用,就用绝对路径了。(估计是我填错了) 先准备数据集,用了自带的. 运行train.py 这里已经训练过两轮了大小居然要1.7G…
正在考虑训练一个足够在浏览器里运行的小模型,这样就能部署在博客上了。 不觉得很酷吗,非常符合我对ai的想象
https://zhuomingla.github.io/2024/06/28/%E4%B8%80%E4%B8%AA%E7%AE%80%E6%98%93%E7%9A%84llm%E8%AF%95%E7%94%A8/?
之前在bilibili看到一个简易的llm: 虽然没完全看懂,不过还是先试着运行一下。 不过问题来了,我没有显卡,用cpu训练又太慢。于是就打算在coloab平台上训练。 将文件夹上传到谷歌硬盘,再在coloab中装载。不知为何相对路径没有用,就用绝对路径了。(估计是我填错了) 先准备数据集,用了自带的. 运行train.py 这里已经训练过两轮了大小居然要1.7G…