IlyaGusev / rulm

Language modeling and instruction tuning for Russian
Apache License 2.0
455 stars 50 forks source link

Пример Collab файнтюн. Ошибка на этапе скачивания базовой модели. #29

Closed Sogl closed 1 year ago

Sogl commented 1 year ago

Этап "Скачиваем базовую модель LLaMa 7B и чиним её конфиг", ошибка:

Fetching 39 files: 0%
0/39 [00:01<?, ?it/s]
---------------------------------------------------------------------------
FileNotFoundError                         Traceback (most recent call last)
[<ipython-input-5-c1f032985069>](https://localhost:8080/#) in <cell line: 8>()
      6 model_dir = content_dir / "llama-7b"
      7 base_model = "decapoda-research/llama-7b-hf" #@param {type:"string"}
----> 8 snapshot_download(repo_id=base_model, local_dir=model_dir, ignore_patterns=["LICENSE", "README.md", ".gitattributes"])
      9 
     10 patch_model_config = True #@param {type:"boolean"}

15 frames
[/usr/lib/python3.10/shutil.py](https://localhost:8080/#) in disk_usage(path)
   1329         'free', which are the amount of total, used and free space, in bytes.
   1330         """
-> 1331         st = os.statvfs(path)
   1332         free = st.f_bavail * st.f_frsize
   1333         total = st.f_blocks * st.f_frsize

FileNotFoundError: [Errno 2] No such file or directory: '/content/llama-7b'

Выполняю все последовательно. В чем может быть причина?

poteminr commented 1 year ago

@Sogl Фикс:

import os
os.mkdir(model_dir)

HF проверяет размер директории, в которую сохраняет модель. Если ее не существует, падает такая ошибка

IlyaGusev commented 1 year ago

Да, всё верно, спасибо. Раньше snapshot_download создавал папку, если её не было. Ноутбук поправлю.

Sogl commented 1 year ago

Ок, это сработало, но теперь валится на шаге "Запускаем обучение!"

---------------------------------------------------------------------------
AssertionError                            Traceback (most recent call last)
[<ipython-input-8-6f957e699393>](https://localhost:8080/#) in <cell line: 7>()
      5 get_ipython().system("cd {self_instruct_dir} && python3 -m src.train      --config-file {config_path.relative_to(self_instruct_dir)}      --train-file {content_dir / 'train.jsonl'}      --val-file {content_dir / 'val.jsonl'}      --output-dir {output_dir}")
      6 
----> 7 assert (output_dir / 'adapter_config.json').exists()

AssertionError:

Подсвечивает эту строку:

image

Я пока мало что понимаю в файнтюнинге моделей, хочу хотя бы тестовый пример нормально запустить для начала.