[Bug]: Error Installing the RC 054

Abdulhanan535 commented 3 months ago

Your current environment

%cd /kaggle/
!git clone -b rc_054 https://github.com/PygmalionAI/aphrodite-engine.git
%cd /kaggle/aphrodite-engine
!pip install -e .

🐛 Describe the bug

Cloning into 'aphrodite-engine'...
remote: Enumerating objects: 14266, done.
remote: Counting objects: 100% (2165/2165), done.
remote: Compressing objects: 100% (539/539), done.
remote: Total 14266 (delta 1772), reused 1928 (delta 1625), pack-reused 12101 (from 1)
Receiving objects: 100% (14266/14266), 9.74 MiB | 20.68 MiB/s, done.
Resolving deltas: 100% (10462/10462), done.
/kaggle/aphrodite-engine
Obtaining file:///kaggle/aphrodite-engine
  Installing build dependencies ... done
  Checking if build backend supports build_editable ... done
  Getting requirements to build editable ... done
  Preparing editable metadata (pyproject.toml) ... done
Collecting cmake>=3.21 (from aphrodite-engine==0.5.4.dev0+cu123)
  Using cached cmake-3.30.2-py3-none-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (6.1 kB)
Requirement already satisfied: ninja in /opt/conda/lib/python3.10/site-packages (from aphrodite-engine==0.5.4.dev0+cu123) (1.11.1.1)
Requirement already satisfied: psutil in /opt/conda/lib/python3.10/site-packages (from aphrodite-engine==0.5.4.dev0+cu123) (5.9.3)
Requirement already satisfied: sentencepiece in /opt/conda/lib/python3.10/site-packages (from aphrodite-engine==0.5.4.dev0+cu123) (0.2.0)
Requirement already satisfied: numpy<2.0.0 in /opt/conda/lib/python3.10/site-packages (from aphrodite-engine==0.5.4.dev0+cu123) (1.26.4)
Collecting transformers==4.43.0 (from aphrodite-engine==0.5.4.dev0+cu123)
  Using cached transformers-4.43.0-py3-none-any.whl.metadata (43 kB)
Requirement already satisfied: uvicorn in /opt/conda/lib/python3.10/site-packages (from aphrodite-engine==0.5.4.dev0+cu123) (0.30.1)
Collecting openai (from aphrodite-engine==0.5.4.dev0+cu123)
  Using cached openai-1.42.0-py3-none-any.whl.metadata (22 kB)
Collecting einops (from aphrodite-engine==0.5.4.dev0+cu123)
  Using cached einops-0.8.0-py3-none-any.whl.metadata (12 kB)
Collecting fschat>=0.2.23 (from aphrodite-engine==0.5.4.dev0+cu123)
  Using cached fschat-0.2.36-py3-none-any.whl.metadata (20 kB)
Requirement already satisfied: pydantic>=2.0 in /opt/conda/lib/python3.10/site-packages (from aphrodite-engine==0.5.4.dev0+cu123) (2.8.2)
Requirement already satisfied: fastapi in /opt/conda/lib/python3.10/site-packages (from aphrodite-engine==0.5.4.dev0+cu123) (0.111.0)
Requirement already satisfied: colorlog in /opt/conda/lib/python3.10/site-packages (from aphrodite-engine==0.5.4.dev0+cu123) (6.8.2)
Requirement already satisfied: prometheus-client in /opt/conda/lib/python3.10/site-packages (from aphrodite-engine==0.5.4.dev0+cu123) (0.20.0)
Collecting prometheus-fastapi-instrumentator>=7.0.0 (from aphrodite-engine==0.5.4.dev0+cu123)
  Using cached prometheus_fastapi_instrumentator-7.0.0-py3-none-any.whl.metadata (13 kB)
Collecting lark==1.1.8 (from aphrodite-engine==0.5.4.dev0+cu123)
  Using cached lark-1.1.8-py3-none-any.whl.metadata (1.9 kB)
Requirement already satisfied: scipy in /opt/conda/lib/python3.10/site-packages (from aphrodite-engine==0.5.4.dev0+cu123) (1.14.0)
Requirement already satisfied: rich in /opt/conda/lib/python3.10/site-packages (from aphrodite-engine==0.5.4.dev0+cu123) (13.7.1)
Requirement already satisfied: loguru in /opt/conda/lib/python3.10/site-packages (from aphrodite-engine==0.5.4.dev0+cu123) (0.7.2)
Collecting hf-transfer (from aphrodite-engine==0.5.4.dev0+cu123)
  Using cached hf_transfer-0.1.8-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (1.7 kB)
Collecting sentence-transformers (from aphrodite-engine==0.5.4.dev0+cu123)
  Using cached sentence_transformers-3.0.1-py3-none-any.whl.metadata (10 kB)
Collecting tiktoken>=0.6.0 (from aphrodite-engine==0.5.4.dev0+cu123)
  Using cached tiktoken-0.7.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (6.6 kB)
Collecting outlines<0.1,>=0.0.43 (from aphrodite-engine==0.5.4.dev0+cu123)
  Using cached outlines-0.0.46-py3-none-any.whl.metadata (15 kB)
Collecting lm-format-enforcer>=0.10.3 (from aphrodite-engine==0.5.4.dev0+cu123)
  Using cached lm_format_enforcer-0.10.6-py3-none-any.whl.metadata (16 kB)
Requirement already satisfied: uvloop in /opt/conda/lib/python3.10/site-packages (from aphrodite-engine==0.5.4.dev0+cu123) (0.19.0)
Requirement already satisfied: pillow in /opt/conda/lib/python3.10/site-packages (from aphrodite-engine==0.5.4.dev0+cu123) (9.5.0)
Requirement already satisfied: pyzmq in /opt/conda/lib/python3.10/site-packages (from aphrodite-engine==0.5.4.dev0+cu123) (26.0.3)
Requirement already satisfied: aiohttp in /opt/conda/lib/python3.10/site-packages (from aphrodite-engine==0.5.4.dev0+cu123) (3.9.5)
Collecting nvidia-ml-py==12.555.43 (from aphrodite-engine==0.5.4.dev0+cu123)
  Using cached nvidia_ml_py-12.555.43-py3-none-any.whl.metadata (8.6 kB)
Collecting torch==2.3.1 (from aphrodite-engine==0.5.4.dev0+cu123)
  Using cached torch-2.3.1-cp310-cp310-manylinux1_x86_64.whl.metadata (26 kB)
Collecting torchvision==0.18.1 (from aphrodite-engine==0.5.4.dev0+cu123)
  Using cached torchvision-0.18.1-cp310-cp310-manylinux1_x86_64.whl.metadata (6.6 kB)
Collecting xformers==0.0.27 (from aphrodite-engine==0.5.4.dev0+cu123)
  Using cached xformers-0.0.27-cp310-cp310-manylinux2014_x86_64.whl.metadata (1.0 kB)
Collecting triton>=2.2.1 (from aphrodite-engine==0.5.4.dev0+cu123)
  Using cached triton-3.0.0-1-cp310-cp310-manylinux2014_x86_64.manylinux_2_17_x86_64.whl.metadata (1.3 kB)
Collecting vllm-flash-attn==2.5.9.post1 (from aphrodite-engine==0.5.4.dev0+cu123)
  Using cached vllm_flash_attn-2.5.9.post1-cp310-cp310-manylinux1_x86_64.whl.metadata (482 bytes)
Collecting causal-conv1d>=1.2.1 (from aphrodite-engine==0.5.4.dev0+cu123)
  Using cached causal_conv1d-1.4.0-cp310-cp310-linux_x86_64.whl
Collecting mamba-ssm>=1.2.2 (from aphrodite-engine==0.5.4.dev0+cu123)
  Using cached mamba_ssm-2.2.2-cp310-cp310-linux_x86_64.whl
Requirement already satisfied: filelock in /opt/conda/lib/python3.10/site-packages (from torch==2.3.1->aphrodite-engine==0.5.4.dev0+cu123) (3.15.1)
Requirement already satisfied: typing-extensions>=4.8.0 in /opt/conda/lib/python3.10/site-packages (from torch==2.3.1->aphrodite-engine==0.5.4.dev0+cu123) (4.12.2)
Requirement already satisfied: sympy in /opt/conda/lib/python3.10/site-packages (from torch==2.3.1->aphrodite-engine==0.5.4.dev0+cu123) (1.13.2)
Requirement already satisfied: networkx in /opt/conda/lib/python3.10/site-packages (from torch==2.3.1->aphrodite-engine==0.5.4.dev0+cu123) (3.3)
Requirement already satisfied: jinja2 in /opt/conda/lib/python3.10/site-packages (from torch==2.3.1->aphrodite-engine==0.5.4.dev0+cu123) (3.1.4)
Requirement already satisfied: fsspec in /opt/conda/lib/python3.10/site-packages (from torch==2.3.1->aphrodite-engine==0.5.4.dev0+cu123) (2024.6.1)
Collecting nvidia-cuda-nvrtc-cu12==12.1.105 (from torch==2.3.1->aphrodite-engine==0.5.4.dev0+cu123)
  Using cached nvidia_cuda_nvrtc_cu12-12.1.105-py3-none-manylinux1_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-runtime-cu12==12.1.105 (from torch==2.3.1->aphrodite-engine==0.5.4.dev0+cu123)
  Using cached nvidia_cuda_runtime_cu12-12.1.105-py3-none-manylinux1_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-cupti-cu12==12.1.105 (from torch==2.3.1->aphrodite-engine==0.5.4.dev0+cu123)
  Using cached nvidia_cuda_cupti_cu12-12.1.105-py3-none-manylinux1_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cudnn-cu12==8.9.2.26 (from torch==2.3.1->aphrodite-engine==0.5.4.dev0+cu123)
  Using cached nvidia_cudnn_cu12-8.9.2.26-py3-none-manylinux1_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cublas-cu12==12.1.3.1 (from torch==2.3.1->aphrodite-engine==0.5.4.dev0+cu123)
  Using cached nvidia_cublas_cu12-12.1.3.1-py3-none-manylinux1_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cufft-cu12==11.0.2.54 (from torch==2.3.1->aphrodite-engine==0.5.4.dev0+cu123)
  Using cached nvidia_cufft_cu12-11.0.2.54-py3-none-manylinux1_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-curand-cu12==10.3.2.106 (from torch==2.3.1->aphrodite-engine==0.5.4.dev0+cu123)
  Using cached nvidia_curand_cu12-10.3.2.106-py3-none-manylinux1_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cusolver-cu12==11.4.5.107 (from torch==2.3.1->aphrodite-engine==0.5.4.dev0+cu123)
  Using cached nvidia_cusolver_cu12-11.4.5.107-py3-none-manylinux1_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cusparse-cu12==12.1.0.106 (from torch==2.3.1->aphrodite-engine==0.5.4.dev0+cu123)
  Using cached nvidia_cusparse_cu12-12.1.0.106-py3-none-manylinux1_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-nccl-cu12==2.20.5 (from torch==2.3.1->aphrodite-engine==0.5.4.dev0+cu123)
  Using cached nvidia_nccl_cu12-2.20.5-py3-none-manylinux2014_x86_64.whl.metadata (1.8 kB)
Collecting nvidia-nvtx-cu12==12.1.105 (from torch==2.3.1->aphrodite-engine==0.5.4.dev0+cu123)
  Using cached nvidia_nvtx_cu12-12.1.105-py3-none-manylinux1_x86_64.whl.metadata (1.7 kB)
Collecting triton>=2.2.1 (from aphrodite-engine==0.5.4.dev0+cu123)
  Using cached triton-2.3.1-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (1.4 kB)
Requirement already satisfied: huggingface-hub<1.0,>=0.23.2 in /opt/conda/lib/python3.10/site-packages (from transformers==4.43.0->aphrodite-engine==0.5.4.dev0+cu123) (0.24.6)
Requirement already satisfied: packaging>=20.0 in /opt/conda/lib/python3.10/site-packages (from transformers==4.43.0->aphrodite-engine==0.5.4.dev0+cu123) (21.3)
Requirement already satisfied: pyyaml>=5.1 in /opt/conda/lib/python3.10/site-packages (from transformers==4.43.0->aphrodite-engine==0.5.4.dev0+cu123) (6.0.2)
Requirement already satisfied: regex!=2019.12.17 in /opt/conda/lib/python3.10/site-packages (from transformers==4.43.0->aphrodite-engine==0.5.4.dev0+cu123) (2024.5.15)
Requirement already satisfied: requests in /opt/conda/lib/python3.10/site-packages (from transformers==4.43.0->aphrodite-engine==0.5.4.dev0+cu123) (2.32.3)
Requirement already satisfied: tokenizers<0.20,>=0.19 in /opt/conda/lib/python3.10/site-packages (from transformers==4.43.0->aphrodite-engine==0.5.4.dev0+cu123) (0.19.1)
Requirement already satisfied: safetensors>=0.4.1 in /opt/conda/lib/python3.10/site-packages (from transformers==4.43.0->aphrodite-engine==0.5.4.dev0+cu123) (0.4.4)
Requirement already satisfied: tqdm>=4.27 in /opt/conda/lib/python3.10/site-packages (from transformers==4.43.0->aphrodite-engine==0.5.4.dev0+cu123) (4.66.4)
Collecting nvidia-nvjitlink-cu12 (from nvidia-cusolver-cu12==11.4.5.107->torch==2.3.1->aphrodite-engine==0.5.4.dev0+cu123)
  Using cached nvidia_nvjitlink_cu12-12.6.20-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Requirement already satisfied: httpx in /opt/conda/lib/python3.10/site-packages (from fschat>=0.2.23->aphrodite-engine==0.5.4.dev0+cu123) (0.27.0)
Collecting markdown2[all] (from fschat>=0.2.23->aphrodite-engine==0.5.4.dev0+cu123)
  Using cached markdown2-2.5.0-py2.py3-none-any.whl.metadata (2.2 kB)
Collecting nh3 (from fschat>=0.2.23->aphrodite-engine==0.5.4.dev0+cu123)
  Using cached nh3-0.2.18-cp37-abi3-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (1.7 kB)
Requirement already satisfied: prompt-toolkit>=3.0.0 in /opt/conda/lib/python3.10/site-packages (from fschat>=0.2.23->aphrodite-engine==0.5.4.dev0+cu123) (3.0.47)
Collecting shortuuid (from fschat>=0.2.23->aphrodite-engine==0.5.4.dev0+cu123)
  Using cached shortuuid-1.0.13-py3-none-any.whl.metadata (5.8 kB)
Collecting interegular>=0.3.2 (from lm-format-enforcer>=0.10.3->aphrodite-engine==0.5.4.dev0+cu123)
  Using cached interegular-0.3.3-py37-none-any.whl.metadata (3.0 kB)
Requirement already satisfied: nest-asyncio in /opt/conda/lib/python3.10/site-packages (from outlines<0.1,>=0.0.43->aphrodite-engine==0.5.4.dev0+cu123) (1.6.0)
Requirement already satisfied: cloudpickle in /opt/conda/lib/python3.10/site-packages (from outlines<0.1,>=0.0.43->aphrodite-engine==0.5.4.dev0+cu123) (3.0.0)
Collecting diskcache (from outlines<0.1,>=0.0.43->aphrodite-engine==0.5.4.dev0+cu123)
  Using cached diskcache-5.6.3-py3-none-any.whl.metadata (20 kB)
Requirement already satisfied: numba in /opt/conda/lib/python3.10/site-packages (from outlines<0.1,>=0.0.43->aphrodite-engine==0.5.4.dev0+cu123) (0.58.1)
Requirement already satisfied: referencing in /opt/conda/lib/python3.10/site-packages (from outlines<0.1,>=0.0.43->aphrodite-engine==0.5.4.dev0+cu123) (0.35.1)
Requirement already satisfied: jsonschema in /opt/conda/lib/python3.10/site-packages (from outlines<0.1,>=0.0.43->aphrodite-engine==0.5.4.dev0+cu123) (4.22.0)
Requirement already satisfied: datasets in /opt/conda/lib/python3.10/site-packages (from outlines<0.1,>=0.0.43->aphrodite-engine==0.5.4.dev0+cu123) (2.21.0)
Collecting pycountry (from outlines<0.1,>=0.0.43->aphrodite-engine==0.5.4.dev0+cu123)
  Using cached pycountry-24.6.1-py3-none-any.whl.metadata (12 kB)
Collecting pyairports (from outlines<0.1,>=0.0.43->aphrodite-engine==0.5.4.dev0+cu123)
  Using cached pyairports-2.1.1-py3-none-any.whl.metadata (1.7 kB)
Requirement already satisfied: starlette<1.0.0,>=0.30.0 in /opt/conda/lib/python3.10/site-packages (from prometheus-fastapi-instrumentator>=7.0.0->aphrodite-engine==0.5.4.dev0+cu123) (0.37.2)
Requirement already satisfied: annotated-types>=0.4.0 in /opt/conda/lib/python3.10/site-packages (from pydantic>=2.0->aphrodite-engine==0.5.4.dev0+cu123) (0.7.0)
Requirement already satisfied: pydantic-core==2.20.1 in /opt/conda/lib/python3.10/site-packages (from pydantic>=2.0->aphrodite-engine==0.5.4.dev0+cu123) (2.20.1)
Requirement already satisfied: markdown-it-py>=2.2.0 in /opt/conda/lib/python3.10/site-packages (from rich->aphrodite-engine==0.5.4.dev0+cu123) (3.0.0)
Requirement already satisfied: pygments<3.0.0,>=2.13.0 in /opt/conda/lib/python3.10/site-packages (from rich->aphrodite-engine==0.5.4.dev0+cu123) (2.18.0)
Requirement already satisfied: aiosignal>=1.1.2 in /opt/conda/lib/python3.10/site-packages (from aiohttp->aphrodite-engine==0.5.4.dev0+cu123) (1.3.1)
Requirement already satisfied: attrs>=17.3.0 in /opt/conda/lib/python3.10/site-packages (from aiohttp->aphrodite-engine==0.5.4.dev0+cu123) (23.2.0)
Requirement already satisfied: frozenlist>=1.1.1 in /opt/conda/lib/python3.10/site-packages (from aiohttp->aphrodite-engine==0.5.4.dev0+cu123) (1.4.1)
Requirement already satisfied: multidict<7.0,>=4.5 in /opt/conda/lib/python3.10/site-packages (from aiohttp->aphrodite-engine==0.5.4.dev0+cu123) (6.0.5)
Requirement already satisfied: yarl<2.0,>=1.0 in /opt/conda/lib/python3.10/site-packages (from aiohttp->aphrodite-engine==0.5.4.dev0+cu123) (1.9.4)
Requirement already satisfied: async-timeout<5.0,>=4.0 in /opt/conda/lib/python3.10/site-packages (from aiohttp->aphrodite-engine==0.5.4.dev0+cu123) (4.0.3)
Requirement already satisfied: fastapi-cli>=0.0.2 in /opt/conda/lib/python3.10/site-packages (from fastapi->aphrodite-engine==0.5.4.dev0+cu123) (0.0.4)
Requirement already satisfied: python-multipart>=0.0.7 in /opt/conda/lib/python3.10/site-packages (from fastapi->aphrodite-engine==0.5.4.dev0+cu123) (0.0.9)
Requirement already satisfied: ujson!=4.0.2,!=4.1.0,!=4.2.0,!=4.3.0,!=5.0.0,!=5.1.0,>=4.0.1 in /opt/conda/lib/python3.10/site-packages (from fastapi->aphrodite-engine==0.5.4.dev0+cu123) (5.10.0)
Requirement already satisfied: orjson>=3.2.1 in /opt/conda/lib/python3.10/site-packages (from fastapi->aphrodite-engine==0.5.4.dev0+cu123) (3.10.4)
Requirement already satisfied: email_validator>=2.0.0 in /opt/conda/lib/python3.10/site-packages (from fastapi->aphrodite-engine==0.5.4.dev0+cu123) (2.1.1)
Requirement already satisfied: click>=7.0 in /opt/conda/lib/python3.10/site-packages (from uvicorn->aphrodite-engine==0.5.4.dev0+cu123) (8.1.7)
Requirement already satisfied: h11>=0.8 in /opt/conda/lib/python3.10/site-packages (from uvicorn->aphrodite-engine==0.5.4.dev0+cu123) (0.14.0)
Requirement already satisfied: anyio<5,>=3.5.0 in /opt/conda/lib/python3.10/site-packages (from openai->aphrodite-engine==0.5.4.dev0+cu123) (4.4.0)
Requirement already satisfied: distro<2,>=1.7.0 in /opt/conda/lib/python3.10/site-packages (from openai->aphrodite-engine==0.5.4.dev0+cu123) (1.9.0)
Collecting jiter<1,>=0.4.0 (from openai->aphrodite-engine==0.5.4.dev0+cu123)
  Using cached jiter-0.5.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (3.6 kB)
Requirement already satisfied: sniffio in /opt/conda/lib/python3.10/site-packages (from openai->aphrodite-engine==0.5.4.dev0+cu123) (1.3.1)
Requirement already satisfied: scikit-learn in /opt/conda/lib/python3.10/site-packages (from sentence-transformers->aphrodite-engine==0.5.4.dev0+cu123) (1.2.2)
Requirement already satisfied: idna>=2.8 in /opt/conda/lib/python3.10/site-packages (from anyio<5,>=3.5.0->openai->aphrodite-engine==0.5.4.dev0+cu123) (3.7)
Requirement already satisfied: exceptiongroup>=1.0.2 in /opt/conda/lib/python3.10/site-packages (from anyio<5,>=3.5.0->openai->aphrodite-engine==0.5.4.dev0+cu123) (1.2.0)
Requirement already satisfied: dnspython>=2.0.0 in /opt/conda/lib/python3.10/site-packages (from email_validator>=2.0.0->fastapi->aphrodite-engine==0.5.4.dev0+cu123) (2.6.1)
Requirement already satisfied: typer>=0.12.3 in /opt/conda/lib/python3.10/site-packages (from fastapi-cli>=0.0.2->fastapi->aphrodite-engine==0.5.4.dev0+cu123) (0.12.3)
Requirement already satisfied: certifi in /opt/conda/lib/python3.10/site-packages (from httpx->fschat>=0.2.23->aphrodite-engine==0.5.4.dev0+cu123) (2024.7.4)
Requirement already satisfied: httpcore==1.* in /opt/conda/lib/python3.10/site-packages (from httpx->fschat>=0.2.23->aphrodite-engine==0.5.4.dev0+cu123) (1.0.5)
Requirement already satisfied: MarkupSafe>=2.0 in /opt/conda/lib/python3.10/site-packages (from jinja2->torch==2.3.1->aphrodite-engine==0.5.4.dev0+cu123) (2.1.5)
Requirement already satisfied: mdurl~=0.1 in /opt/conda/lib/python3.10/site-packages (from markdown-it-py>=2.2.0->rich->aphrodite-engine==0.5.4.dev0+cu123) (0.1.2)
Requirement already satisfied: pyparsing!=3.0.5,>=2.0.2 in /opt/conda/lib/python3.10/site-packages (from packaging>=20.0->transformers==4.43.0->aphrodite-engine==0.5.4.dev0+cu123) (3.1.2)
Requirement already satisfied: wcwidth in /opt/conda/lib/python3.10/site-packages (from prompt-toolkit>=3.0.0->fschat>=0.2.23->aphrodite-engine==0.5.4.dev0+cu123) (0.2.13)
Requirement already satisfied: charset-normalizer<4,>=2 in /opt/conda/lib/python3.10/site-packages (from requests->transformers==4.43.0->aphrodite-engine==0.5.4.dev0+cu123) (3.3.2)
Requirement already satisfied: urllib3<3,>=1.21.1 in /opt/conda/lib/python3.10/site-packages (from requests->transformers==4.43.0->aphrodite-engine==0.5.4.dev0+cu123) (1.26.18)
Requirement already satisfied: httptools>=0.5.0 in /opt/conda/lib/python3.10/site-packages (from uvicorn[standard]>=0.12.0->fastapi->aphrodite-engine==0.5.4.dev0+cu123) (0.6.1)
Requirement already satisfied: python-dotenv>=0.13 in /opt/conda/lib/python3.10/site-packages (from uvicorn[standard]>=0.12.0->fastapi->aphrodite-engine==0.5.4.dev0+cu123) (1.0.1)
Requirement already satisfied: watchfiles>=0.13 in /opt/conda/lib/python3.10/site-packages (from uvicorn[standard]>=0.12.0->fastapi->aphrodite-engine==0.5.4.dev0+cu123) (0.22.0)
Requirement already satisfied: websockets>=10.4 in /opt/conda/lib/python3.10/site-packages (from uvicorn[standard]>=0.12.0->fastapi->aphrodite-engine==0.5.4.dev0+cu123) (12.0)
Requirement already satisfied: pyarrow>=15.0.0 in /opt/conda/lib/python3.10/site-packages (from datasets->outlines<0.1,>=0.0.43->aphrodite-engine==0.5.4.dev0+cu123) (16.1.0)
Requirement already satisfied: dill<0.3.9,>=0.3.0 in /opt/conda/lib/python3.10/site-packages (from datasets->outlines<0.1,>=0.0.43->aphrodite-engine==0.5.4.dev0+cu123) (0.3.8)
Requirement already satisfied: pandas in /opt/conda/lib/python3.10/site-packages (from datasets->outlines<0.1,>=0.0.43->aphrodite-engine==0.5.4.dev0+cu123) (2.2.2)
Requirement already satisfied: xxhash in /opt/conda/lib/python3.10/site-packages (from datasets->outlines<0.1,>=0.0.43->aphrodite-engine==0.5.4.dev0+cu123) (3.4.1)
Requirement already satisfied: multiprocess in /opt/conda/lib/python3.10/site-packages (from datasets->outlines<0.1,>=0.0.43->aphrodite-engine==0.5.4.dev0+cu123) (0.70.16)
Requirement already satisfied: jsonschema-specifications>=2023.03.6 in /opt/conda/lib/python3.10/site-packages (from jsonschema->outlines<0.1,>=0.0.43->aphrodite-engine==0.5.4.dev0+cu123) (2023.12.1)
Requirement already satisfied: rpds-py>=0.7.1 in /opt/conda/lib/python3.10/site-packages (from jsonschema->outlines<0.1,>=0.0.43->aphrodite-engine==0.5.4.dev0+cu123) (0.18.1)
Collecting wavedrom (from markdown2[all]->fschat>=0.2.23->aphrodite-engine==0.5.4.dev0+cu123)
  Using cached wavedrom-2.0.3.post3-py2.py3-none-any.whl
Collecting latex2mathml (from markdown2[all]->fschat>=0.2.23->aphrodite-engine==0.5.4.dev0+cu123)
  Using cached latex2mathml-3.77.0-py3-none-any.whl.metadata (14 kB)
Requirement already satisfied: llvmlite<0.42,>=0.41.0dev0 in /opt/conda/lib/python3.10/site-packages (from numba->outlines<0.1,>=0.0.43->aphrodite-engine==0.5.4.dev0+cu123) (0.41.1)
Requirement already satisfied: joblib>=1.1.1 in /opt/conda/lib/python3.10/site-packages (from scikit-learn->sentence-transformers->aphrodite-engine==0.5.4.dev0+cu123) (1.4.2)
Requirement already satisfied: threadpoolctl>=2.0.0 in /opt/conda/lib/python3.10/site-packages (from scikit-learn->sentence-transformers->aphrodite-engine==0.5.4.dev0+cu123) (3.5.0)
Requirement already satisfied: mpmath<1.4,>=1.1.0 in /opt/conda/lib/python3.10/site-packages (from sympy->torch==2.3.1->aphrodite-engine==0.5.4.dev0+cu123) (1.3.0)
Requirement already satisfied: shellingham>=1.3.0 in /opt/conda/lib/python3.10/site-packages (from typer>=0.12.3->fastapi-cli>=0.0.2->fastapi->aphrodite-engine==0.5.4.dev0+cu123) (1.5.4)
Requirement already satisfied: python-dateutil>=2.8.2 in /opt/conda/lib/python3.10/site-packages (from pandas->datasets->outlines<0.1,>=0.0.43->aphrodite-engine==0.5.4.dev0+cu123) (2.9.0.post0)
Requirement already satisfied: pytz>=2020.1 in /opt/conda/lib/python3.10/site-packages (from pandas->datasets->outlines<0.1,>=0.0.43->aphrodite-engine==0.5.4.dev0+cu123) (2024.1)
Requirement already satisfied: tzdata>=2022.7 in /opt/conda/lib/python3.10/site-packages (from pandas->datasets->outlines<0.1,>=0.0.43->aphrodite-engine==0.5.4.dev0+cu123) (2024.1)
Collecting svgwrite (from wavedrom->markdown2[all]->fschat>=0.2.23->aphrodite-engine==0.5.4.dev0+cu123)
  Using cached svgwrite-1.4.3-py3-none-any.whl.metadata (8.8 kB)
Requirement already satisfied: six in /opt/conda/lib/python3.10/site-packages (from wavedrom->markdown2[all]->fschat>=0.2.23->aphrodite-engine==0.5.4.dev0+cu123) (1.16.0)
Using cached lark-1.1.8-py3-none-any.whl (111 kB)
Using cached nvidia_ml_py-12.555.43-py3-none-any.whl (39 kB)
Using cached torch-2.3.1-cp310-cp310-manylinux1_x86_64.whl (779.1 MB)
Using cached torchvision-0.18.1-cp310-cp310-manylinux1_x86_64.whl (7.0 MB)
Using cached transformers-4.43.0-py3-none-any.whl (9.4 MB)
Using cached triton-2.3.1-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (168.1 MB)
Using cached vllm_flash_attn-2.5.9.post1-cp310-cp310-manylinux1_x86_64.whl (37.1 MB)
Using cached xformers-0.0.27-cp310-cp310-manylinux2014_x86_64.whl (164.1 MB)
Using cached nvidia_cublas_cu12-12.1.3.1-py3-none-manylinux1_x86_64.whl (410.6 MB)
Using cached nvidia_cuda_cupti_cu12-12.1.105-py3-none-manylinux1_x86_64.whl (14.1 MB)
Using cached nvidia_cuda_nvrtc_cu12-12.1.105-py3-none-manylinux1_x86_64.whl (23.7 MB)
Using cached nvidia_cuda_runtime_cu12-12.1.105-py3-none-manylinux1_x86_64.whl (823 kB)
Using cached nvidia_cudnn_cu12-8.9.2.26-py3-none-manylinux1_x86_64.whl (731.7 MB)
Using cached nvidia_cufft_cu12-11.0.2.54-py3-none-manylinux1_x86_64.whl (121.6 MB)
Using cached nvidia_curand_cu12-10.3.2.106-py3-none-manylinux1_x86_64.whl (56.5 MB)
Using cached nvidia_cusolver_cu12-11.4.5.107-py3-none-manylinux1_x86_64.whl (124.2 MB)
Using cached nvidia_cusparse_cu12-12.1.0.106-py3-none-manylinux1_x86_64.whl (196.0 MB)
Using cached nvidia_nccl_cu12-2.20.5-py3-none-manylinux2014_x86_64.whl (176.2 MB)
Using cached nvidia_nvtx_cu12-12.1.105-py3-none-manylinux1_x86_64.whl (99 kB)
Using cached cmake-3.30.2-py3-none-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (26.9 MB)
Using cached fschat-0.2.36-py3-none-any.whl (256 kB)
Using cached lm_format_enforcer-0.10.6-py3-none-any.whl (43 kB)
Using cached outlines-0.0.46-py3-none-any.whl (101 kB)
Using cached prometheus_fastapi_instrumentator-7.0.0-py3-none-any.whl (19 kB)
Using cached tiktoken-0.7.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (1.1 MB)
Using cached einops-0.8.0-py3-none-any.whl (43 kB)
Using cached hf_transfer-0.1.8-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (3.6 MB)
Using cached openai-1.42.0-py3-none-any.whl (362 kB)
Using cached sentence_transformers-3.0.1-py3-none-any.whl (227 kB)
Using cached interegular-0.3.3-py37-none-any.whl (23 kB)
Using cached jiter-0.5.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (318 kB)
Using cached diskcache-5.6.3-py3-none-any.whl (45 kB)
Using cached nh3-0.2.18-cp37-abi3-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (769 kB)
Using cached pyairports-2.1.1-py3-none-any.whl (371 kB)
Using cached pycountry-24.6.1-py3-none-any.whl (6.3 MB)
Using cached shortuuid-1.0.13-py3-none-any.whl (10 kB)
Using cached latex2mathml-3.77.0-py3-none-any.whl (73 kB)
Using cached markdown2-2.5.0-py2.py3-none-any.whl (47 kB)
Using cached nvidia_nvjitlink_cu12-12.6.20-py3-none-manylinux2014_x86_64.whl (19.7 MB)
Using cached svgwrite-1.4.3-py3-none-any.whl (67 kB)
Building wheels for collected packages: aphrodite-engine
  Building editable for aphrodite-engine (pyproject.toml) ... error
  error: subprocess-exited-with-error

  × Building editable for aphrodite-engine (pyproject.toml) did not run successfully.
  │ exit code: 1
  ╰─> [151 lines of output]
      /tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/dist.py:292: InformationOnly: Normalizing '0.5.4-dev+cu123' to '0.5.4.dev0+cu123'
        self.metadata.version = self._normalize_version(self.metadata.version)
      running editable_wheel
      creating /tmp/pip-wheel-snayr9tw/.tmp-zbp9cfew/aphrodite_engine.egg-info
      writing /tmp/pip-wheel-snayr9tw/.tmp-zbp9cfew/aphrodite_engine.egg-info/PKG-INFO
      writing dependency_links to /tmp/pip-wheel-snayr9tw/.tmp-zbp9cfew/aphrodite_engine.egg-info/dependency_links.txt
      writing entry points to /tmp/pip-wheel-snayr9tw/.tmp-zbp9cfew/aphrodite_engine.egg-info/entry_points.txt
      writing requirements to /tmp/pip-wheel-snayr9tw/.tmp-zbp9cfew/aphrodite_engine.egg-info/requires.txt
      writing top-level names to /tmp/pip-wheel-snayr9tw/.tmp-zbp9cfew/aphrodite_engine.egg-info/top_level.txt
      writing manifest file '/tmp/pip-wheel-snayr9tw/.tmp-zbp9cfew/aphrodite_engine.egg-info/SOURCES.txt'
      reading manifest file '/tmp/pip-wheel-snayr9tw/.tmp-zbp9cfew/aphrodite_engine.egg-info/SOURCES.txt'
      reading manifest template 'MANIFEST.in'
      adding license file 'LICENSE'
      writing manifest file '/tmp/pip-wheel-snayr9tw/.tmp-zbp9cfew/aphrodite_engine.egg-info/SOURCES.txt'
      creating '/tmp/pip-wheel-snayr9tw/.tmp-zbp9cfew/aphrodite_engine-0.5.4.dev0+cu123.dist-info'
      creating /tmp/pip-wheel-snayr9tw/.tmp-zbp9cfew/aphrodite_engine-0.5.4.dev0+cu123.dist-info/WHEEL
      running build_py
      running build_ext
      Using 4 CPUs as the number of jobs.
      -- The CXX compiler identification is GNU 11.4.0
      -- Detecting CXX compiler ABI info
      -- Detecting CXX compiler ABI info - done
      -- Check for working CXX compiler: /usr/bin/c++ - skipped
      -- Detecting CXX compile features
      -- Detecting CXX compile features - done
      -- Build type: RelWithDebInfo
      -- Target device: cuda
      -- Found Python: /opt/conda/bin/python3.10 (found version "3.10.14") found components: Interpreter Development.Module Development.SABIModule
      -- Found python matching: /opt/conda/bin/python3.10.
      -- Could NOT find CUDA (missing: CUDA_INCLUDE_DIRS) (found version "12.3")
      CMake Warning at /tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/torch/share/cmake/Caffe2/public/cuda.cmake:31 (message):
        Caffe2: CUDA cannot be found.  Depending on whether you are building Caffe2
        or a Caffe2 dependent library, the next warning / error will give you more
        info.
      Call Stack (most recent call first):
        /tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/torch/share/cmake/Caffe2/Caffe2Config.cmake:87 (include)
        /tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/torch/share/cmake/Torch/TorchConfig.cmake:68 (find_package)
        CMakeLists.txt:67 (find_package)

      CMake Error at /tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/torch/share/cmake/Caffe2/Caffe2Config.cmake:91 (message):
        Your installed Caffe2 version uses CUDA but I cannot find the CUDA
        libraries.  Please set the proper CUDA prefixes and / or install CUDA.
      Call Stack (most recent call first):
        /tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/torch/share/cmake/Torch/TorchConfig.cmake:68 (find_package)
        CMakeLists.txt:67 (find_package)

      -- Configuring incomplete, errors occurred!
      Traceback (most recent call last):
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/command/editable_wheel.py", line 135, in run
          self._create_wheel_file(bdist_wheel)
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/command/editable_wheel.py", line 338, in _create_wheel_file
          files, mapping = self._run_build_commands(dist_name, unpacked, lib, tmp)
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/command/editable_wheel.py", line 261, in _run_build_commands
          self._run_build_subcommands()
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/command/editable_wheel.py", line 288, in _run_build_subcommands
          self.run_command(name)
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/_distutils/cmd.py", line 316, in run_command
          self.distribution.run_command(command)
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/dist.py", line 948, in run_command
          super().run_command(command)
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/_distutils/dist.py", line 983, in run_command
          cmd_obj.run()
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/command/build_ext.py", line 96, in run
          _build_ext.run(self)
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/_distutils/command/build_ext.py", line 359, in run
          self.build_extensions()
        File "<string>", line 216, in build_extensions
        File "<string>", line 199, in configure
        File "/opt/conda/lib/python3.10/subprocess.py", line 369, in check_call
          raise CalledProcessError(retcode, cmd)
      subprocess.CalledProcessError: Command '['cmake', '/kaggle/aphrodite-engine', '-G', 'Ninja', '-DCMAKE_BUILD_TYPE=RelWithDebInfo', '-DCMAKE_LIBRARY_OUTPUT_DIRECTORY=/tmp/tmp56p126aj.build-lib/aphrodite', '-DCMAKE_ARCHIVE_OUTPUT_DIRECTORY=/tmp/tmpf9_q0r2w.build-temp', '-DAPHRODITE_TARGET_DEVICE=cuda', '-DAPHRODITE_PYTHON_EXECUTABLE=/opt/conda/bin/python3.10', '-DNVCC_THREADS=1', '-DCMAKE_JOB_POOL_COMPILE:STRING=compile', '-DCMAKE_JOB_POOLS:STRING=compile=4']' returned non-zero exit status 1.
      /tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/_distutils/dist.py:983: _DebuggingTips: Problem in editable installation.
      !!

              ********************************************************************************
              An error happened while installing `aphrodite-engine` in editable mode.

              The following steps are recommended to help debug this problem:

              - Try to install the project normally, without using the editable mode.
                Does the error still persist?
                (If it does, try fixing the problem before attempting the editable mode).
              - If you are using binary extensions, make sure you have all OS-level
                dependencies installed (e.g. compilers, toolchains, binary libraries, ...).
              - Try the latest version of setuptools (maybe the error was already fixed).
              - If you (or your project dependencies) are using any setuptools extension
                or customization, make sure they support the editable mode.

              After following the steps above, if the problem still persists and
              you think this is related to how setuptools handles editable installations,
              please submit a reproducible example
              (see https://stackoverflow.com/help/minimal-reproducible-example) to:

                  https://github.com/pypa/setuptools/issues

              See https://setuptools.pypa.io/en/latest/userguide/development_mode.html for details.
              ********************************************************************************

      !!
        cmd_obj.run()
      Traceback (most recent call last):
        File "/opt/conda/lib/python3.10/site-packages/pip/_vendor/pyproject_hooks/_in_process/_in_process.py", line 353, in <module>
          main()
        File "/opt/conda/lib/python3.10/site-packages/pip/_vendor/pyproject_hooks/_in_process/_in_process.py", line 335, in main
          json_out['return_val'] = hook(**hook_input['kwargs'])
        File "/opt/conda/lib/python3.10/site-packages/pip/_vendor/pyproject_hooks/_in_process/_in_process.py", line 273, in build_editable
          return hook(wheel_directory, config_settings, metadata_directory)
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/build_meta.py", line 458, in build_editable
          return self._build_with_temp_dir(
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/build_meta.py", line 402, in _build_with_temp_dir
          self.run_setup()
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/build_meta.py", line 318, in run_setup
          exec(code, locals())
        File "<string>", line 478, in <module>
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/__init__.py", line 111, in setup
          return distutils.core.setup(**attrs)
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/_distutils/core.py", line 184, in setup
          return run_commands(dist)
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/_distutils/core.py", line 200, in run_commands
          dist.run_commands()
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/_distutils/dist.py", line 964, in run_commands
          self.run_command(cmd)
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/dist.py", line 948, in run_command
          super().run_command(command)
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/_distutils/dist.py", line 983, in run_command
          cmd_obj.run()
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/command/editable_wheel.py", line 135, in run
          self._create_wheel_file(bdist_wheel)
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/command/editable_wheel.py", line 338, in _create_wheel_file
          files, mapping = self._run_build_commands(dist_name, unpacked, lib, tmp)
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/command/editable_wheel.py", line 261, in _run_build_commands
          self._run_build_subcommands()
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/command/editable_wheel.py", line 288, in _run_build_subcommands
          self.run_command(name)
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/_distutils/cmd.py", line 316, in run_command
          self.distribution.run_command(command)
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/dist.py", line 948, in run_command
          super().run_command(command)
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/_distutils/dist.py", line 983, in run_command
          cmd_obj.run()
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/command/build_ext.py", line 96, in run
          _build_ext.run(self)
        File "/tmp/pip-build-env-lhq1qgio/overlay/lib/python3.10/site-packages/setuptools/_distutils/command/build_ext.py", line 359, in run
          self.build_extensions()
        File "<string>", line 216, in build_extensions
        File "<string>", line 199, in configure
        File "/opt/conda/lib/python3.10/subprocess.py", line 369, in check_call
          raise CalledProcessError(retcode, cmd)
      subprocess.CalledProcessError: Command '['cmake', '/kaggle/aphrodite-engine', '-G', 'Ninja', '-DCMAKE_BUILD_TYPE=RelWithDebInfo', '-DCMAKE_LIBRARY_OUTPUT_DIRECTORY=/tmp/tmp56p126aj.build-lib/aphrodite', '-DCMAKE_ARCHIVE_OUTPUT_DIRECTORY=/tmp/tmpf9_q0r2w.build-temp', '-DAPHRODITE_TARGET_DEVICE=cuda', '-DAPHRODITE_PYTHON_EXECUTABLE=/opt/conda/bin/python3.10', '-DNVCC_THREADS=1', '-DCMAKE_JOB_POOL_COMPILE:STRING=compile', '-DCMAKE_JOB_POOLS:STRING=compile=4']' returned non-zero exit status 1.
      [end of output]

  note: This error originates from a subprocess, and is likely not a problem with pip.
  ERROR: Failed building editable for aphrodite-engine
Failed to build aphrodite engine.

AlpinDale commented 3 months ago

It looks like CUDA isn't installed? Can you run nvcc --version in the notebook? I'll try it out myself too later.

Abdulhanan535 commented 3 months ago

oki

Abdulhanan535 commented 3 months ago

nvcc: NVIDIA (R) Cuda compiler driver Copyright (c) 2005-2023 NVIDIA Corporation Built on Wed_Nov_22_10:17:15_PST_2023 Cuda compilation tools, release 12.3, V12.3.107 Build cuda_12.3.r12.3/compiler.33567101_0

BlairSadewitz commented 3 months ago

Oof, you're using kaggle? Brave man. ;-)

Not like I know much about this, but something is calling out to me from the logs:

Did you try passing CUDA_INCLUDE_DIRS (or a prefix for all of CUDA, it probably lets you do that I guess) to cmake?

Abdulhanan535 commented 3 months ago

eh whats that?

Abdulhanan535 commented 3 months ago

yea, im using kaggle, cuz don't have much vram on my gpu and kaggle has total of 30Gb vram for free lol.

Abdulhanan535 commented 3 months ago

anyone??

AlpinDale commented 3 months ago

I couldn't get my kaggle account verified to test this. Can you run Docker in kaggle? If so, try this:

docker run --runtime nvidia --gpus all \
    -v ~/.cache/huggingface:/root/.cache/huggingface \
    -p 2242:2242 \
    alpindale/aphrodite-openai --model <your model> [other args]

If not, try running this inside the aphrodite directory:

./runtime.sh aphrodite run <your model> [--other-args]

Abdulhanan535 commented 3 months ago

okay.

Abdulhanan535 commented 3 months ago

it's installing smth like 6 gbs of data..

Abdulhanan535 commented 3 months ago

there is a long log, here is the short version which i think causing error

` [2/31] Building CUDA object CMakeFiles/_C.dir/kernels/cache_kernels.cu.o In file included from /kaggle/aphrodite-engine/kernels/cache_kernels.cu:6: /kaggle/aphrodite-engine/kernels/dispatch_utils.h:36:60: warning: backslash-newline at end of file 36	#define APHRODITE_DISPATCH_INTEGRAL_TYPES(TYPE, NAME, ...) \

In file included from /kaggle/aphrodite-engine/kernels/cache_kernels.cu:6: /kaggle/aphrodite-engine/kernels/dispatch_utils.h:36:60: warning: backslash-newline at end of file 36	#define APHRODITE_DISPATCH_INTEGRAL_TYPES(TYPE, NAME, ...) \

[3/31] Building CUDA object CMakeFiles/_moe_C.dir/kernels/moe/softmax.cu.o [4/31] Building CUDA object CMakeFiles/_C.dir/kernels/pos_encoding_kernels.cu.o In file included from /kaggle/aphrodite-engine/kernels/pos_encoding_kernels.cu:6: /kaggle/aphrodite-engine/kernels/dispatch_utils.h:36:60: warning: backslash-newline at end of file 36	#define APHRODITE_DISPATCH_INTEGRAL_TYPES(TYPE, NAME, ...) \

In file included from /kaggle/aphrodite-engine/kernels/pos_encoding_kernels.cu:6: /kaggle/aphrodite-engine/kernels/dispatch_utils.h:36:60: warning: backslash-newline at end of file 36	#define APHRODITE_DISPATCH_INTEGRAL_TYPES(TYPE, NAME, ...) \

[5/31] Building CUDA object CMakeFiles/_C.dir/kernels/activation_kernels.cu.o In file included from /kaggle/aphrodite-engine/kernels/activation_kernels.cu:8: /kaggle/aphrodite-engine/kernels/dispatch_utils.h:36:60: warning: backslash-newline at end of file 36	#define APHRODITE_DISPATCH_INTEGRAL_TYPES(TYPE, NAME, ...) \

In file included from /kaggle/aphrodite-engine/kernels/activation_kernels.cu:8: /kaggle/aphrodite-engine/kernels/dispatch_utils.h:36:60: warning: backslash-newline at end of file 36	#define APHRODITE_DISPATCH_INTEGRAL_TYPES(TYPE, NAME, ...) \

[6/31] Building CUDA object CMakeFiles/_C.dir/kernels/layernorm_kernels.cu.o In file included from /kaggle/aphrodite-engine/kernels/layernorm_kernels.cu:5: /kaggle/aphrodite-engine/kernels/dispatch_utils.h:36:60: warning: backslash-newline at end of file 36	#define APHRODITE_DISPATCH_INTEGRAL_TYPES(TYPE, NAME, ...) \

In file included from /kaggle/aphrodite-engine/kernels/layernorm_kernels.cu:5: /kaggle/aphrodite-engine/kernels/dispatch_utils.h:36:60: warning: backslash-newline at end of file 36	#define APHRODITE_DISPATCH_INTEGRAL_TYPES(TYPE, NAME, ...) \

/kaggle/aphrodite-engine/kernels/layernorm_kernels.cu(207): warning #1444-D: variable "std::is_pod_v [with _Tp=aphrodite::_f16Vec<c10::Half, 8>]" (declared at line 3154 of /kaggle/aphrodite-engine/conda/envs/aphrodite-runtime/x86_64-conda-linux-gnu/include/c++/11.3.0/type_traits) was declared deprecated ("use is_standard_layout_v && is_trivial_v instead") static_assert(std::is_pod_v<_f16Vec<scalar_t, width>>); ^ detected during instantiation of "std::enable_if_t<, void> aphrodite::fused_add_rms_norm_kernel<scalar_t,width>(scalar_t , scalar_t , const scalar_t *, float, int, int) [with scalar_t=c10::Half, width=8]" at line 348

Remark: The warnings can be suppressed with "-diag-suppress "

[7/31] Building CUDA object CMakeFiles/_C.dir/kernels/quantization/squeezellm/quant_cuda_kernel.cu.o /kaggle/aphrodite-engine/kernels/quantization/squeezellm/quant_cuda_kernel.cu: In function 'void squeezellm_gemm(at::Tensor, at::Tensor, at::Tensor, at::Tensor)': /kaggle/aphrodite-engine/kernels/quantization/squeezellm/quant_cuda_kernel.cu:198:141: warning: 'T at::Tensor::data() const [with T = c10::Half]' is deprecated: Tensor.data() is deprecated. Please use Tensor.data_ptr() instead. [-Wdeprecated-declarations] 198 | aphrodite::squeezellm::NUQ4MatMulKernel<<<blocks, threads, 0, stream>>>( | ^ /tmp/pip-build-env-l48qqha9/overlay/lib/python3.11/site-packages/torch/include/ATen/core/TensorBody.h:247:1: note: declared here 247 | T data() const { | ^ ~~ /kaggle/aphrodite-engine/kernels/quantization/squeezellm/quant_cuda_kernel.cu:198:198: warning: 'T at::Tensor::data() const [with T = c10::Half]' is deprecated: Tensor.data() is deprecated. Please use Tensor.data_ptr() instead. [-Wdeprecated-declarations] 198 | aphrodite::squeezellm::NUQ4MatMulKernel<<<blocks, threads, 0, stream>>>( | ^ /tmp/pip-build-env-l48qqha9/overlay/lib/python3.11/site-packages/torch/include/ATen/core/TensorBody.h:247:1: note: declared here 247 | T data() const { | ^ ~~ /kaggle/aphrodite-engine/kernels/quantization/squeezellm/quant_cuda_kernel.cu:198:242: warning: 'T at::Tensor::data() const [with T = c10::Half]' is deprecated: Tensor.data() is deprecated. Please use Tensor.data_ptr() instead. [-Wdeprecated-declarations] 198 | aphrodite::squeezellm::NUQ4MatMulKernel<<<blocks, threads, 0, stream>>>( | ^ /tmp/pip-build-env-l48qqha9/overlay/lib/python3.11/site-packages/torch/include/ATen/core/TensorBody.h:247:1: note: declared here 247 | T data() const { | ^ ~~`

Abdulhanan535 commented 3 months ago

in end the storage got full and it crashed.. :\ 70gb of storage... was running a 8B model, also i was able to run previous versions with ez like 0.5.3 0.5.2 etc etc but this one is not working.

AlpinDale commented 3 months ago

Those are benign warnings. The actual error happens in another part, but you've not included that.

BlairSadewitz commented 3 months ago

Those are benign warnings. The actual error happens in another part, but you've not included that.

I had literally just posted my response right as you did, haha. I figured that somehow something was getting munged by whatever he was doing on kaggle. I had told him that the preprocessor tells you about that so that you don't spend a thousand hours banging your head against your desk. I noticed that he'd cut off the rest of it, but figured that he'd identified that as the problem, otherwise he'd have included the rest. But that doesn't make very much sense, now does it, haha.

I have a kaggle account. I'll run the notebook and see what happens--if the thing actually works. Haven't used that in a long time because I don't have that much of a penchant for masochism.

ThreeRiversAINexus commented 3 months ago

Perhaps you could use a pastebin to share the entire log with us

AlpinDale commented 3 months ago

For what it's worth, I've fixed all compiler warnings and notices in the latest rc_054. If anything fails, you'll immediately see the error logs instead of having warnings hog the entire screen space.

Abdulhanan535 commented 2 months ago

nice, i'll check again today.

Abdulhanan535 commented 2 months ago

it worked! but took 1 hour to install everything.. Can you fix that???

Abdulhanan535 commented 2 months ago

and used about 40GB of storage without the model :\

AlpinDale commented 2 months ago

it worked! but took 1 hour to install everything.. Can you fix that???

We have a lot of kernels in order to stay performant, so we can't get rid of them. However, we'll be switching to nightly wheels soon (built for every commit), so you can just use them instead of building it yourself. I will drop a notice here once that's setup.

Abdulhanan535 commented 2 months ago

okay, also it's stuck here

WARNING: autoquant quantization is not fully optimized yet. The speed can be slower than non-quantized models. INFO: Defaulting to use mp for distributed inference. INFO:

INFO: Initializing Aphrodite Engine (v0.5.4-dev commit 7844103) with the following config: INFO: Model = 'Darkknight535/MN-21B-Lyra-v2' INFO: DataType = torch.float16 INFO: Tensor Parallel Size = 2 INFO: Pipeline Parallel Size = 1 INFO: Disable Custom All-Reduce = False INFO: Quantization Format = 'autoquant' INFO: Context Length = 8192 INFO: Enforce Eager Mode = True INFO: Prefix Caching = False INFO: Device = device(type='cuda') INFO: Guided Decoding Backend = DecodingConfig(guided_decoding_backend='outlines') INFO:

WARNING: Reducing Torch parallelism from 2 threads to 1 to avoid unnecessary CPU contention. Set OMP_NUM_THREADS in the external environment to tune this value as needed. INFO: Cannot use FlashAttention-2 backend for Volta and Turing GPUs. INFO: Using XFormers backend. (AphroditeWorkerProcess pid=4561) INFO: Cannot use FlashAttention-2 backend for Volta and Turing GPUs. (AphroditeWorkerProcess pid=4561) INFO: Using XFormers backend. /kaggle/aphrodite-engine/conda/envs/aphrodite-runtime/lib/python3.11/site-packages/xformers/ops/fmha/flash.py:211: FutureWarning: torch.library.impl_abstract was renamed to torch.library.register_fake. Please use that instead; we will remove torch.library.impl_abstract in a future version of PyTorch. @torch.library.impl_abstract("xformers_flash::flash_fwd") (AphroditeWorkerProcess pid=4561) /kaggle/aphrodite-engine/conda/envs/aphrodite-runtime/lib/python3.11/site-packages/xformers/ops/fmha/flash.py:211: FutureWarning: torch.library.impl_abstract was renamed to torch.library.register_fake. Please use that instead; we will remove torch.library.impl_abstract in a future version of PyTorch. (AphroditeWorkerProcess pid=4561) @torch.library.impl_abstract("xformers_flash::flash_fwd") /kaggle/aphrodite-engine/conda/envs/aphrodite-runtime/lib/python3.11/site-packages/xformers/ops/fmha/flash.py:344: FutureWarning: torch.library.impl_abstract was renamed to torch.library.register_fake. Please use that instead; we will remove torch.library.impl_abstract in a future version of PyTorch. @torch.library.impl_abstract("xformers_flash::flash_bwd") (AphroditeWorkerProcess pid=4561) /kaggle/aphrodite-engine/conda/envs/aphrodite-runtime/lib/python3.11/site-packages/xformers/ops/fmha/flash.py:344: FutureWarning: torch.library.impl_abstract was renamed to torch.library.register_fake. Please use that instead; we will remove torch.library.impl_abstract in a future version of PyTorch. (AphroditeWorkerProcess pid=4561) @torch.library.impl_abstract("xformers_flash::flash_bwd") (AphroditeWorkerProcess pid=4561) INFO: Worker ready; awaiting tasks INFO: generating GPU P2P access cache in /root/.config/aphrodite/gpu_p2p_access_cache_for_0,1.json

Abdulhanan535 commented 2 months ago

v0.6.0 works great and easily...

PygmalionAI / aphrodite-engine