enable llama model in FT backend

triton-inference-server / fastertransformer_backend

BSD 3-Clause "New" or "Revised" License

411 stars 134 forks source link

Open shihy52x opened 1 year ago

shihy52x commented 1 year ago

existing FT backend will throw error for llama model.

sfc-gh-zhwang commented 1 year ago