default.metallib not found

After several re-installs, trying out different models, no matter what I do, my system can't seem to use local LLMs. It crashes every time and gives me the same message each time. Super aggravating since I'd love to use this tool locally. Help debugging/troubleshooting would be appreciated- I'm having trouble trying to tinker with the llama-cpp node module.

Physical (or virtual) hardware you are using: Mac Mini 2018 with 6-core intel i7, 16 GB RAM

Operating System: macOS Ventura 13.6.1

SDK: Node.js version 10.2.5

Running via repo as recommend on reddit here

`yarn dev:server

yarn run v1.22.21 $ cd server && yarn dev $ NODE_ENV=development nodemon [nodemon] 2.0.22 [nodemon] to restart at any [nodemon] watching path(s): . [nodemon] watching extensions: [nodemon] starting node [TELEMETRY STUBBED] Anonymous Primary server listening on port 3001 $ node ./swagger/init.js Swagger-autogen: Success ✔ prisma:info Starting a sqlite llama_model_loader: loaded llama_model_loader: - tensor 0: llama_model_loader: - tensor 1: llama_model_loader: - tensor 2: llama_model_loader: - tensor 3: llama_model_loader: - tensor 4: llama_model_loader: - tensor 5: llama_model_loader: - tensor 6: llama_model_loader: - tensor 7: llama_model_loader: - tensor 8: llama_model_loader: - tensor 9: llama_model_loader: - tensor 10: llama_model_loader: - tensor 11: llama_model_loader: - tensor 12: llama_model_loader: - tensor 13: llama_model_loader: - tensor 14: llama_model_loader: - tensor 15: llama_model_loader: - tensor 16: llama_model_loader: - tensor 17: llama_model_loader: - tensor 18: llama_model_loader: - tensor 19: llama_model_loader: - tensor 20: llama_model_loader: - tensor 21: llama_model_loader: - tensor 22: llama_model_loader: - tensor 23: llama_model_loader: - tensor 24: llama_model_loader: - tensor 25: llama_model_loader: - tensor 26: llama_model_loader: - tensor 27: llama_model_loader: - tensor 28: llama_model_loader: - tensor 29: llama_model_loader: - tensor 30: llama_model_loader: - tensor 31: llama_model_loader: - tensor 32: llama_model_loader: - tensor 33: llama_model_loader: - tensor 34: llama_model_loader: - tensor 35: llama_model_loader: - tensor 36: llama_model_loader: - tensor 37: llama_model_loader: - tensor 38: llama_model_loader: - tensor 39: llama_model_loader: - tensor 40: llama_model_loader: - tensor 41: llama_model_loader: - tensor 42: llama_model_loader: - tensor 43: llama_model_loader: - tensor 44: llama_model_loader: - tensor 45: llama_model_loader: - tensor 46: llama_model_loader: - tensor 47: llama_model_loader: - tensor 48: llama_model_loader: - tensor 49: llama_model_loader: - tensor 50: llama_model_loader: - tensor 51: llama_model_loader: - tensor 52: llama_model_loader: - tensor 53: llama_model_loader: - tensor 54: llama_model_loader: - tensor 55: llama_model_loader: - tensor 56: llama_model_loader: - tensor 57: llama_model_loader: - tensor 58: llama_model_loader: - tensor 59: llama_model_loader: - tensor 60: llama_model_loader: - tensor 61: llama_model_loader: - tensor 62: llama_model_loader: - tensor 63: llama_model_loader: - tensor 64: llama_model_loader: - tensor 65: llama_model_loader: - tensor 66: llama_model_loader: - tensor 67: llama_model_loader: - tensor 68: llama_model_loader: - tensor 69: llama_model_loader: - tensor 70: llama_model_loader: - tensor 71: llama_model_loader: - tensor 72: llama_model_loader: - tensor 73: llama_model_loader: - tensor 74: llama_model_loader: - tensor 75: llama_model_loader: - tensor 76: llama_model_loader: - tensor 77: llama_model_loader: - tensor 78: llama_model_loader: - tensor 79: llama_model_loader: - tensor 80: llama_model_loader: - tensor 81: llama_model_loader: - tensor 82: llama_model_loader: - tensor 83: llama_model_loader: - tensor 84: llama_model_loader: - tensor 85: llama_model_loader: - tensor 86: llama_model_loader: - tensor 87: llama_model_loader: - tensor 88: llama_model_loader: - tensor 89: llama_model_loader: - tensor 90: llama_model_loader: - tensor 91: llama_model_loader: - tensor 92: llama_model_loader: - tensor 93: llama_model_loader: - tensor 94: llama_model_loader: - tensor 95: llama_model_loader: - tensor 96: llama_model_loader: - tensor 97: llama_model_loader: - tensor 98: llama_model_loader: - tensor 99: llama_model_loader: - tensor 100: llama_model_loader: - tensor 101: llama_model_loader: - tensor 102: llama_model_loader: - tensor 103: llama_model_loader: - tensor 104: llama_model_loader: - tensor 105: llama_model_loader: - tensor 106: llama_model_loader: - tensor 107: llama_model_loader: - tensor 108: llama_model_loader: - tensor 109: llama_model_loader: - tensor 110: llama_model_loader: - tensor 111: llama_model_loader: - tensor 112: llama_model_loader: - tensor 113: llama_model_loader: - tensor 114: llama_model_loader: - tensor 115: llama_model_loader: - tensor 116: llama_model_loader: - tensor 117: llama_model_loader: - tensor 118: llama_model_loader: - tensor 119: llama_model_loader: - tensor 120: llama_model_loader: - tensor 121: llama_model_loader: - tensor 122: llama_model_loader: - tensor 123: llama_model_loader: - tensor 124: llama_model_loader: - tensor 125: llama_model_loader: - tensor 126: llama_model_loader: - tensor 127: llama_model_loader: - tensor 128: llama_model_loader: - tensor 129: llama_model_loader: - tensor 130: llama_model_loader: - tensor 131: llama_model_loader: - tensor 132: llama_model_loader: - tensor 133: llama_model_loader: - tensor 134: llama_model_loader: - tensor 135: llama_model_loader: - tensor 136: llama_model_loader: - tensor 137: llama_model_loader: - tensor 138: llama_model_loader: - tensor 139: llama_model_loader: - tensor 140: llama_model_loader: - tensor 141: llama_model_loader: - tensor 142: llama_model_loader: - tensor 143: llama_model_loader: - tensor 144: llama_model_loader: - tensor 145: llama_model_loader: - tensor 146: llama_model_loader: - tensor 147: llama_model_loader: - tensor 148: llama_model_loader: - tensor 149: llama_model_loader: - tensor 150: llama_model_loader: - tensor 151: llama_model_loader: - tensor 152: llama_model_loader: - tensor 153: llama_model_loader: - tensor 154: llama_model_loader: - tensor 155: llama_model_loader: - tensor 156: llama_model_loader: - tensor 157: llama_model_loader: - tensor 158: llama_model_loader: - tensor 159: llama_model_loader: - tensor 160: llama_model_loader: - tensor 161: llama_model_loader: - tensor 162: llama_model_loader: - tensor 163: llama_model_loader: - tensor 164: llama_model_loader: - tensor 165: llama_model_loader: - tensor 166: llama_model_loader: - tensor 167: llama_model_loader: - tensor 168: llama_model_loader: - tensor 169: llama_model_loader: - tensor 170: llama_model_loader: - tensor 171: llama_model_loader: - tensor 172: llama_model_loader: - tensor 173: llama_model_loader: - tensor 174: llama_model_loader: - tensor 175: llama_model_loader: - tensor 176: llama_model_loader: - tensor 177: llama_model_loader: - tensor 178: llama_model_loader: - tensor 179: llama_model_loader: - tensor 180: llama_model_loader: - tensor 181: llama_model_loader: - tensor 182: llama_model_loader: - tensor 183: llama_model_loader: - tensor 184: llama_model_loader: - tensor 185: llama_model_loader: - tensor 186: llama_model_loader: - tensor 187: llama_model_loader: - tensor 188: llama_model_loader: - tensor 189: llama_model_loader: - tensor 190: llama_model_loader: - tensor 191: llama_model_loader: - tensor 192: llama_model_loader: - tensor 193: llama_model_loader: - tensor 194: llama_model_loader: - tensor 195: llama_model_loader: - tensor 196: llama_model_loader: - tensor 197: llama_model_loader: - tensor 198: llama_model_loader: - tensor 199: llama_model_loader: - tensor 200: llama_model_loader: - kv 0: llama_model_loader: - kv 1: llama_model_loader: - kv 2: llama_model_loader: - kv 3: llama_model_loader: - kv 4: llama_model_loader: - kv 5: llama_model_loader: - kv 6: llama_model_loader: - kv 7: llama_model_loader: - kv 8: llama_model_loader: - kv 9: llama_model_loader: - kv 10: llama_model_loader: - kv 11: llama_model_loader: - kv 12: llama_model_loader: - kv 13: llama_model_loader: - kv 14: llama_model_loader: - kv 15: llama_model_loader: - kv 16: llama_model_loader: - kv 17: llama_model_loader: - kv 18: llama_model_loader: - kv 19: llama_model_loader: - type f32: llama_model_loader: - type q5_K: llama_model_loader: - type q6_K: llm_load_vocab: special tokens llm_load_print_meta: format llm_load_print_meta: arch llm_load_print_meta: vocab type llm_load_print_meta: n_vocab llm_load_print_meta: n_merges llm_load_print_meta: n_ctx_train llm_load_print_meta: n_embd llm_load_print_meta: n_head llm_load_print_meta: n_head_kv llm_load_print_meta: n_layer llm_load_print_meta: n_rot llm_load_print_meta: n_gqa llm_load_print_meta: f_norm_eps llm_load_print_meta: f_norm_rms_eps llm_load_print_meta: f_clamp_kqv llm_load_print_meta: f_max_alibi_bias llm_load_print_meta: n_ff llm_load_print_meta: rope scaling llm_load_print_meta: freq_base_train llm_load_print_meta: freq_scale_train llm_load_print_meta: n_yarn_orig_ctx llm_load_print_meta: rope_finetuned llm_load_print_meta: model type llm_load_print_meta: model ftype llm_load_print_meta: model params llm_load_print_meta: model size llm_load_print_meta: general.name llm_load_print_meta: BOS llm_load_print_meta: EOS llm_load_print_meta: UNK llm_load_print_meta: LF token llm_load_tensors: ggml ctx size = llm_load_tensors: mem required .................................. llama_new_context_with_model: n_ctx llama_new_context_with_model: freq_base llama_new_context_with_model: llama_new_context_with_model: kv self size = llama_build_graph: non-view ggml_metal_init: allocating ggml_metal_init: found device: ggml_metal_init: found device: ggml_metal_init: picking ggml_metal_init: default.metallib [nodemon] app crashed - waiting ` --ignore documents --ignore vector-cache --ignore storage --ignore swagger --trace-warnings index.js time, enter rs js,mjs,json --trace-warnings index.js Telemetry stubbed in development. pool with 13 connections. meta data with 20 key-value pairs and 201 tensors from /Users/path-to-model/tinyllama-2-1b-miniguanaco.Q5_K_M.gguf (version GGUF V2) token_embd.weight q5_K [ 2048, 32003, 1, 1 ] blk.0.attn_q.weight q5_K [ 2048, 2048, 1, 1 ] blk.0.attn_k.weight q5_K [ 2048, 256, 1, 1 ] blk.0.attn_v.weight q6_K [ 2048, 256, 1, 1 ] blk.0.attn_output.weight q5_K [ 2048, 2048, 1, 1 ] blk.0.ffn_gate.weight q5_K [ 2048, 5632, 1, 1 ] blk.0.ffn_up.weight q5_K [ 2048, 5632, 1, 1 ] blk.0.ffn_down.weight q6_K [ 5632, 2048, 1, 1 ] blk.0.attn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.0.ffn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.1.attn_q.weight q5_K [ 2048, 2048, 1, 1 ] blk.1.attn_k.weight q5_K [ 2048, 256, 1, 1 ] blk.1.attn_v.weight q6_K [ 2048, 256, 1, 1 ] blk.1.attn_output.weight q5_K [ 2048, 2048, 1, 1 ] blk.1.ffn_gate.weight q5_K [ 2048, 5632, 1, 1 ] blk.1.ffn_up.weight q5_K [ 2048, 5632, 1, 1 ] blk.1.ffn_down.weight q6_K [ 5632, 2048, 1, 1 ] blk.1.attn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.1.ffn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.2.attn_q.weight q5_K [ 2048, 2048, 1, 1 ] blk.2.attn_k.weight q5_K [ 2048, 256, 1, 1 ] blk.2.attn_v.weight q5_K [ 2048, 256, 1, 1 ] blk.2.attn_output.weight q5_K [ 2048, 2048, 1, 1 ] blk.2.ffn_gate.weight q5_K [ 2048, 5632, 1, 1 ] blk.2.ffn_up.weight q5_K [ 2048, 5632, 1, 1 ] blk.2.ffn_down.weight q5_K [ 5632, 2048, 1, 1 ] blk.2.attn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.2.ffn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.3.attn_q.weight q5_K [ 2048, 2048, 1, 1 ] blk.3.attn_k.weight q5_K [ 2048, 256, 1, 1 ] blk.3.attn_v.weight q5_K [ 2048, 256, 1, 1 ] blk.3.attn_output.weight q5_K [ 2048, 2048, 1, 1 ] blk.3.ffn_gate.weight q5_K [ 2048, 5632, 1, 1 ] blk.3.ffn_up.weight q5_K [ 2048, 5632, 1, 1 ] blk.3.ffn_down.weight q5_K [ 5632, 2048, 1, 1 ] blk.3.attn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.3.ffn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.4.attn_q.weight q5_K [ 2048, 2048, 1, 1 ] blk.4.attn_k.weight q5_K [ 2048, 256, 1, 1 ] blk.4.attn_v.weight q6_K [ 2048, 256, 1, 1 ] blk.4.attn_output.weight q5_K [ 2048, 2048, 1, 1 ] blk.4.ffn_gate.weight q5_K [ 2048, 5632, 1, 1 ] blk.4.ffn_up.weight q5_K [ 2048, 5632, 1, 1 ] blk.4.ffn_down.weight q6_K [ 5632, 2048, 1, 1 ] blk.4.attn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.4.ffn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.5.attn_q.weight q5_K [ 2048, 2048, 1, 1 ] blk.5.attn_k.weight q5_K [ 2048, 256, 1, 1 ] blk.5.attn_v.weight q5_K [ 2048, 256, 1, 1 ] blk.5.attn_output.weight q5_K [ 2048, 2048, 1, 1 ] blk.5.ffn_gate.weight q5_K [ 2048, 5632, 1, 1 ] blk.5.ffn_up.weight q5_K [ 2048, 5632, 1, 1 ] blk.5.ffn_down.weight q5_K [ 5632, 2048, 1, 1 ] blk.5.attn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.5.ffn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.6.attn_q.weight q5_K [ 2048, 2048, 1, 1 ] blk.6.attn_k.weight q5_K [ 2048, 256, 1, 1 ] blk.6.attn_v.weight q5_K [ 2048, 256, 1, 1 ] blk.6.attn_output.weight q5_K [ 2048, 2048, 1, 1 ] blk.6.ffn_gate.weight q5_K [ 2048, 5632, 1, 1 ] blk.6.ffn_up.weight q5_K [ 2048, 5632, 1, 1 ] blk.6.ffn_down.weight q5_K [ 5632, 2048, 1, 1 ] blk.6.attn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.6.ffn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.7.attn_q.weight q5_K [ 2048, 2048, 1, 1 ] blk.7.attn_k.weight q5_K [ 2048, 256, 1, 1 ] blk.7.attn_v.weight q6_K [ 2048, 256, 1, 1 ] blk.7.attn_output.weight q5_K [ 2048, 2048, 1, 1 ] blk.7.ffn_gate.weight q5_K [ 2048, 5632, 1, 1 ] blk.7.ffn_up.weight q5_K [ 2048, 5632, 1, 1 ] blk.7.ffn_down.weight q6_K [ 5632, 2048, 1, 1 ] blk.7.attn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.7.ffn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.8.attn_q.weight q5_K [ 2048, 2048, 1, 1 ] blk.8.attn_k.weight q5_K [ 2048, 256, 1, 1 ] blk.8.attn_v.weight q5_K [ 2048, 256, 1, 1 ] blk.8.attn_output.weight q5_K [ 2048, 2048, 1, 1 ] blk.8.ffn_gate.weight q5_K [ 2048, 5632, 1, 1 ] blk.8.ffn_up.weight q5_K [ 2048, 5632, 1, 1 ] blk.8.ffn_down.weight q5_K [ 5632, 2048, 1, 1 ] blk.8.attn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.8.ffn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.9.attn_q.weight q5_K [ 2048, 2048, 1, 1 ] blk.9.attn_k.weight q5_K [ 2048, 256, 1, 1 ] blk.9.attn_v.weight q5_K [ 2048, 256, 1, 1 ] blk.9.attn_output.weight q5_K [ 2048, 2048, 1, 1 ] blk.9.ffn_gate.weight q5_K [ 2048, 5632, 1, 1 ] blk.9.ffn_up.weight q5_K [ 2048, 5632, 1, 1 ] blk.9.ffn_down.weight q5_K [ 5632, 2048, 1, 1 ] blk.9.attn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.9.ffn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.10.attn_q.weight q5_K [ 2048, 2048, 1, 1 ] blk.10.attn_k.weight q5_K [ 2048, 256, 1, 1 ] blk.10.attn_v.weight q6_K [ 2048, 256, 1, 1 ] blk.10.attn_output.weight q5_K [ 2048, 2048, 1, 1 ] blk.10.ffn_gate.weight q5_K [ 2048, 5632, 1, 1 ] blk.10.ffn_up.weight q5_K [ 2048, 5632, 1, 1 ] blk.10.ffn_down.weight q6_K [ 5632, 2048, 1, 1 ] blk.10.attn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.10.ffn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.11.attn_q.weight q5_K [ 2048, 2048, 1, 1 ] blk.11.attn_k.weight q5_K [ 2048, 256, 1, 1 ] blk.11.attn_v.weight q5_K [ 2048, 256, 1, 1 ] blk.11.attn_output.weight q5_K [ 2048, 2048, 1, 1 ] blk.11.ffn_gate.weight q5_K [ 2048, 5632, 1, 1 ] blk.11.ffn_up.weight q5_K [ 2048, 5632, 1, 1 ] blk.11.ffn_down.weight q5_K [ 5632, 2048, 1, 1 ] blk.11.attn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.11.ffn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.12.attn_q.weight q5_K [ 2048, 2048, 1, 1 ] blk.12.attn_k.weight q5_K [ 2048, 256, 1, 1 ] blk.12.attn_v.weight q5_K [ 2048, 256, 1, 1 ] blk.12.attn_output.weight q5_K [ 2048, 2048, 1, 1 ] blk.12.ffn_gate.weight q5_K [ 2048, 5632, 1, 1 ] blk.12.ffn_up.weight q5_K [ 2048, 5632, 1, 1 ] blk.12.ffn_down.weight q5_K [ 5632, 2048, 1, 1 ] blk.12.attn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.12.ffn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.13.attn_q.weight q5_K [ 2048, 2048, 1, 1 ] blk.13.attn_k.weight q5_K [ 2048, 256, 1, 1 ] blk.13.attn_v.weight q6_K [ 2048, 256, 1, 1 ] blk.13.attn_output.weight q5_K [ 2048, 2048, 1, 1 ] blk.13.ffn_gate.weight q5_K [ 2048, 5632, 1, 1 ] blk.13.ffn_up.weight q5_K [ 2048, 5632, 1, 1 ] blk.13.ffn_down.weight q6_K [ 5632, 2048, 1, 1 ] blk.13.attn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.13.ffn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.14.attn_q.weight q5_K [ 2048, 2048, 1, 1 ] blk.14.attn_k.weight q5_K [ 2048, 256, 1, 1 ] blk.14.attn_v.weight q5_K [ 2048, 256, 1, 1 ] blk.14.attn_output.weight q5_K [ 2048, 2048, 1, 1 ] blk.14.ffn_gate.weight q5_K [ 2048, 5632, 1, 1 ] blk.14.ffn_up.weight q5_K [ 2048, 5632, 1, 1 ] blk.14.ffn_down.weight q5_K [ 5632, 2048, 1, 1 ] blk.14.attn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.14.ffn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.15.attn_q.weight q5_K [ 2048, 2048, 1, 1 ] blk.15.attn_k.weight q5_K [ 2048, 256, 1, 1 ] blk.15.attn_v.weight q5_K [ 2048, 256, 1, 1 ] blk.15.attn_output.weight q5_K [ 2048, 2048, 1, 1 ] blk.15.ffn_gate.weight q5_K [ 2048, 5632, 1, 1 ] blk.15.ffn_up.weight q5_K [ 2048, 5632, 1, 1 ] blk.15.ffn_down.weight q5_K [ 5632, 2048, 1, 1 ] blk.15.attn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.15.ffn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.16.attn_q.weight q5_K [ 2048, 2048, 1, 1 ] blk.16.attn_k.weight q5_K [ 2048, 256, 1, 1 ] blk.16.attn_v.weight q6_K [ 2048, 256, 1, 1 ] blk.16.attn_output.weight q5_K [ 2048, 2048, 1, 1 ] blk.16.ffn_gate.weight q5_K [ 2048, 5632, 1, 1 ] blk.16.ffn_up.weight q5_K [ 2048, 5632, 1, 1 ] blk.16.ffn_down.weight q6_K [ 5632, 2048, 1, 1 ] blk.16.attn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.16.ffn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.17.attn_q.weight q5_K [ 2048, 2048, 1, 1 ] blk.17.attn_k.weight q5_K [ 2048, 256, 1, 1 ] blk.17.attn_v.weight q5_K [ 2048, 256, 1, 1 ] blk.17.attn_output.weight q5_K [ 2048, 2048, 1, 1 ] blk.17.ffn_gate.weight q5_K [ 2048, 5632, 1, 1 ] blk.17.ffn_up.weight q5_K [ 2048, 5632, 1, 1 ] blk.17.ffn_down.weight q5_K [ 5632, 2048, 1, 1 ] blk.17.attn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.17.ffn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.18.attn_q.weight q5_K [ 2048, 2048, 1, 1 ] blk.18.attn_k.weight q5_K [ 2048, 256, 1, 1 ] blk.18.attn_v.weight q5_K [ 2048, 256, 1, 1 ] blk.18.attn_output.weight q5_K [ 2048, 2048, 1, 1 ] blk.18.ffn_gate.weight q5_K [ 2048, 5632, 1, 1 ] blk.18.ffn_up.weight q5_K [ 2048, 5632, 1, 1 ] blk.18.ffn_down.weight q5_K [ 5632, 2048, 1, 1 ] blk.18.attn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.18.ffn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.19.attn_q.weight q5_K [ 2048, 2048, 1, 1 ] blk.19.attn_k.weight q5_K [ 2048, 256, 1, 1 ] blk.19.attn_v.weight q6_K [ 2048, 256, 1, 1 ] blk.19.attn_output.weight q5_K [ 2048, 2048, 1, 1 ] blk.19.ffn_gate.weight q5_K [ 2048, 5632, 1, 1 ] blk.19.ffn_up.weight q5_K [ 2048, 5632, 1, 1 ] blk.19.ffn_down.weight q6_K [ 5632, 2048, 1, 1 ] blk.19.attn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.19.ffn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.20.attn_q.weight q5_K [ 2048, 2048, 1, 1 ] blk.20.attn_k.weight q5_K [ 2048, 256, 1, 1 ] blk.20.attn_v.weight q6_K [ 2048, 256, 1, 1 ] blk.20.attn_output.weight q5_K [ 2048, 2048, 1, 1 ] blk.20.ffn_gate.weight q5_K [ 2048, 5632, 1, 1 ] blk.20.ffn_up.weight q5_K [ 2048, 5632, 1, 1 ] blk.20.ffn_down.weight q6_K [ 5632, 2048, 1, 1 ] blk.20.attn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.20.ffn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.21.attn_q.weight q5_K [ 2048, 2048, 1, 1 ] blk.21.attn_k.weight q5_K [ 2048, 256, 1, 1 ] blk.21.attn_v.weight q6_K [ 2048, 256, 1, 1 ] blk.21.attn_output.weight q5_K [ 2048, 2048, 1, 1 ] blk.21.ffn_gate.weight q5_K [ 2048, 5632, 1, 1 ] blk.21.ffn_up.weight q5_K [ 2048, 5632, 1, 1 ] blk.21.ffn_down.weight q6_K [ 5632, 2048, 1, 1 ] blk.21.attn_norm.weight f32 [ 2048, 1, 1, 1 ] blk.21.ffn_norm.weight f32 [ 2048, 1, 1, 1 ] output_norm.weight f32 [ 2048, 1, 1, 1 ] output.weight q6_K [ 2048, 32003, 1, 1 ] general.architecture str
general.name str
llama.context_length u32
llama.embedding_length u32
llama.block_count u32
llama.feed_forward_length u32
llama.rope.dimension_count u32
llama.attention.head_count u32
llama.attention.head_count_kv u32
llama.attention.layer_norm_rms_epsilon f32
llama.rope.freq_base f32
general.file_type u32
tokenizer.ggml.model str
tokenizer.ggml.tokens arr
tokenizer.ggml.scores arr
tokenizer.ggml.token_type arr
tokenizer.ggml.bos_token_id u32
tokenizer.ggml.eos_token_id u32
tokenizer.ggml.unknown_token_id u32
general.quantization_version u32
45 tensors 135 tensors 21 tensors definition check successful ( 262/32003 ). = GGUF V2 = llama = SPM = 32003 = 0 = 2048 = 2048 = 32 = 4 = 22 = 64 = 8 = 0.0e+00 = 1.0e-05 = 0.0e+00 = 0.0e+00 = 5632 = linear = 10000.0 = 1 = 2048 = unknown = ?B = mostly Q5_K - Medium = 1.10 B = 745.12 MiB (5.68 BPW) = abdgrt_tinyllama-2-1b-miniguanaco token = 1 '~~' token = 2 '~~' token = 0 '' = 13 '<0x0A>' 0.07 MB = 745.20 MB .................................................... = 4096 = 10000.0 freq_scale = 1 88.00 MB tensors processed: 510/510 AMD Radeon RX 6800 Intel(R) UHD Graphics 630 default device: AMD Radeon RX 6800 not found, loading from source for file changes before starting...

Mintplex-Labs / anything-llm

default.metallib not found #478