Executorch exported model produces gibberish: stories15M --dtype fp32 --quantize '{"embedding": {"bitwidth": 4, "groupsize":32}, "linear:a8w4dq": {"groupsize" : 256}}'

stories15M produces gibberish with embedding quantization and a8w4dq on macOS/ARM. Integration issue maybe? (Since this is the workhorse for mobile, with. ARM?!)

https://github.com/pytorch/torchchat/actions/runs/8997932498/job/24717027755?pr=718 (at bottom)

========================================

Average tokens/sec: 19.35 Memory used: 0.00 GB

python3 torchchat.py export stories15M --dtype fp32 --quantize '{"embedding": {"bitwidth": 4, "groupsize":32}, "linear:a8w4dq": {"groupsize" : 256}}' --output-pte-path stories15M.pte Using device=cpu Loading model... Time to load model: 0.01 seconds Quantizing the model with: {'embedding': {'bitwidth': 4, 'groupsize': 32}, 'linear:a8w4dq': {'groupsize': 256}}

Downloading builder script: 0%| | 0.00/5.67k [00:00<?, ?B/s] Downloading builder script: 100%|██████████| 5.67k/5.67k [00:00<00:00, 2.60MB/s] /Library/Frameworks/Python.framework/Versions/3.10/lib/python3.10/site-packages/executorch/exir/emit/_emitter.py:1474: UserWarning: Mutation on a buffer in the model is detected. ExecuTorch assumes buffers that are mutated in the graph have a meaningless initial state, only the shape and dtype will be serialized. warnings.warn( Time to quantize model: 2.72 seconds Exporting model using ExecuTorch to /Users/runner/work/torchchat/torchchat/stories15M.pte The methods are: {'forward'}
python3 generate.py stories15M --pte-path stories15M.pte --prompt 'Hello my name is' [program.cpp:130] InternalConsistency verification requested but not available [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. Warning: checkpoint path ignored because an exported DSO or PTE path specified Warning: checkpoint path ignored because an exported DSO or PTE path specified Using device=cpu Apple M1 (Virtual) [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. Loading model... Time to load model: 0.03 seconds [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. Hello my name is Gberba. This is Mimi, his parents". Mimi was so excited to learn. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. So excitedly she became a dependable girl and followed him everywhere he went. He showed her everything she wanted to do and she had so much fun! [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. Next, Mimi and her parents went to the store. Mimi wanted to hurry up, she wanted to listen to the games of tag. Suddenly, Mimi heard a knock at the door. Mimi's parents went back to the store and she peered over where everyone was playing was. Mimi's dream was ruined! [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. Mimi's parents said they were going to have a surprise waiting for Mimi. She was so frustrated that she cried and cried. Mimi cried and cried until she could not hear all the voices anymore. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. When Mimi finally got home, she realised it was too late. She couldn't help feeling disappointed that she couldn Time for inference 1: 0.44 sec total, 453.87 tokens/sec Bandwidth achieved: 0.00 GB/s [Max Sequence Length Reached. Ending Conversation.]

[method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. Hello my name is Facle. His name is Fzen. Fzen is a robot that weighs two times. Fzen weighs and it isn't very flexible today." [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. Mixie was very excited! He wanted to try it right away. He shouted to F seasons, "Is winter at 2?" [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. Little An H-ure H-A year" Little Frosty answered: "I don't know what 10000-2000' year! Giving means it is meant to really know!" [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. Little Fze was very curious. He asked numbers and counted, "One plus two year!" [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. [method.cpp:939] Overriding output data pointer allocated by memory plan is not allowed. Finally, F Santa called Fzen Frosty. "You counted is 100 year-old? Bra3 year- hour!" Little Frost-cz Frost- Lew would grow and now Frost-map was his birthday! Once upon a time, there was a little girl Time for inference 2: 0.42 sec total, 472.76 tokens/sec Bandwidth achieved: 0.00 GB/s [Max Sequence Length Reached. Ending Conversation.]

========================================

Average tokens/sec: 463.32 Memory used: 0.00 GB
false reached end of file without exit command
echo 'reached end of file without exit command'
exit 1 Error: Process completed with exit code 1. 0s

pytorch / executorch

Executorch exported model produces gibberish: stories15M --dtype fp32 --quantize '{"embedding": {"bitwidth": 4, "groupsize":32}, "linear:a8w4dq": {"groupsize" : 256}}' #3542