§01·model · /models

Llama 3.1 7B

llmactive

§02·GPUs that run this model

6 total

GPU	VRAM	Series	Best speed	Min VRAM	Works	Benchmarks
RTX 4090	24GB	40	135tok/s	24GB	✓	1	check ↗
RTX 3090	24GB	30	95tok/s	24GB	✓	1	check ↗
RTX 4070 Super	12GB	40	75tok/s	12GB	✓	1	check ↗
RTX 4060 Ti 16GB	16GB	40	55tok/s	16GB	✓	1	check ↗
RTX 3060	12GB	30	45tok/s	12GB	✓	1	check ↗
Apple M3 Max	0GB	apple	40tok/s	64GB	✓	1	check ↗