llama.cpp ist eine Open-Source Softwarebibliothek, die Inferenz auf verschiedenen großen Sprachmodellen wie Granite, Mistral und Llama durchführt. Cc llama.ccp - Wikipedia