Quick Start Cheat Sheet

Forgot everything? Start here.

First Time Setup

cd ~/PycharmProjects/coding-assistant

# 1. Build llama.cpp (one-time, takes ~5 minutes)
./setup.sh

# 2. Download model (one-time, ~4GB)
./download-model.sh qwen2.5-coder-7b

# 3. Start using it
./chat.sh

Daily Usage

Chat in Terminal

./chat.sh

Start API Server (for OpenCode/Droid)

./server.sh

Then configure your IDE to use: http://127.0.0.1:8080/v1

Common Tasks

List Available Models

./download-model.sh

Download Different Model

./download-model.sh qwen2.5-coder-3b  # Smaller, faster

Switch Active Model

Open config.sh in any editor
Change this line:
```
ACTIVE_MODEL="qwen2.5-coder-3b"
```
Save and restart chat/server

Change Settings (threads, temperature, context, etc.)

Edit config.sh - key settings:

ACTIVE_MODEL - which model to use
N_THREADS - CPU threads (default: 6)
CONTEXT_SIZE - context window (default: 4096)
TEMPERATURE - creativity 0.1-1.0 (default: 0.5)
SERVER_PORT - API port (default: 8080)

Troubleshooting

Error: "llama.cpp not built"

→ Run ./setup.sh

Error: "Model not found"

→ Run ./download-model.sh qwen2.5-coder-7b

Too slow

→ Try smaller model: ./download-model.sh qwen2.5-coder-3b → Edit config.sh: reduce CONTEXT_SIZE to 4096

Server port already in use

→ Edit config.sh: change SERVER_PORT=8081

File Guide

models.conf - Add new models here (one line per model)
config.sh - Change settings here (active model, threads, etc.)
README.md - Full documentation (read when you have time)

That's It!

Really, it's just:

./setup.sh (once)
./download-model.sh qwen2.5-coder-7b (once per model)
./chat.sh or ./server.sh (daily use)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Quick Start Cheat Sheet

First Time Setup

Daily Usage

Chat in Terminal

Start API Server (for OpenCode/Droid)

Common Tasks

List Available Models

Download Different Model

Switch Active Model

Change Settings (threads, temperature, context, etc.)

Troubleshooting

Error: "llama.cpp not built"

Error: "Model not found"

Too slow

Server port already in use

File Guide

That's It!

FilesExpand file tree

QUICKSTART.md

Latest commit

History

QUICKSTART.md

File metadata and controls

Quick Start Cheat Sheet

First Time Setup

Daily Usage

Chat in Terminal

Start API Server (for OpenCode/Droid)

Common Tasks

List Available Models

Download Different Model

Switch Active Model

Change Settings (threads, temperature, context, etc.)

Troubleshooting

Error: "llama.cpp not built"

Error: "Model not found"

Too slow

Server port already in use

File Guide

That's It!