-
Τρεις το λάδι, τρεις το ξίδι, έξι το ____
==> λαδόξυδο 99%, σύνολο 0.5%, ... -
Ο ουρανός είναι ____
==> γαλάζιος 30%, μεγάλος 20%, σκοτεινός 19%, μπλε 17%, ...
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
(αλλά είναι απλά στατιστική).
Τα διανύσματα στην πράξη έχουν χιλιάδες αριθμούς.
Κάθε λέξη αντιστοιχεί σε ένα ή περισσότερα διανύσματα, π.χ. Λυκάνθρωπος = σίγουρα 2 διανύσματα αλλά και άνθρωπος μπορεί να είναι δύο.
Τα διανύσματα τα ονομάζουμε tokens.
.
.
.
Αρχίσαμε να περπατάμε ___
Αρχίσαμε να περπατάμε μέσα ___
Αρχίσαμε να περπατάμε μέσα στην ___
Αρχίσαμε να περπατάμε μέσα στην πόλη ___
Αρχίσαμε να περπατάμε μέσα στην πόλη χωρίς ___
Αρχίσαμε να περπατάμε μέσα στην πόλη χωρίς προορισμό.
|
|
|
|
Ο Θεόδωρος Κολοκοτρώνης ήταν ___
Ο Θεόδωρος Κολοκοτρώνης ήταν η κορυφαία ηγετική μορφή και αρχιστράτηγος της Ελληνικής Επανάστασης του 1821, με καθοριστική δράση στην Πελοπόννησο. Υπήρξε έμπειρος κλέφτης, Φιλικός, στρατηγικός νους (μάχες στα Δερβενάκια, Βαλτέτσι) και πρωτεργάτης της απελευθέρωσης της Τριπολιτσάς.
.
.
.
.
.
.
.
.
.
.
.
.
Why is the sky blue?
.
.
.
.
.
.
.
.
.
.
.
.
.
Question: Why is the sky blue?
Answer: ___
|
|
|
|
You are a helpful assistant. Answer clearly, accurately, and briefly. If you are unsure, say so instead of making things up.
Question: Why is the sky blue?
Answer: ___
.
.
.
.
.
.
.
.
.
.
.
.
.
1. Chain-of-thought prompting Ζητάτε από το μοντέλο να γράψει τα ενδιάμεσα βήματα αντί να πηγαίνει κατευθείαν στην απάντηση.
Παράδειγμα:
- Bad prompt: “If John has 3 apples and buys 2 more, how many?”
- Better prompt: “If John has 3 apples and buys 2 more, how many? Solve step by step.”
Αυτό συχνά βελτιώνει την αριθμητική, τη λογική και τα προβλήματα λόγου, επειδή το μοντέλο δημιουργεί μια ακολουθία τύπου "πρόχειρο" πριν την τελική απάντηση.
2. Scratchpads Οι ερευνητές έκαναν το μοντέλο να παράγει ρητά μια προσωρινή μνήμη εργασίας σε κείμενο.
Παράδειγμα:
- “First list the facts.”
- “Then derive the intermediate quantities.”
- “Then give the final answer.”
3. Generate-then-verify Ένα μοντέλο (ή ένα πέρασμα) προτείνει μια απάντηση και ένα άλλο πέρασμα την ελέγχει.
Παράδειγμα:
- Pass 1: solve geometry problem
- Pass 2: “Check each step for algebra mistakes”
- Pass 3: revise if needed
Γράψε μου ένα πρόγραμμα που υπολογίζει το συνολικό Φ.Π.Α. ενός τιμολογίου με τις παρακάτω γραμμές.
.
.
.
.
.
.
.
.
.
.
.
.
Αντί να κάνει το LLM τα πάντα εσωτερικά, του επιτρέπετε να καλεί αριθμομηχανές, κώδικα, βάσεις δεδομένων ή μηχανές αναζήτησης.
Παραδείγματα:
- Write a program for exact arithmetic
Το tool calling δεν είναι μαγικό· απλά λες στο LLM σε ποια περίπτωση το χρειάζεται και τι να γράψει ακριβώς.
Όποτε χρειαστεί να κάνεις υπολογισμούς, γράψε (πες μου πόσο κάνει: <<αριθμητική παράσταση>>).
.
.
.
.
.
.
.
.
.
Η βασική διαφορά είναι αυτή:
Ένα μη-reasoning LLM δουλεύει πιο πολύ σαν να λέει:
«Ποια απάντηση μοιάζει πιο πιθανή να έρχεται μετά από αυτό το prompt;»
Ένα reasoning LLM δουλεύει πιο πολύ σαν να λέει:
«Πριν απαντήσω, ας το σπάσω σε βήματα και ας ελέγξω λίγο καλύτερα τι βγαίνει.»
Σαν διαγώνισμα:
- Το non-reasoning μοντέλο μοιάζει με μαθητή που διαβάζει την ερώτηση και απαντάει αμέσως με βάση το τι του φαίνεται σωστό.
- Το reasoning μοντέλο μοιάζει με μαθητή που πρώτα κάνει πρόχειρο, χωρίζει το πρόβλημα σε βήματα, και μετά γράφει την τελική απάντηση.
.
.
.
.
.
- Stop copy pasting
- loop
- have a robust success criteria
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.