Skip to content

Latest commit

 

History

History
324 lines (227 loc) · 7.25 KB

File metadata and controls

324 lines (227 loc) · 7.25 KB

ΑΙ -> Gen AI -> LLMs

image

Τι κάνει ένα LLM

  • Τρεις το λάδι, τρεις το ξίδι, έξι το ____

    ==> λαδόξυδο 99%, σύνολο 0.5%, ...

  • Ο ουρανός είναι ____

    ==> γαλάζιος 30%, μεγάλος 20%, σκοτεινός 19%, μπλε 17%, ...

.
.
.
.
.
.
.
.
.


Αλλά ας αρχίσουμε από τα βασικά -- λέξεις - tokens

Pasted image 20260324191001
.
.
.
.
.
.
.
.
.

Το πρώτο μαγικό κομμάτι

(αλλά είναι απλά στατιστική).

Pasted image 20260324190724

Τα διανύσματα στην πράξη έχουν χιλιάδες αριθμούς.

Κάθε λέξη αντιστοιχεί σε ένα ή περισσότερα διανύσματα, π.χ. Λυκάνθρωπος = σίγουρα 2 διανύσματα αλλά και άνθρωπος μπορεί να είναι δύο. Τα διανύσματα τα ονομάζουμε tokens.

.
.
.

Now that we have tokens let's autocomplete

Αρχίσαμε να περπατάμε ___

Αρχίσαμε να περπατάμε μέσα ___

Αρχίσαμε να περπατάμε μέσα στην ___

Αρχίσαμε να περπατάμε μέσα στην πόλη ___

Αρχίσαμε να περπατάμε μέσα στην πόλη χωρίς ___

Αρχίσαμε να περπατάμε μέσα στην πόλη χωρίς προορισμό.

|
|
|
|

Μπορεί και καλύτερα

Ο Θεόδωρος Κολοκοτρώνης ήταν ___

Ο Θεόδωρος Κολοκοτρώνης ήταν η κορυφαία ηγετική μορφή και αρχιστράτηγος της Ελληνικής Επανάστασης του 1821, με καθοριστική δράση στην Πελοπόννησο. Υπήρξε έμπειρος κλέφτης, Φιλικός, στρατηγικός νους (μάχες στα Δερβενάκια, Βαλτέτσι) και πρωτεργάτης της απελευθέρωσης της Τριπολιτσάς.

.
.
.
.
.
.
.
.
.
.
.
.


Autocompletion σε σχηματάκι

Pasted image 20260324192354

Ναι, αλλά πως στο καλό απαντά ερωτήσεις?

Why is the sky blue?

.
.
.
.
.
.
.
.
.
.
.
.
.


:-) (THE FIRST HARNESH?)

Question: Why is the sky blue?

Answer: ___

|
|
|
|

Μπορούμε και καλύτερα (System Prompt)

You are a helpful assistant. Answer clearly, accurately, and briefly. If you are unsure, say so instead of making things up.

Question: Why is the sky blue?

Answer: ___

.
.
.
.
.
.
.
.
.
.
.
.
.

But sometimes it fails miserably


Μπορούμε και καλύτερα (τεχνικές prompting και chaining)

1. Chain-of-thought prompting Ζητάτε από το μοντέλο να γράψει τα ενδιάμεσα βήματα αντί να πηγαίνει κατευθείαν στην απάντηση.

Παράδειγμα:

  • Bad prompt: “If John has 3 apples and buys 2 more, how many?”
  • Better prompt: “If John has 3 apples and buys 2 more, how many? Solve step by step.”

Αυτό συχνά βελτιώνει την αριθμητική, τη λογική και τα προβλήματα λόγου, επειδή το μοντέλο δημιουργεί μια ακολουθία τύπου "πρόχειρο" πριν την τελική απάντηση.

2. Scratchpads Οι ερευνητές έκαναν το μοντέλο να παράγει ρητά μια προσωρινή μνήμη εργασίας σε κείμενο.

Παράδειγμα:

  • “First list the facts.”
  • “Then derive the intermediate quantities.”
  • “Then give the final answer.”

3. Generate-then-verify Ένα μοντέλο (ή ένα πέρασμα) προτείνει μια απάντηση και ένα άλλο πέρασμα την ελέγχει.

Παράδειγμα:

  • Pass 1: solve geometry problem
  • Pass 2: “Check each step for algebra mistakes”
  • Pass 3: revise if needed

Μετά από όλα αυτά τα LLMs γράφουν απλό κώδικα (10-50 γραμμές) που λειτουργεί

Γράψε μου ένα πρόγραμμα που υπολογίζει το συνολικό Φ.Π.Α. ενός τιμολογίου με τις παρακάτω γραμμές.

.
.
.
.
.
.
.
.
.
.
.
.

Tool Calling

Αντί να κάνει το LLM τα πάντα εσωτερικά, του επιτρέπετε να καλεί αριθμομηχανές, κώδικα, βάσεις δεδομένων ή μηχανές αναζήτησης.

Παραδείγματα:

  • Write a program for exact arithmetic

Το tool calling δεν είναι μαγικό· απλά λες στο LLM σε ποια περίπτωση το χρειάζεται και τι να γράψει ακριβώς.

Όποτε χρειαστεί να κάνεις υπολογισμούς, γράψε (πες μου πόσο κάνει: <<αριθμητική παράσταση>>).

.
.
.
.
.
.
.
.
.

Reasoning

Η βασική διαφορά είναι αυτή:

Ένα μη-reasoning LLM δουλεύει πιο πολύ σαν να λέει:
«Ποια απάντηση μοιάζει πιο πιθανή να έρχεται μετά από αυτό το prompt;»

Ένα reasoning LLM δουλεύει πιο πολύ σαν να λέει:
«Πριν απαντήσω, ας το σπάσω σε βήματα και ας ελέγξω λίγο καλύτερα τι βγαίνει.»

Σαν διαγώνισμα:

  • Το non-reasoning μοντέλο μοιάζει με μαθητή που διαβάζει την ερώτηση και απαντάει αμέσως με βάση το τι του φαίνεται σωστό.
  • Το reasoning μοντέλο μοιάζει με μαθητή που πρώτα κάνει πρόχειρο, χωρίζει το πρόβλημα σε βήματα, και μετά γράφει την τελική απάντηση.
.
.
.
.
.

Agents

  1. Stop copy pasting
  2. loop
  3. have a robust success criteria
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

Multi-modal: text, audio, images

Gemini_Generated_Image_u7bsheu7bsheu7bs