Этот проект реализует zero-shot классификацию изображений, используя модель Open CLIP. Функциональность разделена на два модуля:
-
embedding_extractor.py
Модуль для извлечения эмбеддингов из изображений. Скрипт проходит по датасету, извлекает эмбеддинги для каждого изображения и сохраняет их в файл (pickle). -
zero_shot_evaluator.py
Модуль для оценки модели на основе извлечённых эмбеддингов. Скрипт выполняет разделение датасета на train/test, вычисляет центроиды классов, проводит zero-shot оценку и визуализирует результаты.
Убедитесь, что у вас установлены все необходимые библиотеки. Список зависимостей приведён в файле requirements.txt.
- Клонируйте репозиторий или скачайте исходные файлы.
- Создайте и активируйте виртуальное окружение (рекомендуется):
python -m venv venv source venv/bin/activate # Для Linux/macOS venv\Scripts\activate # Для Windows
- Установите зависимости:
pip install -r requirements.txt