Configuration COCOON pour 2 H100

Ce guide vous aide à configurer vos 2 GPU H100 pour participer au pool GPU COCOON.

📋 Prérequis

Selon la documentation COCOON, vous avez besoin de:

Linux avec kernel 6.16+ (pour support TDX complet)
CPU Intel avec support TDX
GPU NVIDIA H100+ avec support CC (Confidential Computing)
QEMU 10.1+ avec support TDX

Vos 2 H100 détectés:

GPU 0: 0000:01:00.0
GPU 1: 0000:02:00.0

🚀 Installation Rapide

1. Vérifier les prérequis

chmod +x check-prerequisites.sh
./check-prerequisites.sh

2. Télécharger la distribution COCOON

wget https://ci.cocoon.org/cocoon-worker-release-latest.tar.xz
tar xzf cocoon-worker-release-latest.tar.xz
cd cocoon-worker

3. Préparer le matériel

Avant de commencer, vous devez:

Activer Intel TDX - Suivez le guide: Enabling Intel TDX
Activer CC sur GPU NVIDIA - Vous devrez peut-être mettre à jour le VBIOS pour que l'attestation GPU fonctionne complètement
Préparer le GPU pour VFIO - Utilisez le script ./scripts/setup-gpu-vfio si disponible

4. Configuration automatique

# Depuis le répertoire cocoon-worker
chmod +x ../setup-h100.sh
../setup-h100.sh

Cela créera:

worker-0.conf - Configuration pour le premier H100
worker-1.conf - Configuration pour le deuxième H100

5. Éditer les fichiers de configuration

Éditez worker-0.conf et worker-1.conf avec vos informations:

Paramètres requis:

# Votre adresse wallet TON (reçoit les paiements)
owner_address = EQD...votre_adresse_ton...

# Clé privée pour le wallet de revenus (générer avec: openssl rand -base64 32)
node_wallet_key = votre_clé_base64_ici

# Token Hugging Face (obtenir sur https://huggingface.co/settings/tokens)
hf_token = hf_votre_token_ici

# Adresse du contrat root COCOON (dans worker.conf.example de la distribution)
root_contract_address = EQD...adresse_du_contrat...

Les GPUs sont déjà configurés:

Worker 0: 0000:01:00.0
Worker 1: 0000:02:00.0

6. Démarrer seal-server

IMPORTANT: seal-server doit être lancé avant les workers. Il fournit la dérivation sécurisée des clés pour l'environnement TDX.

# Dans un terminal séparé, gardez-le en cours d'exécution
./bin/seal-server --enclave-path ./bin/enclave.signed.so

Note: Vous devez utiliser le fichier enclave.signed.so inclus dans la distribution. Un seul seal-server peut servir plusieurs workers.

7. Lancer les workers

chmod +x ../launch-workers.sh
../launch-workers.sh

Le script vous demandera le mode:

Production - Mode production (nécessite seal-server)
Test (real TON) - Mode test avec shell debug, TON réel
Test (fake TON) - Mode test avec shell debug, TON simulé

📊 Monitoring

Statistiques HTTP

# Worker 0
curl http://localhost:12000/stats
curl http://localhost:12000/jsonstats

# Worker 1
curl http://localhost:12010/stats
curl http://localhost:12010/jsonstats

Health Client

Si disponible dans la distribution:

# Statut des workers
./health-client --instance worker status

# Métriques système
./health-client -i worker sys

# Métriques GPU
./health-client -i worker gpu

# Logs
./health-client -i worker logs cocoon-vllm 100

Logs

# Suivre les logs en temps réel
tail -f logs/worker-0.log
tail -f logs/worker-1.log

🛑 Arrêter les workers

chmod +x ../stop-workers.sh
../stop-workers.sh

Ou manuellement:

# Si vous avez les PIDs sauvegardés
kill $(cat logs/worker-0.pid)
kill $(cat logs/worker-1.pid)

🔧 Configuration Avancée

Options de configuration

Chaque worker peut être configuré avec:

worker_coefficient - Coefficient de prix (1000 = 1.0x, valeurs plus élevées = prix plus élevés)
model - Modèle AI à servir (par défaut: Qwen/Qwen3-0.6B)
persistent - Chemin de l'image disque persistante

Lancer avec options en ligne de commande

# Override des options
./scripts/cocoon-launch --instance 0 --worker-coefficient 2000 --model Qwen/Qwen3-0.6B worker-0.conf

Ports et CIDs

Chaque instance obtient automatiquement:

Ports uniques: 12000, 12010, 12020, ...
CIDs uniques: 6, 16, 26, ...
Stockage persistant séparé

📚 Documentation

⚠️ Notes Importantes

seal-server est obligatoire pour la production. Sans lui, les workers échoueront à l'initialisation.
enclave.signed.so doit être celui de la distribution officielle.
TDX doit être activé dans le BIOS/UEFI et le kernel Linux.
VBIOS GPU peut nécessiter une mise à jour pour l'attestation complète.
Gardez vos clés privées secrètes - node_wallet_key doit rester confidentiel.

🆘 Dépannage

Vérifier que seal-server tourne

pgrep -f seal-server

Vérifier les processus workers

ps aux | grep cocoon-launch

Vérifier les ports

netstat -tlnp | grep -E "12000|12010"

Logs d'erreur

Consultez les logs dans logs/worker-*.log pour diagnostiquer les problèmes.

📞 Support

Pour plus d'aide:

Documentation: https://cocoon.org/gpu-owners
GitHub: https://github.com/cocoon-org
Telegram: (voir site web)

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
.gitignore		.gitignore
COMPILER-QEMU-MANUEL.md		COMPILER-QEMU-MANUEL.md
CONFIGURATION-COMPLETE.md		CONFIGURATION-COMPLETE.md
ETAPES-RESTANTES.md		ETAPES-RESTANTES.md
FINAL-SETUP.md		FINAL-SETUP.md
FINALISER-INSTALLATION.md		FINALISER-INSTALLATION.md
GUIDE-DEMARRAGE.md		GUIDE-DEMARRAGE.md
INSTALL-QEMU.md		INSTALL-QEMU.md
LANCEMENT-RAPIDE.md		LANCEMENT-RAPIDE.md
PROBLEME-CPU-AMD.md		PROBLEME-CPU-AMD.md
PROBLEME-QEMU-TDX.md		PROBLEME-QEMU-TDX.md
PROBLEME-TDX-KVM.md		PROBLEME-TDX-KVM.md
README.md		README.md
RESUME-FINAL.md		RESUME-FINAL.md
check-compilation.sh		check-compilation.sh
check-prerequisites.sh		check-prerequisites.sh
compile-qemu-tdx.sh		compile-qemu-tdx.sh
generate-keys.sh		generate-keys.sh
install-and-launch.sh		install-and-launch.sh
launch-workers.sh		launch-workers.sh
monitor-compilation.sh		monitor-compilation.sh
setup-complete.sh		setup-complete.sh
setup-h100.sh		setup-h100.sh
status-workers.sh		status-workers.sh
stop-workers.sh		stop-workers.sh
verify-config.sh		verify-config.sh
worker.conf.example		worker.conf.example
worker.conf.template		worker.conf.template

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Configuration COCOON pour 2 H100

📋 Prérequis

🚀 Installation Rapide

1. Vérifier les prérequis

2. Télécharger la distribution COCOON

3. Préparer le matériel

4. Configuration automatique

5. Éditer les fichiers de configuration

6. Démarrer seal-server

7. Lancer les workers

📊 Monitoring

Statistiques HTTP

Health Client

Logs

🛑 Arrêter les workers

🔧 Configuration Avancée

Options de configuration

Lancer avec options en ligne de commande

Ports et CIDs

📚 Documentation

⚠️ Notes Importantes

🆘 Dépannage

Vérifier que seal-server tourne

Vérifier les processus workers

Vérifier les ports

Logs d'erreur

📞 Support

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Configuration COCOON pour 2 H100

📋 Prérequis

🚀 Installation Rapide

1. Vérifier les prérequis

2. Télécharger la distribution COCOON

3. Préparer le matériel

4. Configuration automatique

5. Éditer les fichiers de configuration

6. Démarrer seal-server

7. Lancer les workers

📊 Monitoring

Statistiques HTTP

Health Client

Logs

🛑 Arrêter les workers

🔧 Configuration Avancée

Options de configuration

Lancer avec options en ligne de commande

Ports et CIDs

📚 Documentation

⚠️ Notes Importantes

🆘 Dépannage

Vérifier que seal-server tourne

Vérifier les processus workers

Vérifier les ports

Logs d'erreur

📞 Support

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages