Project Oxygen & Ideo-LabIDEO LAB Dashboard 2026

Fine-Tuning & Adaptation

Adapter un LLM via adapters/LoRA/QLoRA, instruction tuning (SFT) ou préférences (RLHF/RLAIF) — avec données maîtrisées, évaluation rigoureuse et déploiement optimisé.

Adapters / LoRA / QLoRA Instruction Tuning (SFT) RLHF / RLAIF (DPO/ORPO) Données & pipeline Évaluation avant/après Serving (vLLM / TensorRT-LLM)