Optimiser la conception CAO grâce aux LLM

Improving CAD design visuals

Des composants de vélo aux drones, les produits modernes naissent tous sous la forme de modèles numériques 3D. Pourtant, la création de modèles de Conception Assistée par Ordinateur (CAO) demeure un processus lent et coûteux. Notre nouvelle approche, CADmium, repense l'automatisation de la conception 3D en entraînant un grand modèle de langage (LLM) capable de traduire le langage naturel en code de conception 3D. Cette méthode de CAO pilotée par le texte est simple à adopter, rapide à affiner et produit des formes 3D d'une grande précision.

Repenser l'approche « Texte-vers-CAO » comme du « Texte-vers-Code »

Un modèle CAO est une suite d'opérations transformant des esquisses planes (lignes, arcs, cercles) en volumes 3D, à la manière d'une recette de cuisine. Cette structure s'aligne parfaitement avec le fonctionnement des modèles de langage, à condition que le langage utilisé soit suffisamment spécifique pour éliminer toute ambiguïté géométrique. CADmium comble ce fossé en associant un pipeline d'annotation multimodal au fine-tuning (ajustement fin) d'un LLM dédié au code.

Au lieu d'inventer de nouvelles méthodes de traduction pour représenter les données 3D, comme des tokenizers personnalisés ou des représentations vectorielles sur mesure, nous traitons la CAO comme du code pur. Cela nous permet de tirer parti de Qwen2.5-Coder, un modèle éprouvé et optimisé pour suivre des instructions de programmation, garantissant ainsi une architecture simple, efficace et flexible.

Un entraînement haute fidélité : 176 000 descriptions de modèles CAO

Pour constituer un ensemble d'entraînement robuste, nous avons entièrement refondu le jeu de données DeepCAD, la référence du secteur.

Nous avons enrichi 176 017 modèles CAO en leur ajoutant des descriptions textuelles concises et quasi-humaines. Générés par GPT-4.1 à partir de rendus multi-vues et d'historiques de conception, ces prompts se lisent naturellement tout en conservant la spécificité géométrique nécessaire à une reconstruction sans équivoque (profils, contraintes, mesures).

Nous avons ensuite affiné Qwen2.5-Coder pour qu'il traduise ces descriptions en historiques CAO au format JSON minimaliste, le code étape par étape qui construit une pièce. En tant que modèle spécialisé dans le code, Qwen2.5-Coder excelle dans la gestion des formats structurés, des parenthèses et des dépendances à longue portée inhérentes à la modélisation 3D.

Garantir la précision géométrique et la viabilité fonctionnelle

Les métriques standards, telles que les distances de nuages de points (Chamfer distance), passent souvent à côté de défauts structurels critiques. Nous appliquons donc des métriques avancées, sensibles à la topologie, pour garantir la validité mathématique de chaque modèle généré. Nous utilisons la discrépance de sphéricité, la différence de courbure moyenne discrète, la correspondance exacte de la caractéristique d'Euler, ainsi que l'étanchéité du maillage (watertightness) pour évaluer la compacité, la courbure et la correction topologique.

Testé sur des prompts rédigés par des humains, CADmium a surpassé les modèles de référence spécialisés, tant en précision géométrique (lignes, cercles, extrusions) qu'en exactitude topologique. Nos tests démontrent que les LLM de code sont des générateurs de CAO très efficaces, les modèles les plus vastes fournissant les fichiers les plus fiables et précis.

Conçu pour une adaptation facile et le passage à l'échelle

Nous avons utilisé des protocoles d'entraînement standards (tels que LoRA et FSDP sur des GPU A100) pour permettre à n'importe quelle équipe d'adapter facilement CADmium à son domaine spécifique.

Afin de faciliter la réplication, le benchmarking et le développement futur, nous avons rendu publique notre stack complète : annotations, code d'entraînement, configurations de fine-tuning et checkpoints des modèles.

Liens