MIT团队开源GenCAD:一图生成完整CAD模型与参数化程序

2026年5月21日

87

881

MIT团队开源GenCAD:一图生成完整CAD模型与参数化程序

在数字化设计与制造领域,如何将二维图像快速转化为可编辑的三维CAD模型一直是工程师面临的挑战。传统方式需要依赖手工建模,耗时且难以保证精度。近日,麻省理工学院研究团队发布了GenCAD系统,首次实现了从单张图片直接生成完整参数化CAD模型与程序的能力,这一突破有望革新自动化设计流程。

技术架构解析

GenCAD的核心创新在于其独特的架构设计。与以往仅输出3D网格或点云的生成模型不同,该系统能够同时生成可编辑的3D实体模型和完整的CAD命令序列。这意味着用户获得的不仅是几何形状,更是可直接在建模软件中执行的参数化程序,可随时调整尺寸、比例等参数。

实际应用价值

GenCAD的架构包含四个核心步骤:首先,自回归Transformer编码器负责学习CAD命令序列的潜在表示;其次,基于对比学习的模型建立CAD命令序列与图片之间的联合表征空间;第三,潜在扩散模型在图片条件约束下生成CAD命令序列的潜在表示;最后,解码器将这些潜在表示转换为具体的参数化CAD命令。这一架构的创新之处在于它直接学习CAD程序层面的表征,而不仅仅是几何外观。

科技改变生活

“Pimjolabs”
🦞

JimoClaw — 桌面 AI Agent 工作台

让 AI 处理本地资料、操控浏览器,最终交付可直接使用的文档、表格与 PPT,而不只是一段回答。

下载桌面版

技术发展展望

在工业场景中,GenCAD展现出显著的应用潜力。在逆向工程场景中,工程师手中有产品实物或渲染图时,可快速重建出可参数化修改的CAD模型,将原本数小时甚至数天的工作缩短至分钟级别。在设计空间探索场景中,设计师可以输入一个设计概念图,快速生成多种变体方案来评估不同设计的优劣。此外,系统能够并行生成多个候选结果供选择,解决了传统生成模型输出不确定、不可控的问题。

开源与获取

从技术发展角度看,GenCAD代表了生成式AI的一个重要方向:正在从「生成图片/视频」向「生成可执行程序/模型」演进。代码生成模型已经在软件开发领域产生了深远影响,而CAD程序生成的价值链条更长——它直接影响制造、采购和供应链环节。一个能够读图并输出参数化CAD模型的AI系统,实际上是在缩短从设计意图到物理产品之间的转化路径。

🛡️

积墨 AI 安全隐患巡检系统

任务一键下达 · 隐患 AI 识别 · 整改全程留痕 · 报告一键生成。让安全巡检真正看得见、管得住、能闭环。

了解方案

如有侵权,请联系删除。

Related Articles

联系我们 免费试用
小墨 AI