张荷花


清华大学软件学院系统所

最新成果


“图智”-PDF工程图AI识别与审查重建系统

1.问题和需求

工程图纸是一类重要的非结构化数据,承载了丰富的业务知识和信息。目前,PDF工程图在工程建设行业仍是一种普遍的形式,带签章的PDF电子图纸也是目前唯一具有法定效力的图纸形态。PDF图纸本身具有确定性、不易篡改性等特点。然而,PDF工程图因其复杂性和专业性,难以被机器直接处理,目前主要还是靠人来读取、理解、核对和应用。机器不能识别和理解工程图,也就不能提取和应用图纸所承载的领域知识,限制了知识密集行业领域的深层次智能化发展。

若机器能够像人类一样理解图纸的内涵,就可以支撑丰富多彩的下游智慧应用,如规范智能审查、3D模型智能重建、面向应急逃生、无障碍等特定应用场景的信息智能提取等。这些基于图纸的智慧应用,其核心挑战就是对图纸内容的有效识别和理解。

2. 解决方案

清华大学软件学院规范审查课题组,基于在人工智能、深度学习、智能审查、可信软件等方面的多年科研成果积累,于2022年1月推出“图智”-PDF工程图AI识别与审查重建系统(https://tuzhi.ai);目前已开放部分功能试用。

产品彩页在线预览 产品彩页PDF下载

该系统基于深度学习技术和工程领域业务知识应用的有效融合,解决了现实PDF工程图纸高分辨率、高密度、图元信息相互遮挡等识别难题,实现了对建筑平面图图元和空间布局的智能识别和结构化表达。主要特点如下:

1) 广泛适用于住宅建筑、公共建筑等民用建筑以及仓库、厂房等工业建筑;

2) 支持建筑设计说明、表格、建筑平面图的一键式AI识别;

3) 对于识别后的图纸数据,实现了Revit模型一键生成和面向《建筑设计防火规范》的一键审查。

4) 审查功能支持对现有防火条文、其他国家规范、企业规范的规则增删改和自定义,系统审查算法可自动适配更新。

PDF图纸识别和审核结果可视化界面

3. 技术特点优势

1)相对于面向CAD图纸的识别技术方法,能够有效支持更广泛存在的PDF像素类工程图,打破了应用对象上的局限性;

2)在PDF像素图识别方面,能有效应对真实PDF工程图的规模、复杂度、遮挡性等问题,无需用户干预、预处理,即可实现一键识别;

3)在复杂空间识别、倾斜构件识别、图元关系计算算法等方面,具有技术优势;

4)在AI识别结果的下游应用支撑方面,依托课题组自主研发并已纳入国家标准(GB/T 36456.3-2018)的工程领域规范描述语言SNL、已在政府级BIM审查平台广泛应用的规范审查引擎,形成了体系性的下游应用支撑,能够快速扩展对各类国家规范、企业规范的数字化表达和智能审查等内容。

4. 智慧应用场景

AI审图:图纸AI识别结果,可用于构建面向各类规范条文的AI审图服务。无论是针对设计院、业主还是审图单位,AI审图服务能够在无需用户手工操作的情况下,自动给出AI审图的结果,实现机器辅助人类审查、审查经验知识积累固化等效果;通过人防和技防相结合,帮助减少问题缺陷,促进行业提质增效和高质量发展。

室内矢量模型重建:随着城市数字孪生的提出和各城市CIM数字底座构建的新需求,有效、高效、低成本获取各类建筑的室内矢量模型成为了一个重要问题。“图智”系统的PDF图纸AI识别(尤其是空间识别能力)和3D矢量模型生成技术,是解决该问题的一个新思路。未来有望实现批量、自动化、低成本的既有建筑3D模型生成,与其他重建技术相结合,取长补短,为CIM数字底座构建、公共安全应用、建筑智能运维等各类场景提供空间数据支撑。

图纸特定信息的智能提取:工程图的AI识别结果,作为基础数据,可面向特定应用场景如消防逃生、应急、安全、无障碍等提供“核心关注”信息高亮、提示、报警等内容,为现有各类智能平台中的“最后一公里”即“调出图纸,人工查看”,升级为基于AI识图结果的关键要素展现和融合应用,实现对关键紧急情况下的快速智能辅助作用和决策支持。

更多应用:PDF图纸识别技术和成果具有“撬动式”作用,在该成果基础上,大量被存档但未被充分挖掘应用的各类PDF图纸,将有望新价值,支撑未来更多、更丰富多彩的创新性智慧应用。

5. 合作需求

欢迎但不限于,与具有AI审图、室内矢量模型重建、图纸特定信息智能提取及其它基于图纸的智能应用场景需求的合作方,开展系统应用推广,提供核心技术支撑。

也欢迎其它内容形式上的合作。

联系方式:张荷花老师

zhanghehua@tsinghua.edu.cn