中华建筑报网
首页>电子报> 正文

上海建工发布 行业首个百亿字符 知识增强对话大模型

2023-11-07 09:40:48来源:中华建设网作者:钟 和责任编辑:xmt01

  本报讯 由上海建工四建集团建筑人工智能研究室自主研发的建筑行业首个百亿字符知识增强对话大模型Construction-GPT(Beta版)于近日上线,预计今年年内开放建筑专业词嵌入、非结构化文件解析等相关API接口供行业使用。

  Construction-GPT包含规范标准智能问答与查新、工程图集详图智能搜索、内控技术文件智能查询、私有知识库智能构建4项主要功能,技术人员通过对话问答方式,只需5—10秒就能够检索到需要的建筑工程技术资料,即使身处工地现场,也有“行业专家”随行。

  千亿级别模型参数,打造行业首个百亿字符知识增强对话大模型。上海建工四建集团研发团队利用自主研发的建筑专业词嵌入模型、半监督微调、大模型价值对齐3项关键技术,实现了5000多本规范标准、1000多份工程图集、150多份企业内部技术文件的智能解析。与传统人工检索方式相比,技术人员能够一次性快速获得多本技术资料中的相关信息,节省了大量时间。和通用大模型相比,Construction-GPT不依赖互联网知识库,同时加载了敏感词过滤算法,为工程技术问题提供更专业、更科学、更合理的解答。

  高效的模型推理能力,让回答无杜撰、可追溯、易查询。AIDAC数据吞吐加速技术的采用,提高了Construction-GPT模型的推理速度,在无网络延迟测试下,回答仅需5—10秒。Construction-GPT还打破了以往通用大模型的“谣言机制”,避免了答非所问、信息杜撰的情况出现。技术人员能够精确选择大模型索引知识库范围,为每个回答提供准确信息和索引资料来源,一键打开索引资料链接,就可以继续深度查询和检索。

  支持私有知识库建立,打造个人专属智能知识系统。除了规范标准、工程图集、公司内部技术文件等公共技术资料外,技术人员往往还需要根据个人存储资料开展相关检索。为此,研发团队自主研发了多模态数据解析算法,技术人员只需要一键上传文件,Construction-GPT就可以自动解析24种文档、图纸、音频格式文件,建立个人专属知识空间,打造个人专属智能知识检索系统。

  规范标准一键查新,更多实验室功能辅助项目办公。建筑行业涉及规范标准数量庞大,更新速度快,技术人员常常难以了解规范标准最新修编情况。研发团队特别建立了规范标准动态数据库,利用近似字符串最优匹配算法,开发了规范标准智能查新功能模块,技术人员一键复制粘贴,就可以快速生成最新结果。今后,Construction-GPT还将上线更多实验室功能模块,助力技术人员的高效办公。

  为了方便技术人员随时随地检索技术资料,研发团队同步开发了Construction-GPT小程序端。在同一账号下,小程序端与平台网页端可以实时同步历史问答对话内容,并支持语音输入,方便身处工地现场的技术人员使用。(钟 和)

微信扫一扫,分享给朋友