本报讯 11月11日,记者从国家知识产权局信息显示,湖南省建筑设计院集团股份有限公司申请一项名为“自动获取用于多模态图像生成模型的专业类数据集的方法”的专利,公开号CN118918411A,申请日期为2024年7月。
专利摘要显示,本发明公开了一种自动获取用于多模态图像生成模型的专业类数据集的方法,包括获得该专业的原始图像数据集;按照分辨率和长宽比例要求对原始图像数据集中的图像进行筛选和调整,得到第二图像数据集;对第二图像数据集中的图像进行分类,得到所需类别的第一图像子数据集;将该专业的结构化描述文档输入第一多模态大语言模型,对所需类别的第一图像子数据集中的图像进行质量评价,剔除不符合图像质量评价标准的图像,得到第二图像子数据集;将改专业的标注公式范例输入第二多模态大语言模型,对第二图像子数据集中的图像进行特征标注,得到包含图像及其对应标注公式的图文对子数据集。本申请可以自动生成用于多模态图像生成模型的各种专业类数据集。(王智聪)
官方公众号
官方视频号
官方微博号
官方百家号
官方抖音号