本報訊 11月11日,記者從國家知識產(chǎn)權局信息顯示,湖南省建筑設計院集團股份有限公司申請一項名為“自動(dòng)獲取用于多模態(tài)圖像生成模型的專(zhuān)業(yè)類(lèi)數據集的方法”的專(zhuān)利,公開(kāi)號CN118918411A,申請日期為2024年7月。
專(zhuān)利摘要顯示,本發(fā)明公開(kāi)了一種自動(dòng)獲取用于多模態(tài)圖像生成模型的專(zhuān)業(yè)類(lèi)數據集的方法,包括獲得該專(zhuān)業(yè)的原始圖像數據集;按照分辨率和長(cháng)寬比例要求對原始圖像數據集中的圖像進(jìn)行篩選和調整,得到第二圖像數據集;對第二圖像數據集中的圖像進(jìn)行分類(lèi),得到所需類(lèi)別的第一圖像子數據集;將該專(zhuān)業(yè)的結構化描述文檔輸入第一多模態(tài)大語(yǔ)言模型,對所需類(lèi)別的第一圖像子數據集中的圖像進(jìn)行質(zhì)量評價(jià),剔除不符合圖像質(zhì)量評價(jià)標準的圖像,得到第二圖像子數據集;將改專(zhuān)業(yè)的標注公式范例輸入第二多模態(tài)大語(yǔ)言模型,對第二圖像子數據集中的圖像進(jìn)行特征標注,得到包含圖像及其對應標注公式的圖文對子數據集。本申請可以自動(dòng)生成用于多模態(tài)圖像生成模型的各種專(zhuān)業(yè)類(lèi)數據集。(王智聰)