金融界 2024 年 7 月 12 日消息,天眼查知识产权信息显示,杭州光云科技股份有限公司取得一项名为“基于深度神经网络的训练集快速分析方法及电子设备“,授权公告号 CN117763360B,申请日期为 2024 年 2 月。
专利摘要开元体育网站 开元登录入口显示,本申请公开了一种基于深度神经网络的训练集快速分析方法及电子设备,包括:采用预训练语言模型对训练集进行训练得到文本特征向量提取器与文本意图分类器;根据文本意图分类器对训练集进行意图预测得到若干对混淆意图对;文本特征向量提取器分别生成若干对混淆意图对的 256 维特征向量并降维为 2 维特征向量;将 2 维特征向量制作散点分布图并均匀等分划分为若干簇;抽取若干簇内一定比例样本进行清洗实现训练集快速分析,本方法将意图间存在数据混淆的情况的数据收集整理,并且只通过具有代表性的一定比例样本的清洗就可以完成整个训练集的清洗,可以节省人力物力,提高工作效率,并且清洗后的训练集的准确性高。