金融界 2025 年 4 月 10 日消息,国家知识产权局信息显示,河南众诚信息科技股份有限公司申请一项名为“一种基于微调嵌入模型的 RAG 检索流程优化方法及系统”的专利,公开号 CN 119782497 A,申请日期为 2024 年 11 月。
专利摘要显示,本申请涉及自然语言处理技术领域,具体涉及一种基于微调嵌入模型的 RAG 检索流程优化方法及系统,该方法包括:确定各长文本文档内每种主题的主题表达分布度;采用滑动窗口算法基于每种文本分割主题的主题强度序列,获取每种文本分割主题的所有窗口序列,并基于各窗口序列中前一半元素与后一半元素之间平均分布情况的差异,确定每种文本分割主题的各窗口序列的主题突变度,以得到所有种文本分割主题下的短文本;确定每个短文本的文本主题集中度,并结合大语言模型对 RAG 检索流程进行优化。本申请通过分析不同主题在长文本文档的主题表达分布情况,提高文本分割的质量。
天眼查资料显示,河南众诚信息科技股份有限公司,成立于2005年,位于郑州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本9399.5万人民币,实缴资本5869.11万人民币。通过天眼查大数据分析,河南众诚信息科技股份有限公司共对外投资了7家企业,参与招投标项目910次,财产线索方面有商标信息23条,专利信息36条,此外企业还拥有行政许可5个。