浙江数新申请基于机器学习和 ES 词云统计的智能化词云展示方法及系统专利,利用 ES 快速处理海量文本数据

金融界 2025 年 4 月 29 日消息,国家知识产权局信息显示,浙江数新网络有限公司申请一项名为“一种基于机器学习和 ES 词云统计的智能化词云展示方法及系统”的专利,公开号 CN119884362A,申请日期为 2025 年 3 月。

专利摘要显示,本发明公开一种基于机器学习和 ES 词云统计的智能化词云展示方法,属于词云生成技术领域;该方法包括:获取待处理文本数据;预处理得到预处理后文本数据;特征提取得到关键词;统计得到词频;统计得到逆文档频率;根据词频和逆文档频率,得到基础权重;根据关键词的上下文,得到调整因子;根据基础权重和调整因子,得到权重;生成词云。本发明利用 ES 强大的文本检索和分析能力,快速的对海量文本数据进行词频统计、情感分析、主题分类等处理,对文本进行快速分析和处理。从而实现对文本内容的全面分析和可视化呈现,提高词云展示的表现力和可解释性,为用户提供更加智能化、高效和简易的文本可视化工具。

天眼查资料显示,浙江数新网络有限公司,成立于2020年,位于杭州市,是一家以从事互联网和相关服务为主的企业。企业注册资本4800万人民币。通过天眼查大数据分析,浙江数新网络有限公司共对外投资了1家企业,参与招投标项目36次,财产线索方面有商标信息17条,专利信息49条,此外企业还拥有行政许可1个。

打开APP阅读更多精彩内容