当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新专利“一种广度数据采集的方法及其系统”公布,可减少数据采集时网络资源消耗

7个月前 (04-02)Deepseek最新资讯584

国家知识产权局官网显示,4月1日,DeepSeek关联公司杭州深度求索人工智能基础技术研究有限公司申请的“一种广度数据采集的方法及其系统”专利公布。

摘要显示,本发明涉及数据采集领域,尤其涉及一种广度数据采集的方法及其系统,包括:建立网页元信息库;确定每日调度单元下载配额及当日下载总额度;从网页元信息库中选取相应数量的链接,分配下载额度;下载过程控制;下载文本进行后处理及数据清洗后进入回灌队列,通过信息回灌实现网页元信息库更新。本发明的有益效果在于:发现尽可能多的网页链接,并减少对网站的流量冲击;对已经下载的内容进行分析,对未下载的连接进行质量推断,通过择优下载分配额度的方式,减少低质量网页下载和重复下载,提高数据质量及下载效率,减少在数据采集过程中网络资源的消耗;采用单独的信息回灌队列,保证网页元信息库修改操作的原子性和稳定性。


“DeepSeek新专利“一种广度数据采集的方法及其系统”公布,可减少数据采集时网络资源消耗” 的相关文章

多家银行积极部署DeepSeek 涉及多个业务场景

多家银行积极部署DeepSeek 涉及多个业务场景

本报记者 彭妍    银行正加速DeepSeek系列模型本地化部署工作。据记者梳理,目前已有包括国有大行、股份制银行及头部城商行在内的多家银行启动DeepSeek系列模型的本地化部署,应用领域覆盖智能...

DeepSeek高校上线,智能“助教”为师生深度思考赋能

DeepSeek高校上线,智能“助教”为师生深度思考赋能

国产AI大模型DeepSeek(深度求索)的风,已经吹到了高校。近日,中国人民大学、北京师范大学、北京交通大学等多所高校发布消息,表示正在探索开展有关DeepSeek的实践应用,部分高校已在自主研发的...

医学博主自嘲“天塌了”:患者查询DeepSeek后“质疑”治疗方案,而且它是对的

医学博主自嘲“天塌了”:患者查询DeepSeek后“质疑”治疗方案,而且它是对的

昨(22)日,广东一名医学博主上网发帖称,自己为病人开出治疗方案,对方查询DeepSeek后称有问题,自己“气得又查了一遍医学指南”,结果发现医学指南更新了,自嘲感觉“天塌了”。DeepSeek真的这...

盛视科技:已完成DeepSeek大模型的接入

盛视科技:已完成DeepSeek大模型的接入

金融界4月10日消息,有投资者在互动平台向盛视科技提问:请问公司是否考虑接入deepseek系统或者与其公司进行合作?公司回答表示:公司已完成 DeepSeek 大模型的接入。公司接入DeepSeek...

公元:DeepSeek只打开一扇门,大模型远没到终局

公元:DeepSeek只打开一扇门,大模型远没到终局

谁会先迈出下一只脚?DeepSeek如何改变中国AI投资?具身智能距离清晰商业化还要多久?这些热门话题吸引了众多资深投资人热烈讨论。在 “第19届中国投资年会·年度峰会”上,投中网主编曹玮钰与红杉中国...

辽宁省高校“昇腾AI+DeepSeek:重构高校教育科技生态”研讨会在沈阳成功举办

辽宁省高校“昇腾AI+DeepSeek:重构高校教育科技生态”研讨会在沈阳成功举办

近日,辽宁省高校“昇腾AI+DeepSeek:重构高校教育科技生态”研讨会在沈阳成功举办。本次会议以“AI赋能教育教学”为主题,探讨“昇腾AI重构高校教育科技生态”,探索新时代高校数智化发展新模式,推...