当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新专利“一种广度数据采集的方法及其系统”公布,可减少数据采集时网络资源消耗

国家知识产权局官网显示,4月1日,DeepSeek关联公司杭州深度求索人工智能基础技术研究有限公司申请的“一种广度数据采集的方法及其系统”专利公布。

摘要显示,本发明涉及数据采集领域,尤其涉及一种广度数据采集的方法及其系统,包括:建立网页元信息库;确定每日调度单元下载配额及当日下载总额度;从网页元信息库中选取相应数量的链接,分配下载额度;下载过程控制;下载文本进行后处理及数据清洗后进入回灌队列,通过信息回灌实现网页元信息库更新。本发明的有益效果在于:发现尽可能多的网页链接,并减少对网站的流量冲击;对已经下载的内容进行分析,对未下载的连接进行质量推断,通过择优下载分配额度的方式,减少低质量网页下载和重复下载,提高数据质量及下载效率,减少在数据采集过程中网络资源的消耗;采用单独的信息回灌队列,保证网页元信息库修改操作的原子性和稳定性。


“DeepSeek新专利“一种广度数据采集的方法及其系统”公布,可减少数据采集时网络资源消耗” 的相关文章

让deepseek写文章的技巧?如何使用deepseek写作?deepseek可以做海报吗?

让deepseek写文章的技巧?如何使用deepseek写作?deepseek可以做海报吗?

一、让DeepSeek写文章的技巧精准角色设定复制代码“请扮演《经济学人》专栏作家,分析全球碳中和政策对制造业的影响,要求:学术严谨但避免术语堆砌,引用至少2个2025年最新案例。”结构化框架引导复制...

腾讯:微信接入DeepSeek不使用用户信息和隐私,仅整合公众号等公开信息

腾讯:微信接入DeepSeek不使用用户信息和隐私,仅整合公众号等公开信息

微信回应灰度测试接入DeepSeek。2月16日,澎湃新闻记者获悉,微信搜一搜在调用混元大模型丰富AI搜索的同时,近日正式灰度测试接入DeepSeek。被灰度到的用户,可在对话框顶部搜索入口,看到“A...

德州数字水网牵手DeepSeek,迈向智能水网新篇章

德州数字水网牵手DeepSeek,迈向智能水网新篇章

大众网记者 武红鹏 通讯员 李巍伦 德州报道近日,德州数字孪生水网“智水德州”平台成功接入DeepSeek,通过部署德州水利个性化知识库,为复杂水网调度注入了全新的智能化元素,通过DeepSeek的A...

DeepSeek怎么用?deepseek网页版、微信小程序、APP使用指南

DeepSeek怎么用?deepseek网页版、微信小程序、APP使用指南

人工智能DeepSeek是由杭州深度求索公司研发的大型AI模型,有DeepSeek-v3 和R1两种型号。就像一个知识渊博的万事通,凭借强大的功能和出色的表现,可以说是火遍全球。它有超强的逻辑推理和复...

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。据了解,MLA(多头潜在注意力机制)正是D...

科大讯飞:公司与DeepSeek无直接或间接股权关系

科大讯飞:公司与DeepSeek无直接或间接股权关系

科大讯飞在互动平台上表示,目前公司与DeepSeek无直接或间接股权关系。(本文来自第一财经)...