说明:收录90万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211159655.4 (22)申请日 2022.09.22 (71)申请人 贝壳找房 (北京) 科技有限公司 地址 100085 北京市海淀区创业路2号1幢1 层102室 (72)发明人 冉旭欣  (74)专利代理 机构 北京庚致知识产权代理事务 所(特殊普通 合伙) 11807 专利代理师 韩德凯 李伟波 (51)Int.Cl. H04L 9/40(2022.01) (54)发明名称 防抓站的方法、 电子设备、 存储介质及计算 机程序产品 (57)摘要 本公开提供了一种防抓站的方法, 包括: 根 据用于表征访问请求中地址信息的地址哈希值, 在对应于地址哈希值的红黑树中确定针对地址 信息的过滤规则; 根据用于表征访问请求中域名 信息的域名哈希值, 在对应于域名哈希值的双向 链表中获取域名信息的存储位; 以及在过滤规则 中筛选出存储位对应的应对指令。 本公开还提供 一种电子设备、 可读存储介质及计算机程序产 品。 权利要求书2页 说明书10页 附图2页 CN 115514565 A 2022.12.23 CN 115514565 A 1.一种防抓站的方法, 其特 征在于, 包括: 根据用于表征访问请求中地址信 息的地址哈希值, 在对应于所述地址哈希值的红黑树 中确定针对所述 地址信息的过 滤规则; 根据用于表征所述访问请求中域名信 息的域名哈希值, 在对应于所述域名哈希值的双 向链表中获取 所述域名信息的存 储位; 以及 在所述过 滤规则中筛 选出所述存储位对应的应对指令 。 2.根据权利要求1所述的防抓站的方法, 其特征在于, 所述根据用于表征访问请求中地 址信息的地址哈希值, 在对应于所述地址哈希值的红黑树中确定针对所述地址信息的过滤 规则, 包括: 对用于表征访问请求中地址信 息的地址哈希值进行特征值计算, 获取对应于所述地址 哈希值的地址特 征; 根据所述地址特征, 确定所述地址信息对应的第一元素, 其中所述第一元素中包含适 用于所述 地址信息的过 滤规则; 以及 基于所述地址哈希值, 遍历所述第一元素中所述红黑树的各个过滤规则, 筛选出适应 于所述地址信息的过 滤规则。 3.根据权利要求1所述的防抓站的方法, 其特征在于, 所述根据用于表征所述访问请求 中域名信息的域名哈希值, 在 对应于所述域名哈希值的双向链表中获取所述域名信息的存 储位, 包括: 对用于表征所述访问请求中域名信 息的域名哈希值进行特征值计算, 获取对应于所述 域名信息的域名特 征; 根据所述域名特征, 确定所述域名特征对应的第二元素, 其中所述第二元素中具有对 应于所述 域名特征的存储位; 以及 基于所述域名哈希值, 遍历所述第二元素中所述双 向链表的各个存储位, 筛选出对应 于所述域名特征的存储位。 4.根据权利要求1所述的防抓站的方法, 其特征在于, 在所述根据用于表征访问请求中 地址信息的地址哈希值, 在 对应于所述地址哈希 值的红黑树中确定针对所述地址信息的过 滤规则之前, 还 包括: 对所述访问请求中的地址信 息进行哈希运算, 获取用于表征访问请求中地址信 息的地 址哈希值。 5.根据权利要求1所述的防抓站的方法, 其特征在于, 在所述根据用于表征访问请求中 地址信息的地址哈希值, 在 对应于所述地址哈希 值的红黑树中确定针对所述地址信息的过 滤规则之前, 还 包括: 响应于更新时间, 分别触发多个定时器对各个元 素中红黑 树的过期规则进行删除。 6.根据权利要求5所述的防抓站 的方法, 其特征在于, 所述响应于更新时间, 分别触发 多个子进程对各个元 素中红黑 树的过期规则进行删除, 包括: 根据子进程的数量和所述元素的数量, 确定各个所述子进程所匹配的多个目标元素; 以及 响应于所述更新 时间, 分别触发各个子进程根据 所述目标元素的红黑树中各个过滤规 则的过期时间, 删除所述过期时间超过目标时间的过期规则。权 利 要 求 书 1/2 页 2 CN 115514565 A 27.根据权利要求1所述的防抓站的方法, 其特征在于, 在所述根据用于表征访问请求中 地址信息的地址哈希值, 在 对应于所述地址哈希 值的红黑树中确定针对所述地址信息的过 滤规则之前, 包括: 构建多个元 素, 包括: 在各个所述元 素中分别构建红黑 树和双向链 表; 计算各个所述过 滤规则的规则哈希值; 根据所述 规则哈希值, 求取 所述过滤规则的规则特 征; 根据所述 规则特征, 将各个所述过 滤规则分配至对应的元 素; 根据所述过滤规则的过期时间, 将处于同一所述元素中的所述过滤规则依序存储至所 述红黑树中; 可选地, 在所述根据用于表征所述访 问请求中域名信息的域名哈希值, 在对应于所述 域名哈希值的双向链 表中获取 所述域名信息的存 储位之前, 包括: 对所述访问请求中的域名信 息进行哈希运算, 获取用于表征访问请求中域名信 息的域 名哈希值; 可选地, 在所述过 滤规则中筛 选出所述存储位对应的应对指令之后, 包括: 响应于执行惩罚措施的所述应对指令, 阻止所述访 问请求的请求主体的抓站操作; 以 及 响应于允许访问的所述应对指令, 允许 所述请求主体的抓站操作。 8.一种电子设备, 其特征在于, 包括存储器、 处理器及存储在存储器上并可在处理器上 运行的计算机程序, 所述处理器执行所述程序时, 以实现如权利要求1至7中任一项所述的 防抓站的方法。 9.一种可读存储介质, 其特征在于, 所述可读存储介质存储有计算机程序, 所述计算机 程序适于处 理器进行加载, 以执 行如权利要求1至7中任一项所述的防抓站的方法。 10.一种计算机程序产品, 包括计算机程序/指令, 其特征在于, 所述计算机程序/指令 被处理器执行时实现权利要求1至7中任一项所述的防抓站的方法。权 利 要 求 书 2/2 页 3 CN 115514565 A 3

.PDF文档 专利 防抓站的方法、电子设备、存储介质及计算机程序产品

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 防抓站的方法、电子设备、存储介质及计算机程序产品 第 1 页 专利 防抓站的方法、电子设备、存储介质及计算机程序产品 第 2 页 专利 防抓站的方法、电子设备、存储介质及计算机程序产品 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 16:44:09上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。