楼主: venomtian
跳转到指定楼层
上一主题 下一主题
收起左侧

用SAS抓取网页简易版

🔗
EroicaCMCS 2014-5-21 23:13:54 | 只看该作者
全局:
readman 发表于 2014-5-21 23:08. 1point 3 acres
我不知道现在什么样, 他是个叫什么 冲浪模型的 反爬虫.. From 1point 3acres bbs
有个算法, 比如第一次是1秒间隔, 然后是3秒, 然 ...

这么高级。。
换us地址就没法破了er-agent可能还不行,可能会记录网卡
回复

使用道具 举报

🔗
readman 2014-5-21 23:18:33 | 只看该作者
全局:
EroicaCMCS 发表于 2014-5-21 23:13.
这么高级。。
换us地址就没法破了er-agent可能还不行,可能会记录网卡

- = 网卡是mac地址, 在七层模型第二层, 估计记录的是ip地址把...
我见过一个分布式爬虫才高级.....
是通过bt协议传播的. bt上不是有种子服务器么? 然后你们先下种子, 然后去得到对方节点的数据完整度,然后share数据.
那爬虫就是让你们过去下载种子数据的时候, 先访问一个页面, 然后你把结果传给另一个服务器. 就相当于一个去中心化的爬虫..完克记录ip什么的...
回复

使用道具 举报

🔗
EroicaCMCS 2014-5-21 23:24:14 | 只看该作者
全局:
readman 发表于 2014-5-21 23:18
- = 网卡是mac地址, 在七层模型第二层, 估计记录的是ip地址把...
我见过一个分布式爬虫才高级.....-baidu 1point3acres
是 ...

上条回复网卡了结果出来结果语序是乱的。。。

我觉得是记录mac地址的。我试过换了很多ip包括用代理一样给禁。
回复

使用道具 举报

🔗
readman 2014-5-21 23:35:32 | 只看该作者
全局:
EroicaCMCS 发表于 2014-5-21 23:24
上条回复网卡了结果出来结果语序是乱的。。。

我觉得是记录mac地址的。我试过换了很多ip包括用代理一 ...

mac 地址在本地通过路由的时候, 会用ARP找到你的路由表中mac对应的ip, 然后就是ip之间传播了...
你代理怎么用的? 我以前不知道算法的时候, 用自己的macbook air 满学校跑换ip. 就可以了
回复

使用道具 举报

🔗
EroicaCMCS 2014-5-22 00:23:19 | 只看该作者
全局:
readman 发表于 2014-5-21 23:35
mac 地址在本地通过路由的时候, 会用ARP找到你的路由表中mac对应的ip, 然后就是ip之间传播了...
你代理 ...

你在学校是公网ip么,我在学校没有公网ip的,需要NAT。
表示全校满地跑也是禁,相当无语。

代理试过goagent, 也试过自己在校内服务器(squid搭的),还是不行。。。. 1point 3 acres
过一段时间(一两天)就又可以了。。

回复

使用道具 举报

🔗
geniuswu06 2014-7-27 08:03:11 | 只看该作者
全局:
高人啊 原来用SAS也是可以抓网页的信息的啊
回复

使用道具 举报

🔗
nikebo159 2015-5-15 10:51:21 | 只看该作者
全局:
這真的是太強了 完全不知道可以用 SAS 抓網頁資訊 謝謝分享!!!
回复

使用道具 举报

🔗
kevin5555 2015-5-15 19:32:22 | 只看该作者
本楼:
全局:
看一看!!!!!thx
回复

使用道具 举报

🔗
杨么么 2016-1-27 03:22:55 | 只看该作者
本楼:
全局:
感谢分享
回复

使用道具 举报

🔗
schroding 2018-1-2 13:29:30 | 只看该作者
全局:
哇最近正好需要抓网页,原来SAS也行
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

>
快速回复 返回顶部 返回列表