您当前的位置：首页 > 电脑百科 > 网络技术 > 网络技术

怎么用python批量获取免费代理IP

时间：2021-05-25 09:54:04 来源：今日头条作者：最咸鱼

+ 加入收藏

如今，需要使用代理IP的地方有很多，例如网络投票、大数据分析、人工智能等领域。那么如何获取代理IP呢？很多人想到了免费代理IP，免费不用钱，岂不美哉。虽然个人不太建议使用免费代理IP，但还是给大家分享下思路方法。

一、收集网站

想要获取免费代理IP，首先得收集一些有免费代理IP的网站，然后编写代码去批量获取网站上的免费代理IP。这里就不说有哪些网站呢，自己去百度一搜，大把的有。

二、分析网站

收集到网站后，对含有免费代理IP的网页进行分析，比如总共有多少页，想要的数据是在哪里，要怎么来获取。

三、编写代码

分析完网站后，就可以开始编写代码了，这里贴出代码，仅供参考。

import requests
import csv
import pandas as pd
from fake_useragent import UserAgent
import time

#获取含有免费代理IP的所有页面url
def get_pageUrls(startUrl,endUrl,pageCount):
    page_url_list = []

# range 从1开始，所以pageCount+1，左闭右开

    for i in range(1,pageCount+1):
    
    #页面URL一般由三部分组成，前半部分url+第几页+后半部分url，
    #有的页面URL最后以页数结尾，没有后半部分，那么endUrl设置为空字符串即可
    
        page_url = startUrl + str(i) + endUrl
        page_url_list.Append(page_url)

    return page_url_list

#请求所有免费代理IP的页面url，获取免费代理IP
def get_content(page_url_list):
    ua =UserAgent()
    data_list = []
    for page_url in page_url_list:
        try:
            resp = requests.get(page_url, headers={'User-Agent': ua.random})
          #如果免费代理IP是放在表格里，可以直接使用 pandas来获取，比较简单，
          #若不是，则需要用BeautifulSoup，或者xpath，或正则表达式来提取
            datas = pd.read_html(resp.text)
            # print(datas)
            data_list.append(datas)
            time.sleep(2)
            
        except:
            print('错误的请求URL：'+page_url)

    # print(data_list)
    return data_list

# 将获取到的免费代理IP保存到本地的Excel表格里，留待后用，也可以保存到TXT文本，或数据库里
def save_csv(data_list,save_path):
    for datas in data_list:
        for data in datas:
            # print(data)
            data.to_csv(sava_path,mode='a',encoding='utf-8',header=1,index=0)




if __name__ == '__main__':
    #前半部分url
    startUrl = 'https://*******/free/inha/'
   #页数
    pageCount = 4
   #若页面URL最后是以页数结尾，后半部分url设置为空字符串
    endUrl = ''
     #文件保存路径
    save_path = r'D:3.xlsx'

    page_url_list = get_pageUrls(startUrl,endUrl,pageCount)
    data_list = get_content(page_url_list)
    save_csv(data_list,save_path)

也许代码不够完善，不当之处欢迎指正，希望和大家一起交流。

Tags：代理IP 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com)，我们将及时更正、删除，谢谢。

▌相关推荐

怎么用python批量获取免费代理IP

如今，需要使用代理IP的地方有很多，例如网络投票、大数据分析、人工智能等领域。那么如何获取代理IP呢？很多人想到了免费代理IP，免费不用钱，岂不美哉。虽然个人不太建议使用免费代...【详细内容】

2021-05-25　　Tags: 代理IP 点击:(173)　　评论:(0)　　加入收藏

正确认识代理IP，合理使用代理IP

很多人在网上看到过这样的文章：代理IP能突破访问限制，提高访问速度，隐藏真实IP，等等一大堆的优点，颇有点无所不能的感觉。等到自己使用代理IP时，却发现这不行，那不行，感觉自己使用的...【详细内容】

2021-05-25　　Tags: 代理IP 点击:(183)　　评论:(0)　　加入收藏

python怎么验证代理IP是否有效

在使用代理IP前，很多人都有验证代理IP是否有效的习惯；在使用代理IP时，经常会遇到各种问题，于是想验证下代理IP是否有效。那么，如何验证代理IP是否有效呢？下面以python为例来说明。...【详细内容】

2021-05-25　　Tags: 代理IP 点击:(268)　　评论:(0)　　加入收藏

爬虫不使用代理IP会出现什么的情况

众所周知，代理IP可以助力爬虫工作更好的进行，很多人认为：如果没有代理IP，爬虫工作寸步难行。那么，如果爬虫不使用代理IP会出现什么情况呢？一、小型爬虫：可有可无爬几百篇文章，几百...【详细内容】

2021-05-07　　Tags: 代理IP 点击:(187)　　评论:(0)　　加入收藏

通过代理ip进行分布式爬虫的几种方案

如果不使用代理ip，爬虫工作必定无路可行，因此大部分爬虫工作者都会去购买安全稳定的代理ip。使用了高质量的代理ip后，会不会就能够无后顾之忧了呢？这个可不会这么容易，还要改进方案，有效分配资源，提升工作效率，又快速又稳定又...【详细内容】

2019-11-05　　Tags: 代理IP 点击:(181)　　评论:(0)　　加入收藏

Python爬虫：爬虫所需要的爬虫代理ip是什么？

当我们对某些网站进行爬去的时候，我们经常会换IP来避免爬虫程序被封锁。代理ip地址如何获取？其实也是一个比较简单的操作，目前网络上有很多IP代理商，例如西刺，芝麻，犀牛等等。这些...【详细内容】

2019-10-10　　Tags: 代理IP 点击:(227)　　评论:(0)　　加入收藏

▌简易百科推荐

既然HTTP/3正式发布了，那么咱们来深入理解HTTP/3协议

前言经过了多年的努力，在 6 月 6 号，IETF （互联网工程任务小组）正式发布了 HTTP/3 的 RFC。HTTP 历史 1991 HTTP/1.1 2009 Google 设计了基于TCP的SPDY 2013 QUIC 2015 HTTP/2...【详细内容】

2022-07-15　　Java机械师　　　　Tags:HTTP/3 　点击:(2)　　评论:(0)　　加入收藏

如何构建成功的 Web 3.0 产品？

关于万维网的一点历史没有过去，就没有未来。要了解未来会发生什么，我们需要知道我们现在和以前拥有什么。因此，与其一下跳到web3.0的技术和示例上，我们需要了解 Web 1.0 的基本...【详细内容】

2022-07-05　　木偶跳舞　　　　Tags:Web 3.0 　点击:(24)　　评论:(0)　　加入收藏

如何开始使用CS10无线网关

在刚刚拿到购买的CS10无线网关设备，应该如何开始使用呢？请看下面的几个步骤： Step1：首先我们找到产品包装内的一张带有初始WIFI名称和密码的贴纸，将它贴在产品的背面（以备未来使用...【详细内容】

2022-06-30　　PLUS1软件教学频道　　　　Tags:CS10 　点击:(32)　　评论:(0)　　加入收藏

企业局域网内外网分离方案

企业局域网内外网分离方案一些企事业单位出于安全考虑，需要做内外网分离。举例来说，需要达到如下的技术要求：生产网、办公网、外网三网隔离。启用网络准入，对非规定允许接入的...【详细内容】

2022-06-30　　运维幼儿　　　　Tags:内外网分离　点击:(31)　　评论:(0)　　加入收藏

来自远程技术提供者的建议，如何阻止他人远程访问你的移动设备？

在这个时代，我们至少有一半的重要信息都在手机上。无论是个人信息或是财务信息，还是敏感项目和工作机密，所有的这些都被我们驻留在手机上。现在越来越多的手机诈骗出现，这种第三...【详细内容】

2022-06-28　　AirDroid　　　　Tags:移动设备　点击:(26)　　评论:(0)　　加入收藏

家庭网络实验室怎么搭？（空间篇）

最近各个方面的事情逐渐地恢复，继续写家庭网络实验室的文章。在考虑洁净和需求之后，我们就需要考虑家庭网络实验室的空间了。首先先亮一个观点——如果你真的想在家...【详细内容】

2022-06-28　　iN在　　　　Tags:家庭网络　点击:(29)　　评论:(0)　　加入收藏

padavan openvpn实现两个局域网互联

背景:网络穿透互联是方便我们技术人员的一种工具，通过各种协议实现您想要的网络互联。家庭组网可以参照低成本电信家庭宽带架构网络拓扑今天，我们需要在这个基础上扩展网络应...【详细内容】

2022-06-27　　应用技术　　　　Tags:局域网互联　点击:(28)　　评论:(0)　　加入收藏

FTP服务介绍

FTP是File Transfer Protocol(文件传输协议），用来进行服务器和客户端之间文件传输的协议。非常常用的服务，应用场景主要在设备间文件共享，服务程序发布，日志文件管理等方面。这里...【详细内容】

2022-06-27　　影三分plus　　　　Tags:FTP 　点击:(37)　　评论:(0)　　加入收藏

如何访问局域网内监控录像机并查看

一、后台确认监控/录像机在局域网内的IP地址如:192.168.1.158 ,在浏览器内输入后回车，即可进入监控/录像机WEB登录界面二、输入用户名及密码进入WEB管理界面三、如果进...【详细内容】

2022-06-23　　一往直前的冲吧　　　　Tags:监控　点击:(41)　　评论:(0)　　加入收藏

影响网速的三种情况，快看看家里有没有

人在家中坐，网速突然断。相信这样的情况大家都不陌生。那么，怎么样才能在装维小哥上门前快速自助排查解决简单问题呢？相信这份攻略能够帮到你~ 一旦出现家中断网，而且在重启光猫...【详细内容】

2022-06-22　　安利小丸子　　　　Tags:网速　点击:(26)　　评论:(0)　　加入收藏

推荐资讯

一文搞懂响应式编程	Android开发组件化与
最流行的 .NET 反编译	MyBatis源码解读 \| 使
mysql数据库中的my.in	女生，人生第一支大牌口
防晒不分男女！防晒帽同	手表鉴定 \| 一眼看真