您当前的位置:首页 > 电脑百科 > 网络技术 > 网络知识

分布式爬虫管理平台Crawlab开发搭建

时间:2020-07-12 09:44:29  来源:  作者:

分布式爬虫管理平台Crawlab发现挺不错,但是官方文档中涉及二次开发的环境启动章节比较模糊。

最先需要的是克隆代码

https://github.com/nickliqian/crawlab

前端部署

1、安装node(网上node下载即可)

2、安装基本依赖

cmd窗口使用administrator用户运行执行:

npm install --global --production windows-build-tools
npm install -g node-gyp
npm install -g yarn  
npm install node-sass

3、编译代码

这里的构建是指前端构建。在构建之前,我们需要配置一下前端的部署环境变量。

打开 ./frontend/.env.production,内容如下。

NODE_ENV='production'
    VUE_App_BASE_URL=/api
    VUE_APP_CRAWLAB_BASE_URL=https://api.crawlab.cn
    VUE_APP_DOC_URL=http://docs.crawlab.cn	
cd C:Users2230Desktopcrawlab-masterfrontend
yarn install

启动:

npm run serve   #启动
npm run build:dev   #开发环境构建
npm run build:prod   #生产环境构建

4、验证结果

访问页面:http://localhost:8080/#/login

分布式爬虫管理平台Crawlab开发搭建

 

附:编译遇到的一些问题

  • gyp verb `which` failed Error: not found: Python2

https://blog.csdn.net/qq_34527715/article/details/103376851

这个问题可以忽略直接执行如下命令,可以自动安装python2软件。

npm install -global -production windows-build-tools

  • C:WindowsMicrosoft.NETFrameworkv4.0.30319msbuild.exe` failed with exit code: 1

https://blog.csdn.net/xf1195718067/article/details/78598599

管理员身份运行cmd

npm install -global -production windows-build-tools

后端编译

1、基本软件安装

  • 下载go 1.12+ 版本( https://studygolang.com/dl )

设置go到环境变量PATH中

https://github.com/MicrosoftArchive/redis/releases
https://pan.baidu.com/s/17NYqI-UTAsynmRpHklX4Ig  提取码:nh5p
  • 下载MongoDB
http://dl.mongodb.org/dl/win32/x86_64

启动(可以在PATH中设置MongoDB的bin目录)

mongod.exe   
--dbpath=C:Users2230Desktopcrawlabmongodb-win32-x86_64-2012plus-4.2.7db  
--logpath=C:Users2230Desktopcrawlabmongodb-win32-x86_64-2012plus-4.2.7mongod.log 

2、修改配置

主要修改redis和MongoDB的服务器地址(根据具体情况修改):

C:Users2230Desktopcrawlab-masterconfconfig.yaml

3、编译代码

设置一下 Go Module 的代理,将环境变量 GOPROXY 设置为 https://goproxy.cn。如果是 linuxmac,可以执行如下命令:

 export GOPROXY=https://goproxy.cn  

windows系统启动cmd,执行如下:

set GOPROXY=https://goproxy.cn 

开始编译代码执行如下命令:

 cd  C:Users2230Desktopcrawlab-masterbackend
 go install

在执行go install时会出现如下错误,可能window系统不支持这些类库,先直接注释

分布式爬虫管理平台Crawlab开发搭建

 

注释后在执行 go install ;这时直接注释这个引入的模块即可编译成功

分布式爬虫管理平台Crawlab开发搭建

 

执行如下命令构建exe

go build 

生产如图exe文件

分布式爬虫管理平台Crawlab开发搭建

 

以上是构建项目。如果是启动项目,可以直接使用命令:

cd  C:Users2230Desktopcrawlab-masterbackend
go run main.go
分布式爬虫管理平台Crawlab开发搭建

 

另外也可以执行go build生产的crawlab.exe文件;在cmd命令行执行:

分布式爬虫管理平台Crawlab开发搭建

 

4、验证结果

访问:http://localhost:8080/#/login

输入账号密码:admin / admin

分布式爬虫管理平台Crawlab开发搭建

 

看起来功能还是比较强大的,正在研究怎样使用。如果大家有兴趣的一起分享、学习。



Tags:分布式爬虫管理   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
分布式爬虫管理平台Crawlab发现挺不错,但是官方文档中涉及二次开发的环境启动章节比较模糊。最先需要的是克隆代码https://github.com/nickliqian/crawlab前端部署1、安装nod...【详细内容】
2020-07-12  Tags: 分布式爬虫管理  点击:(91)  评论:(0)  加入收藏
▌简易百科推荐
以京训钉开发平台接口文档为例,使用HttpClient类请求调用其接口,对数据进行增删改查等操作。 文档地址: https://www.yuque.com/bjjnts/jxd/bo1oszusing System;using System.C...【详细内容】
2021-12-28  Wednes    Tags:HttpClient   点击:(1)  评论:(0)  加入收藏
阿里云与爱快路由安装组网教程一、开通好阿里云轻量服务器之后在服务器运维-远程连接处进行远程 二、进入控制台后在root权限下根据需要安装的固件位数复制下面命令。32位:wg...【详细内容】
2021-12-28  ikuai    Tags:组网   点击:(1)  评论:(0)  加入收藏
HTTP 报文是在应用程序之间发送的数据块,这些数据块将通过以文本形式的元信息开头,用于 HTTP 协议交互。请求端(客户端)的 HTTP 报文叫做请求报文,响应端(服务器端)的叫做响应...【详细内容】
2021-12-27  程序员蛋蛋    Tags:HTTP 报文   点击:(4)  评论:(0)  加入收藏
一 网络概念:1.带宽: 标识网卡的最大传输速率,单位为 b/s,比如 1Gbps,10Gbps,相当于马路多宽2.吞吐量: 单位时间内传输数据量大小单位为 b/s 或 B/s ,吞吐量/带宽,就是网络的使用率...【详细内容】
2021-12-27  码农世界    Tags:网络   点击:(3)  评论:(0)  加入收藏
1.TCP/IP 网络模型有几层?分别有什么用? TCP/IP网络模型总共有五层 1.应用层:我们能接触到的就是应用层了,手机,电脑这些这些设备都属于应用层。 2.传输层:就是为应用层提供网络...【详细内容】
2021-12-22  憨猪哥08    Tags:TCP/IP   点击:(35)  评论:(0)  加入收藏
TCP握手的时候维护的队列 半连接队列(SYN队列) 全连接队列(accepted队列)半连接队列是什么?服务器收到客户端SYN数据包后,Linux内核会把该连接存储到半连接队列中,并响应SYN+ACK报...【详细内容】
2021-12-21  DifferentJava    Tags:TCP   点击:(10)  评论:(0)  加入收藏
你好,这里是科技前哨。 随着“元宇宙”概念的爆火,下一代互联网即将到来,也成了互联网前沿热议的话题,12月9日美国众议院的听证会上,共和党议员Patrick McHenry甚至宣称,要调整现...【详细内容】
2021-12-17  王煜全    Tags:Web3   点击:(14)  评论:(0)  加入收藏
一、demopublic static void main(String[] args) throws Exception { RetryPolicy retryPolicy = new ExponentialBackoffRetry( 1000, 3);...【详细内容】
2021-12-15  程序员阿龙    Tags:Curator   点击:(22)  评论:(0)  加入收藏
一、计算机网络概述 1.1 计算机网络的分类按照网络的作用范围:广域网(WAN)、城域网(MAN)、局域网(LAN);按照网络使用者:公用网络、专用网络。1.2 计算机网络的层次结构 TCP/IP四层模...【详细内容】
2021-12-14  一口Linux    Tags:网络知识   点击:(31)  评论:(0)  加入收藏
无论是在外面还是在家里,许多人都习惯了用手机连接 WiFi 进行上网。不知道大家有没有遇到过这样一种情况, 明明已经显示成功连接 WiFi,却仍然提示“网络不可用”或“不可上网”...【详细内容】
2021-12-14  UGREEN绿联    Tags:WiFi   点击:(25)  评论:(0)  加入收藏
相关文章
    无相关信息
最新更新
栏目热门
栏目头条