Nginx奇技淫巧之：用户行为埋点数据采集实现

时间：2022-11-22 10:36:19 来源：今日头条作者：清风明月eagle

前言

面向用户端的系统，往往会对用户行为进行数据埋点采集，如电商系统用户点击推荐商品、添加购物车、订单支付等。通过这些重要环节将用户的操作行为数据上报到后端，再由大数据对数据进行统计、分析计算，最终将结果反馈给运营和决策者，以便更好的服务用户和做好商业决策。
对企业来说，在法律允许范围内，数据应采尽采。数据越多对行为分析往往越准确。因此，接收采集数据的服务后端，必须考虑服务的高性能、高吞吐量问题。如何，快速地接收采集数据，并推送到后端大数据使用，同时保证系统服务的稳定和高效，将是一个很大的挑战。本文将向大家介绍Nginx作为采集后端服务的一种用法。希望对有相似场景的小伙伴有所帮助和启发。

数据采集流程架构

nginx作为一个高性能的服务组件，早已被各大厂反复验证。这里采用Nginx作为采集服务的后端。Nginx提供一个post埋点接口，如:http://xxxx/trackLog。接收前端埋点请求，将post请求body写入本地日志文件，直接响应返回。后端以异步方式，使用采集代理程序(如logstash)监听日志文件，并将数据推送到kafka。大数据程序(Flink)对kafka数据统计分析，形成结果数据提供给上层应用使用。

Nginx接收到前端页面的http post请求，将post中的body参数作为埋点的消息内容，以json格式按行追加到日志文件中。这个过程的关键点：如何将post body参数内容写入到一个单独的日志文件。下面是Nginx的相关配置。

Nginx post body参数配置

修改Nginx config配置文件，在配置文件中加入以下信息。

http 块添加以下配置

# 添加post body参数日志，日志为json格式 log_format trackerlog escape=json '$request_body';

server 块添加以下配置

location /tracklog { # 非post请求，拒绝 if ($request_method !~* POST) { return 403; } # request_body变量 通过proxy_pass请求才生效 access_log /usr/local/nginx/logs/track.log tracklog; proxy_pass http://127.0.0.1/return200/; } location /return200 { default_type Application/json; return 200 '{"code":0,"msg":"success"}'; }

生效Nginx Config

# Nginx sbin目录执行配置生效命令 ./nginx -s reload

测试post请求

# 部署Nginx服务器执行测试post请求，body参数可根据业务场景自行定义 curl -H "Content-type:application/json" -X POST -d '{"name":"test"}' http://localhost/tracklog

日志查看

生成的日志在/usr/local/nginx/logs/track.log目录下，查看日志文件，日志文件内容已生成，验证完成。

总结

本文介绍了埋点采集服务Nginx的使用方案。包含整体流程架构，Nginx配置方式，数据验证等内容。相信看到这里的小伙伴，对采集方案有了大致的了解。当然，这个只是基础实现，在生产环境应用，还需要保证高可用等处理。如Nginx的多实例部署，日志文件按每天时间生成，logstash多文件扫描采集/数据清洗等，这些就不一一介绍了，留给小伙伴们思考。

Tags：Nginx 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

为什么Nginx被称为“反向”代理呢？

Nginx（发音为"engine-x"）是一款高性能、轻量级的开源Web服务器软件，也可用作反向代理服务器、负载均衡器和HTTP缓存。Nginx之所以有被称为“反向”代理，是因为它充当客户端设备...【详细内容】

2024-02-01　　Search: Nginx 点击:(60)　　评论:(0)　　加入收藏

如何在Java环境中安装Nginx？

1. 下载Nginx：首先，前往Nginx官方网站（https://nginx.org/en/download.html）下载新版本的Nginx。选择适合您操作系统的版本，通常有Windows、Linux和Mac等不同操作系统的版本可供...【详细内容】

2024-01-22　　Search: Nginx 点击:(63)　　评论:(0)　　加入收藏

一文教你学会使用Nginx

前段时间，了不起给大家说过如果使用 Docker 发布自己的后端项目，也就不再使用 Jar 包进行项目的发版操作，但是这其中就又涉及到了前端如何发版，为什么这么说，因为资深前端开发，可...【详细内容】

2023-12-27　　Search: Nginx 点击:(88)　　评论:(0)　　加入收藏

Nginx 反向代理为什么叫做“反向”？

今天我们来聊聊正向代理和反向代理。01 正向代理（Forward Proxy）正向代理是位于用户设备和互联网之间的服务器。它代理的是客户端，是站在用户一方的。其真实客户端对于服务器不...【详细内容】

2023-12-06　　Search: Nginx 点击:(90)　　评论:(0)　　加入收藏

Nginx的负载均衡实现，你学会了吗？

环境主机 ip 用途软件 web1 192.168.50.60 nginx-1 httpd web2 192.168.50.61 nginx-2 httpd proxy 192.168.50.62 负载...【详细内容】

2023-12-06　　Search: Nginx 点击:(145)　　评论:(0)　　加入收藏

Nginx如何开启GZIP文件压缩，你学会了吗？

简介GZip 是一种改进web应用程序性能的技术，文件压缩后再传输可以减少传输数据，提升传输速度。在Nginx服务器上开启Gzip压缩可以有效减少网络传输流量，提升网站的访问速度和性...【详细内容】

2023-11-30　　Search: Nginx 点击:(122)　　评论:(0)　　加入收藏

Nginx配置文件中的关键字是什么？

Nginx 是一款高性能的 Web 服务器软件，同时也是一款反向代理服务器软件。Nginx 的配置文件通常是 /etc/nginx/nginx.conf，以下是一个典型的配置文件，并对其中的关键字进行详细...【详细内容】

2023-11-22　　Search: Nginx 点击:(148)　　评论:(0)　　加入收藏

Nginx 大揭秘：读写分离助力您轻松征服高并发

引言在构建高性能、高可用的 Web 应用时，如何有效地处理数据库的读写负担已成为一个十分重要的考虑因素。Nginx 作为一款强大的反向代理服务器，提供了简单而灵活的负载均衡配...【详细内容】

2023-11-14　　Search: Nginx 点击:(54)　　评论:(0)　　加入收藏

Kubernetes 部署应用(Nginx)的两种方式，你更喜欢哪一种？

k8s发布应用的两种方式： kubernetes-dashboard kubectl命令行一、Dashboard方式配置部署：包含应用名称、容器镒、pod数量、Service非常的方便，不想设置配置yaml的可以很方便的...【详细内容】

2023-11-06　　Search: Nginx 点击:(370)　　评论:(0)　　加入收藏

掌握Nginx的高级用法，构建高性能Web应用

Nginx是一款高性能的Web服务器和反向代理服务器，它广泛用于构建高性能、可靠和安全的Web应用程序。除了基本的用法外，Nginx还提供了一些高级功能和配置选项，可以进一步优化性能...【详细内容】

2023-10-26　　Search: Nginx 点击:(220)　　评论:(0)　　加入收藏

▌简易百科推荐

为什么Nginx被称为“反向”代理呢？

2024-02-01　　coderidea　　微信公众号　　Tags:Nginx 　点击:(60)　　评论:(0)　　加入收藏

哪种服务器操作系统更好呢？

在当今的IT世界中，服务器操作系统扮演着至关重要的角色。它们是确保服务器能够高效、安全地运行的关键因素。然而，对于许多人来说，服务器操作系统的种类和特点可能是一个复杂的...【详细内容】

2024-01-30　　　　简易百科　　Tags:操作系统　点击:(76)　　评论:(0)　　加入收藏

什么是VPS服务器

VPS服务器是一种虚拟化技术，它将一台物理服务器划分为多个虚拟的独立服务器，每个虚拟服务器都可以拥有自己的操作系统、运行环境、应用程序等。这种技术使得每个虚拟服务器可...【详细内容】

2024-01-30　　　　简易百科　　Tags:VPS服务器　点击:(71)　　评论:(0)　　加入收藏

VPS服务器下载速度慢?这五招帮你提速

VPS服务器下载速度慢可能会让用户感到沮丧，尤其是对于需要大量下载和上传数据的用户。幸运的是，有一些方法可以帮助您提高VPS服务器的下载速度，使您的在线体验更加顺畅。在本文...【详细内容】

2024-01-30　　IDC行业观察者　　　　Tags:VPS服务器　点击:(58)　　评论:(0)　　加入收藏

美国VPS和英国VPS：地理位置对服务器性能的影响

在今天的数字时代，VPS已成为在线业务和网站托管的关键组成部分。然而，选择合适的VPS主机服务时，地理位置通常被忽视，尽管它对服务器性能有着重要的影响。本文将探讨美国VPS和英...【详细内容】

2024-01-26　　IDC行业观察者　　　　Tags:服务器　点击:(55)　　评论:(0)　　加入收藏

如何判断服务器所需带宽：基于业务需求和流量模式的关键考量

在选择服务器时，带宽是一个重要的考虑因素。带宽的大小直接影响到网站的加载速度和用户的访问体验。那么，如何判断服务器需要多大的带宽呢?本文将为你揭示这一关键问题的答案...【详细内容】

2024-01-26　　源库科技　　　　Tags:服务器　点击:(75)　　评论:(0)　　加入收藏

服务器内存空间及IO操作原理解析

服务器的内存空间分为内核空间和用户空间，而我们编写的程序通常在用户空间中运行。在进行读写操作时，我们直接操作的是用户缓冲区，而用户缓冲区的内容来自于内核缓冲区。这种内...【详细内容】

2024-01-23　　王建立　　　　Tags:服务器　点击:(44)　　评论:(0)　　加入收藏

如何在Java环境中安装Nginx？

2024-01-22　　敲代码的小动　　　　Tags:Nginx 　点击:(63)　　评论:(0)　　加入收藏

服务器证书和SSL证书有啥区别？

在互联网经济时代，随着越来越多的信息以及合作都是从企业官网开始的，因此绝大多数企业都会为自己的网站配置SSL证书，以提高安全性。在接触SSL证书时，也有很多人称之为服务器证书...【详细内容】

2024-01-10　　安信SSL证书　　　　Tags:服务器证书　点击:(65)　　评论:(0)　　加入收藏

宝塔面板怎样部署java项目？

宝塔面板怎样部署java项目？在使用宝塔面板部署Java项目之前，需要确保已经安装了Java Development Kit (JDK)。接下来，将介绍如何使用宝塔面板来部署Java项目的步骤。步骤一：安装...【详细内容】

2024-01-09　　西部数码　　　　Tags:宝塔面板　点击:(115)　　评论:(0)　　加入收藏

推荐资讯

早高峰打“飞的”有多	JavaScript的异步编程
Rust编程语言的内存安	数字人破解跨境直播难
Meta确认5月发布Llama	ChatGPT 应用商店？可能
社交网络与Web3：数字社	速查微信聊天最频繁对