1. 服務監控三要素^1 服務監控需要滿足的三要素分別如下: 日誌監控 指標監控 請求鏈路追蹤 服務監控只要能滿足這三個要素,基本就能實現我們想要的監控效果。 1.1.主流APM系統^1 APM 系統(Application Performance Management,即應用性能管理)是對企業的應 ...
1. 服務監控三要素[1]
服務監控需要滿足的三要素分別如下:
- 日誌監控
- 指標監控
- 請求鏈路追蹤
服務監控只要能滿足這三個要素,基本就能實現我們想要的監控效果。
1.1.主流APM系統[1:1]
APM 系統(Application Performance Management,即應用性能管理)是對企業的應用系統進行實時監控,實現對應用性能管理和故障定位的系統化解決方案,在運維中常用。
- CAT(開源): 由國內美團點評開源的,基於 Java 語言開發,目前提供 Java、C/C++、Node.js、Python、Go 等語言的客戶端,監控數據會全量統計。國內很多公司在用,例如美團點評、攜程、拼多多等。CAT 需要開發人員手動在應用程式中埋點,對代碼侵入性比較強。
- Zipkin(開源): 由 Twitter 公司開發並開源,Java 語言實現。侵入性相對於 CAT 要低一點,需要對web.xml 等相關配置文件進行修改,但依然對系統有一定的侵入性。Zipkin 可以輕鬆與 Spring Cloud 進行集成,也是 Spring Cloud 推薦的 APM 系統。
- Pinpoint(開源): 南韓團隊開源的 APM 產品,運用了位元組碼增強技術,只需要在啟動時添加啟動參數即可實現 APM 功能,對代碼無侵入。目前支持 Java 和 PHP 語言,底層採用 HBase 來存儲數據,探針收集的數據粒度非常細,但性能損耗較大,因其出現的時間較長,完成度也很高,文檔也較為豐富,應用的公司較多。
- SkyWalking(開源): 國人開源的產品,2019 年 4 月 17 日 SkyWalking 從 Apache 基金會的孵化器畢業成為頂級項目。目前 SkyWalking 支持 Java、.Net、Node.js 等探針,數據存儲支持MySQL、ElasticSearch等。
- 還有很多不開源的 APM 系統,例如,淘寶鷹眼、Google Dapper 等等。
2. SkyWalking[2]
SkyWalking 是分散式系統的應用程式性能監視工具,專為微服務、雲原生架構和基於容器(Docker、K8s、Mesos)架構而設計。
提供分散式追蹤、服務網格遙測分析、度量聚合和可視化一體化解決方案
2.1 功能列表
- 多種監控手段。可以通過語言探針和 service mesh 獲得監控是數據。
- 多個語言自動探針。包括 Java,.NET Core 和 Node.JS。
- 輕量高效。無需大數據平臺,和大量的伺服器資源。
- 模塊化。UI、存儲、集群管理都有多種機制可選。
- 支持告警。
- 優秀的可視化解決方案。
2.2 整體架構
整個架構,分成上、下、左、右四部分:
- 上部分 Agent :負責從應用中,收集鏈路信息,發送給 SkyWalking OAP 伺服器。目前支持 SkyWalking、Zikpin、Jaeger 等提供的 Tracing 數據信息。而我們目前採用的是,SkyWalking Agent 收集 SkyWalking Tracing 數據,傳遞給伺服器。
- 下部分 SkyWalking OAP :負責接收 Agent 發送的 Tracing 數據信息,然後進行分析(Analysis Core) ,存儲到外部存儲器( Storage ),最終提供查詢( Query )功能。
- 右部分 Storage :Tracing 數據存儲。目前支持 ES、MySQL、Sharding Sphere、TiDB、H2 多種存儲器。而我們目前採用的是 ES ,主要考慮是 SkyWalking 開發團隊自己的生產環境採用 ES 為主。
- 左部分 SkyWalking UI :負責提供控台,查看鏈路等等。
2.3 搭建SkyWalking 單機環境
- 第一步,搭建一個 Elasticsearch 服務。
- 第二步,下載 SkyWalking 軟體包。
- 第三步,搭建一個 SkyWalking OAP 服務。
- 第四步,啟動一個 Spring Boot 應用,並配置 SkyWalking Agent。
- 第五步,搭建一個 SkyWalking UI 服務。
環境說明
操作系統:Centos 7.6
Docker:20.10.18
Skywalking OAP:8.9.1
Skywalking UI:8.9.1
Skywalking Agent:8.14
Elasticsearch:7.1.1
下載鏡像
docker pull docker.io/elasticsearch:7.1.1
docker pull apache/skywalking-ui:8.9.1
docker pull apache/skywalking-oap-server:8.9.1
說明:Skywalking 8.9.1是 Skywalking 8 的最後一個版本,並且修複了Log4j的JNDI註入漏洞CVE-2021-44228
下載鏡像時如提示 command not found ,請先去安裝docker
下載Java Agent源碼包,後續在項目中會用到
https://archive.apache.org/dist/skywalking/java-agent/8.14.0/apache-skywalking-java-agent-8.14.0.tgz
安裝Elasticsearch
先運行es容器
docker run -d --name=es --restart=always -p 9200:9200 -p 9300:9300 -e "discovery.type=single-node" -e ES_JAVA_OPTS="-Xms2048m -Xmx2048m" b0e9f9f047e6
可根據自己的情況修改 ES_JAVA_OPTS 的值
創建持久化文件
mkdir -p /home/elasticsearch/
複製容器內的文件
docker cp es:/usr/share/elasticsearch/data /home/elasticsearch/
docker cp es:/usr/share/elasticsearch/logs /home/elasticsearch/
刪除es容器
docker rm -f es
以掛載模式運行
docker run -d --name=es --restart=always -p 9200:9200 -p 9300:9300 -e "discovery.type=single-node" -v /home/elasticsearch/data:/usr/share/elasticsearch/data -v /home/elasticsearch/logs:/usr/share/elasticsearch/logs -e ES_JAVA_OPTS="-Xms2048m -Xmx2048m" b0e9f9f047e6
使用 docker logs -f es 查看啟動日誌,當看到下麵的內容時說明啟動成功
"publish_address {172.17.0.2:9300}, bound_addresses {0.0.0.0:9300}"
或者訪問 http://ip:9200 時出現下麵內容也說明啟動成功
{
"name" : "a1c4bc953b44",
"cluster_name" : "docker-cluster",
"cluster_uuid" : "sjssODkzTTy0bTrTEqlZfQ",
"version" : {
"number" : "7.1.1",
"build_flavor" : "default",
"build_type" : "docker",
"build_hash" : "7a013de",
"build_date" : "2019-05-23T14:04:00.380842Z",
"build_snapshot" : false,
"lucene_version" : "8.0.0",
"minimum_wire_compatibility_version" : "6.8.0",
"minimum_index_compatibility_version" : "6.0.0-beta1"
},
"tagline" : "You Know, for Search"
}
進入容器內安裝ik分詞器
./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.1.1/elasticsearch-analysis-ik-7.1.1.zip
Elasticsearch設置密碼訪問[3]
進入容器
docker exec -it es /bin/bash
修改配置文件
vi config/elasticsearch.yml
在文件尾部添加如下內容
# 開啟跨域訪問 允許外部連接
http.cors.enabled: true
http.cors.allow-origin: "*"
# 開啟密碼驗證
xpack.security.enabled: true
xpack.license.self_generated.type: basic
xpack.security.transport.ssl.enabled: true
重啟ES容器後再進入容器內,執行如下命令
./elasticsearch-setup-passwords interactive
然後輸入你想設置的密碼,我這裡密碼設置為 yourpassword 方便後續演示
接下來就是會預設的創建6個用戶,並讓你設置這6個用戶的密碼,忽略掉用戶名,這些用戶許可權都是相同的,設置完成以後,這時候再訪問es的地址,就會提示需要授權輸入賬號密碼訪問了
安裝 Skywalking OAP[4]
等待elasticsearch完全啟動完後,再啟動oap
docker run --name oap-8.9.1 -d --restart=always -e TZ=Asia/Shanghai -p 12800:12800 -p 11800:11800 --link es:es -e SW_STORAGE=elasticsearch -e SW_STORAGE_ES_CLUSTER_NODES=es:9200 -e SW_ES_USER=elastic -e SW_ES_PASSWORD=yourpassword apache/skywalking-oap-server:8.9.1
這裡指定了ES存儲數據,並輸入ES授權的賬戶密碼
安裝 Skywalking UI
docker run -d --name skywalking-ui-8.9.1 --restart=always -e TZ=Asia/Shanghai -p 8088:8080 --link oap-8.9.1:oap -e SW_OAP_ADDRESS=http://oap:12800 apache/skywalking-ui:8.9.1
這裡映射的埠為8088,防止埠衝突,也可根據你的情況設置
命令中 oap-8.9.1:oap 的 oap-8.9.1 是已運行並需要連接的容器名,oap是取的別名。後續容器內請求 http://oap/ 便會請求到 oap-8.9.1 容器內,並且別名不能有 . 的出現,防止地址解析失敗
啟動完成後請求 http://ip:8088/
因為懶載入機制,當有請求時才會有數據顯示,當第一次訪問時會沒有數據
2.4 項目集成Skywalking
將上面下載到的 Java Agent 拷貝到項目能訪問到的地址,增加JVM的啟動參數
-javaagent:D:\tools\skywalking-agent-8.14\skywalking-agent.jar
-Dskywalking.agent.service_name=xxx-server
-Dskywalking.collector.backend_service=ip:11800
-Dskywalking.plugin.jdbc.trace_sql_parameters=true
trace_sql_parameters 參數為true時會收集sql語句的占位參數
更多詳細參數請參考[5]
IDEA中啟動項目
命令啟動項目
如使用命令啟動,在java -jar xxx.jar 中增加命令
java -jar -javaagent:D:\tools\skywalking-agent-8.14\skywalking-agent.jar -Dskywalking.agent.service_name=xxx-server -Dskywalking.collector.backend_service=ip:11800 -Dskywalking.plugin.jdbc.trace_sql_parameters=true xxx.jar
Docker 啟動項目[6]
我們構建java運行的jdk基礎鏡像時,加入skywalking agent
Dockerfile:
# FROM openjdk:8-jdk-alpine
FROM adoptopenjdk/openjdk8
VOLUME /tmp
# 其他的一些運行參數可以放這裡,比如-Xmx1024m
ENV JAVA_OPTS=""
ENV SKYWALKING_AGENT_SERVICE_NAME="xxx-server"
ENV SKYWALKING_COLLECTOR_BACKEND_SERVICE="ip:1088"
ENV SKYWALKING_PLUGIN_JDBC_TRACE_SQL_PARAMETERS="true"
COPY /etc/localtime /etc/localtime
# 這裡是agent的文件夾,按照自己的情況設置
COPY /opt/skywalking-agent-8.14 /usr/local/agent
RUN echo "Asia/Shanghai" > /etc/timezone
ONBUILD COPY app.jar app.jar
ENTRYPOINT [ "java", "-jar", " $JAVA_OPTS -javaagent:/usr/local/agent/skywalking-agent.jar -Dskywalking.agent.service_name=$SKYWALKING_AGENT_SERVICE_NAME -Dskywalking.collector.backend_service=$SKYWALKING_COLLECTOR_BACKEND_SERVICE -Dskywalking.collector.backend_service=$SKYWALKING_COLLECTOR_BACKEND_SERVICE -Dskywalking.plugin.jdbc.trace_sql_parameters=$SKYWALKING_PLUGIN_JDBC_TRACE_SQL_PARAMETERS app.jar" ]
然後在Dockerfile所在目錄通過docker build -t 鏡像名 構建好鏡像即可運行
2.5 項目日誌收集
logback日誌收集[7]
<!-- 如果想在項目代碼中獲取鏈路TraceId,則需要引入此依賴 -->
<dependency>
<groupId>org.apache.skywalking</groupId>
<artifactId>apm-toolkit-trace</artifactId>
<version>8.14.0</version>
</dependency>
<!-- skywalking logback插件 -->
<dependency>
<groupId>org.apache.skywalking</groupId>
<artifactId>apm-toolkit-logback-1.x</artifactId>
<version>8.14.0</version>
</dependency>
編寫logback日誌配置文件。在resources下新建一個logback-spring.xml文件,根據官網文檔編寫配置文件,可以寫作以下兩種。
兩者的區別就是layout中是採用TraceIdPatternLogbackLayout還是TraceIdMDCPatternLogbackLayout,如果採用TraceIdMDCPatternLogbackLayout,需要將[%tid]改為[%X{tid}]
<!-- class="ch.qos.logback.core.ConsoleAppender"是指列印到控制台 -->
<appender name="STDOUT" class="ch.qos.logback.core.ConsoleAppender">
<encoder class="ch.qos.logback.core.encoder.LayoutWrappingEncoder">
<layout class="org.apache.skywalking.apm.toolkit.log.logback.v1.x.TraceIdPatternLogbackLayout">
<Pattern>%d{yyyy-MM-dd HH:mm:ss.SSS} [%tid] [%thread] %-5level %logger{36} -%msg%n</Pattern>
</layout>
</encoder>
</appender>
<!-- with the MDC, set %X{tid} in Pattern -->
<!-- MDC是什麼:MDC採用Map的方式存儲上下文,線程獨立的,子線程會從父線程拷貝上下文 -->
<appender name="GRPC" class="ch.qos.logback.core.ConsoleAppender">
<encoder class="ch.qos.logback.core.encoder.LayoutWrappingEncoder">
<layout class="org.apache.skywalking.apm.toolkit.log.logback.v1.x.mdc.TraceIdMDCPatternLogbackLayout">
<Pattern>%d{yyyy-MM-dd HH:mm:ss.SSS} [%X{tid}] [%thread] %-5level %logger{36} -%msg%n</Pattern>
</layout>
</encoder>
</appender>
<root level="INFO">
<appender-ref ref="STDOUT"/>
<appender-ref ref="GRPC"/>
</root>
其他日誌框架的引入詳見官網