반응형

분류 전체보기 118

[Monitoring] kube_node_labels에 label이 표시 안되는 현상 (kube-state-metrics) (grafana/prometheus)

개요 Grafana 대시보드 구성을 위해 Node의 lable이 필요한 상황이라 kube_node_label 메트릭(metrics)을 조회해봤다. 하지만, kube_node_label 메트릭에서는 label에 대한 정보가 표시되지 않고 있었다. 이를 해결했던 경험을 작성하려고 한다. + (kube_pod_label에서도 표시되지 않는 현상도 수정하였다.) 환경 kube-prometheus-stack v 32.2.1 kube-state-metric v2.3.0 원인 kube-state-metrics이 kube_node_label과 kube_pod_label 메트릭을 수집하고 있는데, v2.0.0부터는 label을 따로 표기하지 않게 설정이 되었다고 한다. (많은 label로 인해 에러를 방지하기 위함이라고..

DevOps/Monitoring 2022.08.31

[Python] RDS(DB)에서 CSV 파일로 export 하기 (import pandas)

개요 RDS 데이터 백업을 위해 S3로 데이터를 정기적으로 이관해야 될 상황이 생겼다. NIFI나 Airflow를 사용하면 관리가 용이하지만, 여러 JOB을 돌리지 않을 것이기 때문에 단순 Python 스크립트로 개발하고자 하였다. 코드 pandas란 라이브러리를 사용했고, 코드는 csv로 export는 하는 코드는 아래와 같다. import pandas as pd #원하는 쿼리를 작성 query = "select * from table" #DB접속 정보를 입력한다. rds는 host에 Endpoint를 적으면 된다. conn = pymysql.connect(host='db-endpoint', user='user-name', password='passwd', db='db-name', charset='ut..

DevOps/Python 2022.08.30

[Linux] 특정 일자가 지난 파일 / 폴더 삭제하기

개요 일정 주기로 로그 파일이나 특정 폴더를 삭제하고 싶으면 아래 명령어를 적용하면 된다. 파일 find -mtime -exec rm -rf {} \; 폴더 -type d 옵션을 추가하면 된다. find -mtime -type d -exec rm -rf {} \; 예시 파일 30일이 경과한 로그 파일 삭제 #!/bin/bash find /home/*.log -mtime +30 -exec rm -rf {} \; # 30일 경과 find /home/*.log -mtime +20 -exec rm -rf {} \; # 20일 경과 폴더 30일이 경과한 폴더 삭제 #!/bin/bash find /var/lib/jenkins/jobs/*/builds/{*,.[!.]*} -type d -mtime +30 -exec ..

DevOps/Linux 2022.08.17

[Monitoring] DCMG-Exporter 메트릭이 프로메테우스에 수집 안되는 현상

개요 GPU 모니터링을 위해 NVIDIA에서 제공하는 DCGM-Exporter를 설치한 후, 프로메테우스에서 Metrics을 조회해보니 조회되지 않는 현상이 발생하였다. (dcgm-exporter POD에 접속하여, curl 날려본 결과 정상적으로 메트릭을 보내는 것을 알 수 있다.) 원인은 prometheus 설정 부분으로 추측하였다. https://github.com/NVIDIA/dcgm-exporter GitHub - NVIDIA/dcgm-exporter: NVIDIA GPU metrics exporter for Prometheus leveraging DCGM NVIDIA GPU metrics exporter for Prometheus leveraging DCGM - GitHub - NVIDIA/d..

DevOps/Monitoring 2022.08.16

[Monitoring] 프로메테우스란 (Prometheus)

프로메테우스 (Prometheus)란? - 음악 공유 플랫폼인 SoundCloud에서 개발한 시스템 모니터링 및 알람 툴이다. - 오픈소스로 전환되어, kubernetes 다음으로 CNCF에 합류 - metrics 단위로 데이터를 Pull - 수집된 정보들은 시계열 데이터베이스에 저장됨 - PromQL 쿼리 언어를 사용 -https://prometheus.io/ Prometheus - Monitoring system & time series database An open-source monitoring system with a dimensional data model, flexible query language, efficient time series database and modern alerting ..

DevOps/Monitoring 2022.08.04

[AWS] 로드밸런서란? (ALB vs NLB vs CLB)

로드밸런서란? (Load Balancer) 로드밸런서란 서버에 가해지는 부하를 분산해주는 장치이다. 왜 로드밸런서가 필요할까? 서버를 운영하고 있을 때, 서버가 감당하지 못할 트래픽이 오게 되면 해결책은 두 가지가 있다. 서버 스펙을 늘리거나 (scale-up), 서버의 개수를 늘리는(scale-out) 방식으로 문제를 해결하게 되는데, 보통 비용이 더 싸고 안정성 때문에 scale out 방식으로 문제를 해결한다. (서버가 죽더라도 다른 서버가 대체할 수 있는 장점) 서버의 대수를 늘린다고 해서 문제가 단순히 해결되는 것이 아닌, 적당한 서버에 트래픽을 분산시켜줘야 하는데 이 역할을 하는 것이 바로 로드 밸런서이다. (On promise 환경에서는 이것을 L4/L7 스위치라고 칭한다) AWS에서의 로드..

DevOps/Cloud 2022.06.20

[Linux] tar.gz 압축 하기 / 압축 풀기

tar로 압축 하기 tar -cvf [압축파일명].tar [압축할 파일 혹은 폴더 경로] ex) tar -cvf data001.tar data001/ tar로 압축 풀기 tar -xvf [압축파일명].tar tar -xvf data001.tar tar.gz로 압축 하기 tar -zcvf [압축파일명].tar.gz [압축할 파일 혹은 폴더 경로] ex) tar -zcvf data001.tar.gz data001/ tar.gz로 압축 풀기 tar -zxvf [압축파일명].tar.gz tar -zxvf data001.tar.gz tar과 tar.gz의 차이점 tar : 파일만 하나로 묶어, 용량이 줄어들지 않음 tar.gz : tar 파일 자체를 압축해서, 용량이 줄어듦

DevOps/Linux 2022.05.25

[AWS] EFS (Elastic File System)

스토리지 타입 AWS에서 제공하는 EFS를 알아보기 전에, 먼저 스토리지 타입에는 어떤 것이 있는지 알아보자. 스토리지 타입에는 크게 파일(File), 블록(Block), 오브젝트(Object) 형식으로 나눠진다. 각 특징을 알아보자 파일 오브젝트 블록 -일반적으로 흔히 알고 있는 스토리지 -계층 구조로 데이터를 저장함 -오브젝트 기반의 스토리지 -폴더 계층 구조 없이 평면 구조로 저장 -PDF, Video, Audio, Text, Website -블록 기반의 스토리지 -데이터를 고정된 크기의 블록시퀀스로 처리 -각각의 파일이나 오브젝트를 여러 블록에 분산시킴 클라우드 서비스를 사용해본 경험이 있다면 3가지의 차이점을 이해하기 쉬울 것이다. 출처 : RedHat 이러한 스토리지들은 당연하게도 AWS에서도..

DevOps/Cloud 2022.05.19

[Linux] Swap 설정하기 / Swapfile 생성, 삭제 (Ubuntu)

Swap 시스템이 처리하고 있는 데이터를 저장할 RAM이 충분하지 않을 때 스왑 공간에 데이터를 옮겨놓는 방식으로 RAM 공간을 확보한다. (즉, RAM 공간이 부족할 때 하드 디스크 용량을 임시로 쓰겠다는 소리) RAM 보다 속도가 느리기 때문에 RAM의 대체제로 생각하면 안 된다. Swap 설정하기 1. 스왑 파일/파티션 존재 여부 확인 먼저, 아래 명령어로 스왑 파일이나 스왑 파티션이 있는지 확인하자 free -m # swap 파일이 있는 상태 total used free shared buffers cached Mem: 128811 95590 33220 136 54 4762 -/+ buffers/cache: 90774 38036 Swap: 128934 0 128934 #swap 파일이 없는 상태 t..

DevOps/Linux 2022.05.17
반응형