사용량 모니터링 가이드
예상 소요 시간: 5분
LaaS 사용량 모니터링 기능을 활용하면 그룹, 프로젝트, 프리셋의 AI 리소스 사용 현황을 실시간으로 확인하고, 최적의 운영 전략을 수립할 수 있습니다.
이 가이드는 사용량 데이터의 주요 구성 요소를 이해하고, 효과적인 비용 절감 전략을 세우는 데 도움이 됩니다.
1. 개요
LaaS의 사용량 모니터링 기능은 사용자가 그룹, 프로젝트, 프리셋 단위로 AI 모델의 리소스 사용량을 실시간으로 확인하고 분석할 수 있도록 지원하는 도구입니다.
이를 통해 비효율적인 리소스 사용을 감지하고, 운영 비용을 최적화하는 전략을 세울 수 있습니다.
📌 주요 기능
실시간 사용량 모니터링 및 시각화된 데이터 제공
그룹, 프로젝트, 프리셋 단위로 리소스 사용량 비교 가능
특정 모델별 사용량 분석 및 최적화 지원
토큰 소비 패턴을 분석하여 비용 절감 전략 마련
🔗 사용량 대시보드 바로가기
사용량 대시보드
2. 사용량 모니터링 기능
2.1 그룹, 프로젝트, 프리셋 단위 사용량 확인
사용자는 3단계 계층 구조(그룹 → 프로젝트 → 프리셋)를 기준으로 사용량을 확인할 수 있습니다.
- 
그룹 단위: 특정 그룹 내 모든 프로젝트와 프리셋의 리소스 사용량을 한눈에 파악
 - 
프로젝트 단위: 개별 프로젝트의 모델 호출 횟수 및 비용 분석
 - 
프리셋 단위: 특정 프리셋에서 사용된 AI 모델별 리소스 사용량 상세 확인
 
각 단위에서 제공되는 주요 정보:
- 
총 토큰 사용량: 입력 및 출력 토큰 총합
 - 
평균 토큰 사용량: 요청당 사용된 평균 토큰 수
 - 
요청 횟수: 특정 기간 동안 실행된 API 호출 횟수
 - 
모델별 사용량: 특정 모델이 차지하는 리소스 비율
 
🔗 프로젝트 사용량 제어 기능
프로젝트 사용량 제어
2.2 실시간 사용량 차트 및 분석
LaaS 사용량 대시보드는 실시간 데이터를 시각적으로 제공하여 운영 상황을 쉽게 파악할 수 있도록 돕습니다.
- 
토큰별 사용량 분석
- 
입력 토큰과 출력 토큰을 분리하 여 확인 가능
 - 
특정 요청이 과도한 리소스를 소비하는지 즉시 감지 가능
 
 - 
 - 
모델별 사용량 분석
- 
GPT-4, GPT-3.5, Claude, Solar Mini 등의 모델별 사용량 비교
 - 
비효율적인 모델 사용 감지 및 비용 절감 방안 모색
 
 - 
 
🔗 모델별 비용 확인
모델별 비용
3. 비용 최적화 및 절감 전략
효율적인 AI 리소스 운영을 위해 사용자는 아래와 같은 전략을 활용할 수 있습니다.
3.1 비용 최적화를 위한 모델 선택
- 
복잡한 요청은 GPT-4, 일반적인 요청은 GPT-3.5를 사용하는 혼합 전략 적용
 - 
모델별 비용을 비교하여 저비용 모델로 전환 가능성 검토
 - 
불필요한 API 호출 최소화하여 토큰 사용 절감
 
예시: GPT-4에서 실행 중인 프로젝트의 60%를 GPT-3.5로 전환하여 연간 40% 비용 절감
🔗 모델 변경 방법 가이드
API 배포 및 릴리즈
3.2 사용량 한도 설정 및 초과 방지
LaaS에서는 그룹 및 프로젝트 단위로 사용량 한도를 설정할 수 있습니다.
- 
월간 사용량 한도 설정: 예산 초과를 방지하고 비용을 효과적으로 관리
 - 
사용량 초과 시 알림 기능: 프로젝트가 설정된 한도를 초과할 경우 즉시 알림 제공
 
📌 예제:
A 기업은 프로젝트별 월간 사용량을 설정하고, 고비용 모델을 제한하는 전략으로 25%의 비용 절감 효과를 거두었습니다.
🔗 프로젝트 사용량 제한 설정 방법
사용량 제한
