퀀트 투자는 데이터에서 출발한다. 종목을 분석하든, 전략을 백테스트하든, 가장 먼저 마주치는 것은 가격 데이터다. OHLCV가 무엇인지, 수익률을 어떻게 계산하는지, 시가총액이 왜 중요한지. 이후 모든 지표와 전략의 전제가 되는 기초 용어다.

OHLCV

OHLCV는 하루 동안의 가격 움직임을 다섯 가지 숫자로 요약한 것이다.

약어의미설명
O(Open)시가장이 시작될 때의 가격
H(High)고가하루 중 가장 높았던 가격
L(Low)저가하루 중 가장 낮았던 가격
C(Close)종가장이 마감될 때의 가격
V(Volume)거래량하루 동안 거래된 주식 수

대부분의 퀀트 분석은 종가(Close)를 기준으로 한다. 종가는 하루의 최종 합의 가격이며, 수익률 계산, 이동평균, 기술 지표 등에서 기본 입력값으로 사용된다. 시가는 전일 종가와 차이가 있을 수 있는데, 이를 (Gap)이라 한다. 장 마감 후 뉴스나 해외 시장 변동이 반영되기 때문이다.

거래량은 가격의 신뢰도를 보여준다. 가격이 올랐는데 거래량이 적다면 소수의 거래로 인한 일시적 변동일 수 있다. 반대로 거래량이 동반된 상승은 시장 참여자들의 합의가 반영된 움직임이라 판단할 수 있다.

OHLCV 데이터는 Yahoo Finance, 한국투자증권 API, KRX 정보데이터시스템 등에서 수집한다.

수익률

수익률은 투자 성과를 측정하는 가장 기본적인 지표다. 같은 수익률이라도 계산 방식에 따라 두 가지로 나뉜다.

단순 수익률

단순 수익률 = (오늘 종가 - 어제 종가) / 어제 종가

직관적이다. 어제 10,000원이던 주식이 오늘 10,500원이 되었다면 수익률은 5%다. 하루 단위로 보면 정확하다.

문제는 여러 기간의 수익률을 합산할 때 발생한다. 1일차에 +10%, 2일차에 -10%라고 하자. 단순히 더하면 0%지만, 실제로는 원금이 줄어든다.

10,000원 × 1.10 = 11,000원  (1일차)
11,000원 × 0.90 = 9,900원   (2일차)

결과는 -1%다. 단순 수익률의 산술 합(+10% + (-10%) = 0%)은 실제 수익률과 다르다. 이 문제를 해결하는 것이 로그 수익률이다.

로그 수익률

로그 수익률 = ln(오늘 종가 / 어제 종가)

자연로그를 사용한 수익률이다. 로그 수익률의 핵심 장점은 시간에 대해 합산 가능하다는 점이다.

1일차 로그 수익률: ln(11,000 / 10,000) = 0.0953
2일차 로그 수익률: ln(9,900 / 11,000)  = -0.1054
합계: 0.0953 + (-0.1054) = -0.0101

이 합계를 다시 실제 수익률로 변환하면 e^(-0.0101) - 1 ≈ -1.00%로, 실제 결과와 일치한다.

퀀트 분석에서는 로그 수익률을 선호한다. 여러 기간의 수익률을 더하거나, 통계적 분석(정규분포 가정)을 적용할 때 수학적으로 다루기 쉽기 때문이다. 다만 일간 수익률이 작은 경우(±5% 이내) 두 수익률의 차이는 미미하다. 차이가 유의미해지는 것은 변동성이 큰 구간이나 장기 누적 수익률을 다룰 때다.

시가총액

시가총액 = 현재 주가 × 발행 주식 수

시가총액은 시장이 해당 기업에 매기는 총 가치다. 주가만으로는 기업의 크기를 비교할 수 없다. 주가가 5,000원인 기업이 주가 500,000원인 기업보다 시가총액이 클 수 있다. 발행 주식 수가 다르기 때문이다.

규모 분류

시가총액은 종목을 규모별로 분류하는 기준이 된다. 한국 시장 기준으로 한국거래소(KRX)는 KOSPI 200, KOSPI 중형주, KOSPI 소형주 등으로 구분한다. 일반적으로 사용되는 분류 기준은 다음과 같다.

분류한국 시장 기준 (대략)
대형주시가총액 상위 100개 내외 (KOSPI 200 구성 종목)
중형주대형주 아래, 상위 300개 내외
소형주그 이하

미국 시장에서는 대형주를 시가총액 100억 달러 이상, 소형주를 20억 달러 미만으로 분류하는 것이 일반적이다.

스크리닝에서의 역할

퀀트 전략에서 시가총액은 종목 필터링의 첫 관문이다. 소형주는 거래량이 적어 실제로 매수/매도가 어려울 수 있고, 가격 변동성이 크다. 백테스트에서는 좋은 성과를 보여도 실전에서 재현하기 어려운 경우가 많다. 이런 이유로 최소 시가총액 기준을 설정하여 소형주를 제외하는 것이 일반적이다.


OHLCV는 가격 데이터의 기본 단위이고, 수익률은 성과를 측정하는 언어이며, 시가총액은 종목의 규모를 판단하는 기준이다. 이 세 가지가 이후 밸류에이션, 퀄리티, 모멘텀 지표를 이해하기 위한 전제가 된다.

다음 글에서는 기업의 가치와 질을 숫자로 판단하는 밸류에이션과 퀄리티 지표를 정리하려 한다.

참고 자료