약한 신호 50개를 이기는 거래로 — 헤지펀드 알파 결합법 (x.com) ↗
핵심 요약
Fundamental Law of Active Management(IR = IC × √N)가 말하는 핵심: 완벽한 신호 1개를 찾는 대신, 약한 신호 N개를 독립적으로 결합하면 정보비율이 √N으로 확장된다. 11단계 결합 엔진과 예측시장 적용까지.
- Fundamental Law of Active Management: IR = IC × √N — 시스템 성능은 신호 개수의 제곱근으로 확장
- 기관급 신호의 정보계수(IC)도 0.05~0.15 수준 — 즉 최고 신호조차 대부분의 시간 동안 틀림
- IC 0.05짜리 신호 50개 결합 → IR 0.354. 단일 IC 0.10 신호 대비 3배 이상 강력
- 11단계 결합 엔진은 신호 간 숨은 상관관계를 제거하고 진짜 독립 기여분만 가중치에 반영
- Polymarket 같은 예측시장에도 동일 프레임워크 적용 가능
- 백엔드 개발자·정량 트레이딩 시스템 작업자 Roan 작성
왜 단일 신호로는 절대 이길 수 없나?
- 시장은 경쟁적이라 강한 엣지에는 자본이 몰려 압축됨 — 그래서 IC가 0.05~0.15 구간에 머무름
- IC 1.0 = 완벽 예측, 0.0 = 순수 노이즈. 현실의 최고 신호도 대부분 틀림. 이것이 실패가 아니라 시장의 본질
- 약한 신호 N개를 독립적으로 결합하면 시스템 정보비율은 √N으로 확장됨
- IR = IC × √N → 50개 신호(IC 0.05) = IR 0.354. 단일 IC 0.10 신호 대비 3배+
- 헤지펀드가 한 명의 천재 대신 수백 명의 리서처를 고용하는 수학적 이유
신호의 5가지 원재료
| 카테고리 | 핵심 메커니즘 |
|---|---|
| 모멘텀 | 단기 추세 지속 + 중기 반전. 룩백 d의 신호별 최적화가 핵심 |
| 평균회귀 | 동일 산업·이벤트·자산군 내 상대가격 괴리를 측정 |
| 변동성 | 내재 vs 실현 변동성 갭. 변동성 위험 프리미엄 활용 |
| 팩터 | Value, Momentum, Low Vol, Carry, Quality 등 검증된 프리미엄 |
| 마이크로구조 | 호가 불균형, 유효 스프레드, 거래 공격성. 정보 비대칭 신호 |
- 어떤 카테고리도 단독으로는 시스템 엣지에 부족 — 결합 엔진의 입력값일 뿐
11단계 알파 결합 엔진은 무엇을 하나?
- 신호별 과거 수익률 시계열 R(i,s) 수집
- 시간축 디민 — 시장 레짐 편향 제거
- 표본 분산 σ(i)² 계산
- 표준편차로 정규화 → 모든 신호가 동일 스케일 위에 놓임
- 가장 최근 관측치 제거 (룩어헤드 방지)
- 횡단면 디민 — 같은 시점의 모든 신호 평균을 빼서 공통 시장 효과 제거
- M-1 기간 유지 (잔여 룩어헤드 차단)
- d일 이동평균으로 기대 수익 E(i) 계산 후 σ(i)로 정규화
- E를 횡단면 디민 시계열 Λ(i,s)에 무절편 회귀 → 잔차 ε(i)가 진짜 독립 엣지
- 가중치 w(i) = η × ε(i) / σ(i) — 독립 엣지에 비례, 노이즈에 반비례
- |w| 합이 1이 되도록 정규화 (의도치 않은 레버리지 차단)
- 핵심은 9단계 — “어느 신호가 가장 큰 기대수익을 갖는가”가 아니라 “어느 신호가 다른 신호들로 설명되지 않는 독립 정보를 갖는가”를 묻는다
진짜 N은 신호 개수가 아니다
- IR = IC × √N의 N은 “독립” 신호의 유효 개수
- 50개 상관 신호 = 실효 10~15개 정도. 진짜 독립적인 50개와 큰 차이
- 자신이 20개 독립 신호라 믿지만 실제 6개일 수 있음 → 6개 기준 사이즈 대비 3배 큰 포지션 = 블로업의 구조
- 분석은 옳았는데 손실 보는 트레이더 대부분은 측정하지 않은 상관관계에 당한 것
예측시장(Polymarket)에 어떻게 적용하나?
- 수익률 신호 대신 “내재 확률” 신호로 치환
- 입력 5종 이상: 거래소 간 가격 갭, 과거 해소율, 베이지안 업데이트, VPIN+유효 스프레드, 모멘텀
- 11단계 엔진 → 단일 결합 확률 → 시장 가격 대비 갭이 엣지
- 사이징은 경험적 켈리: f_empirical = f_kelly × (1 − CV_edge)
- CV_edge는 1만 회 몬테카를로 시뮬레이션으로 추정 — 체감 확신이 아닌 실측 불확실성에 맞춰 자동 조정
- 5
15% 가격대의 시장이 실제로 49%만 YES로 해소되는 체계적 미스프라이싱은 단일 모델 트레이더들이 만든 갭
IC 0.05짜리 신호도 의미가 있나요?
혼자서는 거의 무의미하지만 진짜 독립적인 신호 50개를 결합하면 시스템 정보비율이 √50배 = 약 7배 증폭됨. 핵심은 결합 후 시스템 성능이지 개별 신호 강도가 아님. 강한 신호 1개를 찾으려는 노력 자체가 잘못된 탐색.
11단계 절차 없이 신호를 단순 평균하면 안 되나요?
신호 간 숨은 상관관계가 가중치를 왜곡함. 단순 평균은 같은 정보를 중복 카운트해서 실제 독립 N보다 작은 시스템을 큰 N으로 착각하게 만듦. 횡단면 디민 + 잔차 회귀가 이걸 구조적으로 제거함.
1인 트레이더도 이 프레임워크를 쓸 수 있나요?
신호를 직접 만들 수 있고 IC 측정·역사 검증 인프라가 있다면 동일하게 적용 가능. 다만 단일 모델·단일 데이터 소스에 베팅하는 한 구조적 우위는 만들기 어렵다는 것이 핵심 시사점. 강한 신호 하나에 집착하지 말고 약한 신호 여러 개의 독립성을 검증하는 데 시간을 쓰는 게 수학적으로 옳다.
관련: 정량적 프레임워크로 의사결정한다는 점에서 YC의 가격 책정법 — 가치의 1/3을 청구하라 글과 함께 보면 유용합니다. 데이터 기반 분석 관점으로는 a16z의 AI 도입 현황 분석도 참고하세요.
관련 글
뉴스레터 구독
매주 엄선된 1인기업 뉴스를 이메일로 받아보세요.