본문 바로가기

데이터분석/금융

(15)
주식의 자율주행 - 강화학습을 활용한 투자 주식시장에서 정보의 불균형을 활용한 수법들은 쉽게 공개되지 않는다. 말 그대로, 정보의 불균형 자체가 수익을 낳기 때문에, 인터넷에서 해당 정보를 공개할 경우 불균형이 깨지면서 수익 창출이 어려워지기 때문이다. 그럼에도 불구하고, 세상에는 다양한 사람들이 있어서 그런 금쪽같은 정보들을 공개하는 사람들이 많다. 물론 개중에는 정보의 균형을 꾀하는 척하며 자신의 이익을 챙기는 사람들도 있다. 이번에 문제가 되었던, 아프리카 개인 방송을 통해 특정 암호화폐를 홍보하는 활동들이 이에 해당할 것이다. 하지만 머신러닝을 활용한 투자의 경우, 학계에서 활발하게 투자법에 대한 논문을 발표하기도 한다. 말 그대로, 금쪽같은 정보들의 공개인 셈이다. "정보의 불균형을 깨뜨리지 말라" 라는 투자업계의 불문율을 비웃기라도 하..
Qraft AI ETF 구성 방법 - 왜 Pabii 블로그는 실패했는가 매주 하는 머신러닝 스터디 발표에서, 원래는 Pabii 블로그와 Qraft Technology의 키보드 배틀을 다루려고 했더랬다. 그런데 Qraft 사의 글을 읽으면 읽을수록 Pabii 블로그의 논지가 점점 말도 안되는 것처럼 느껴졌다. 결국 스터디 발표는 Qraft AI ETF가 어떻게 구성되어 있는지에 대한 내용을 정리했고 Pabii 블로그는 비판 의견 정도로만 삽입되는 데에 그쳤다. 왜 Qraft AI ETF가 설득력이 있고, Pabii 블로그는 실패했는지 오늘 발표를 진행한 이후에 글로 남겨본다. Pabii 블로그 운영자(이경환)가 위 논문을 봤는지는 모르겠지만, Qraft 사에서 AI ETF를 구성하는데 적극 참고한 논문이다. 알고리즘이 상당히 세세하게 설명된 논문이지만, Pabii 블로그의 논..
CAPM과 3 Factor Model의 역사 및 중요 용어 되짚기 Qraft 사와 Pabii 블로그의 키보드 배틀 사건을 스터디 발표자료로 정리하던 중에 2018년도 1학기 투자론 수업을 다시 한 번 복습하게 되었다. 당시에는 그냥 저냥 지나갔었는데, 이제 보니 왜 이렇게 헷갈리는 것이 많은지 어떻게 이런 것들을 다 그냥 지나치고 공부했는지 모를 일이다. 그것과는 별개로, 한 번 더 재무 공부를 포괄적으로 하고 나니 투자에 대한 이해도가 확실히 넓어지는 것을 느낀다. 가장 큰 요인은, 알파니 베타니 하는 상징적인 용어들을 이해하는 데서 온 것이다. 내용을 블로그로 다시 정리하면서 머리에 남겨야겠다. 1. CAPM (Capital Asset Pricing Model), Sharpe & Lintner, 1964 서울대 컴공과 문병로 교수가 집필한 메트릭 스튜디오에는 CAP..
Qraft 사와 Pabii 블로그 - AI와 계량경제학의 키보드 배틀 친구가 "너 이거 본 적 있냐?" 해서 알게 된 블로그가 있다. AI를 투자에 활용하겠다는 Qraft Technology 사를 신랄하게 비판하는 블로그였는데 두 회사를 처음 들어보는 상태였다. 알고 보니, Qraft는 자체 선별한 종목으로 ETF를 만들어 뉴욕 증시에 상장해서 2020년 12월 기준 시장 지표 성장률을 15% 이상 웃도는 수익률을 보인 정도로 현재 승승장구하고 있는 회사였고, 해당 블로그는, 누군지는 모르겠지만 데이터 사이언스를 공부해서 스타트업을 운영 중인 사람으로 보였다. 둘 사이 사건의 전말은 이렇다. 1. 발단 Qraft 사에서 자신들 알고리즘을 홍보하는 간략한 글을 Brunch에 올렸다. 요지는 이러하다. "효율적 시장가설을 깨부순 3-Factor-Model이 노벨경제학상을 수상..
Python를 활용한 코스피 재무 데이터 확인 방법 3 + 1가지 "데이터를 만지려면 크롤링은 기본이지" 이렇게 말한 친구가 있었다. 크롤링이란, 인터넷에 있는 데이터를 코드를 통해 자동으로 긁어오도록 만드는 작업을 뜻하는데 예를 들면 네이버 금융을 통해 조회한 네이버 주가 정보 중에서 실시간으로 업데이트되는 내용을 자동으로 받아올 수 있다. 물론 맞는 말이다. 하지만 실시간으로 업데이트 되는 내용이 굳이 필요하지 않다면, 다시 말해 분기별로 발표되는 재무제표 데이터를 확인하고 싶다면 굳이 크롤링의 영역까지는 넘어가지 않아도 된다. 이미 관련 정보들을 잘 정리해 놓은 API가 많이 존재하기 때문이다. API는 코딩계의 프로그램이자 공식이라고 생각하면 된다. 원의 둘레를 구할 때, 열심히 미분과 적분을 때려가며 구하는 것이 크롤링이라면 2*$\pi$ * R 에서 R 값만..