트렌드 한눈에 보기 (209) 썸네일형 리스트형 PyTorch를 활용한 DQN Tutorial - Pytorch vs Tensorflow 이제 막 강화학습을 시작하는 단계에서 PyTorch와 Tensorflow 중에서 어떤 툴을 사용해야 하는지 고민이 된다. 이런 걸로 고민하고 있다는 것은 사실 강화학습에 대한 근본적인 이해가 부족하다는 것이다. "기본이 따악 잡혀있으면, 그런 툴 정도는 도구로 활용할 수 있는거야!" 하면서 일갈하는 사람도 있겠다만, 나로서는 마땅히 대꾸할 방법이 없다. 그래도 PyTorch vs Tensorflow로 검색해보면 많은 사람들이 같은 고민을 하는 중이라고 생각된다. 그런 글들도 역시 마땅한 결론은 없다. Tensorflow가 딥마인드(구글)의 힘을 얻어 사용되는 중인 반면에 PyTorch는 마땅히 비빌 언덕도 없을텐데 최근 들어 더 많이 쓰이기 시작한 툴은 PyTorch라는 것이다. 보면 대단하기도 하고, .. 탐조 입문자를 위한 딥러닝 활용기 - 1편 마산에서 저어새를 찍음으로써, 한 가지 취미가 확실해졌다. 새를 관찰하는 일이 즐겁기 그지 없구나! 그렇다면 투자를 조금 더 해서 탐조용 카메라를 맞춰볼까? 바로 "탐조 입문용 카메라 추천"을 검색해보았다. 카메라 사는 것은 바로 포기했다. 아니 21세기의 20%가 지난 2021년에, 100배 줌이다 뭐다 "카메라 휴대폰으로도 이렇게 찍을 수 있구나" 난리법석 왁자지껄한데 새 좀 찍는 카메라에 100만은 택도 없다는 게 현실인가? 믿기지 않는다. 그래서 과학의 힘을 빌려보기로 했다. 2018년 9월에 발표된 ESRGAN이라는 논문이 Tensorflow 블로그에 잘 설명되어 있어서 "이거다" 싶었다. 살짝 오래되었다는 점이 흠이지만, 일단 시험삼아서 해본 뒤에 차차 발전시켜 나가면 될 일이다. 내가 찍은 .. 트럼프가 집으로 가지고 간, 미국 핵가방의 역사와 사용법 미국 대통령이 나오는 드라마, 영화 등에 꼭 나오는 장면이 있다. 어떤 밀폐된 공간에서 국방장관이며 각종 군대 인사들과 다른 장관들 그리고 대통령이 심각하게 회의를 하는 모습이다. "아, 그냥 회의실인가보다" 하고 무심결에 지나갈 수 있는 장면인데 '백악관 상황실'이라는 엄연한 정식 명칭이 붙어있는 곳이다. 이런 이름까지 붙여놓은 회의실이 존재하는 이유는 그 자리에서 바로 핵 미사일을 발사시킬 수 있기 때문이다. 물론 공사가 다망한 미국 대통령이 핵 미사일 발사를 위해 하루 종일 상황실에만 있을 수는 없는 노릇인지라 원격 발사가 가능한 핵 가방을, 대통령 이동시에 군인 수행원이 항상 가지고 다닌다. 아쉽게도 핵가방 안의 모습이 어떤지는 사진으로 나와있는 것이 없지만 대통령 수행원으로 근무했던 군인이 자세.. 한국 정부에서 1600억을 들여 개발 중인 아이언맨 슈트 알키미스트 프로젝트라는 것이 있다. 금을 만들겠다는 허황된 꿈을 향해 정진했던 연금술사들처럼 산업의 초고난도 문제를 해결하기 위해 대규모의 예산을 지원해주는 국가 사업이다. "뭐 얼마나 어려운 문제이길래 국가에서 나서서 풀라 그래?" 하고 생각할 수 있다. 예시 문제는 아래와 같다. 1분간 충전해서 600km를 가는 전기차나, 100m를 7초에 돌파하는 로봇 슈트 같은 개념은 아무래도 공무원들이 마블 영화를 너무 재밌게 봤나보다- 싶은 주제들이다. 하지만 진짜로 이런 주제들로 연구팀을 선정해서는 열심히 준비 중인 것이다. 위 목록은 19년도 지원 대상이니, 올해로 2년차 연구에 접어들었을 것이다. 나로서는 강건너 불구경하듯 말하고는 있지만, 오늘만 해도 하루 종일 참고문헌 논문들만 읽다가 집으로 돌아온 .. PyTorch 튜토리얼, 60분 내로 끝낼 수 있을까? 강화학습을 pytorch로 구현하는 게 좋다는 말을 들었다. 사실 tensorflow든, pytorch든 기본적인 구조는 동일하기에 사투리 정도로 치부하는 사람이 있다. 하지만 일본어 자체를 모르면 오사카 사투리든, 도쿄 표준어든 외국어인 것은 마찬가지이므로 pytorch 튜토리얼을 차근차근 진행해보았다. 해당 튜토리얼은 pytorch 공식 사이트에서 제작해서는 60분짜리 튜토리얼이라고 대놓고 강조하고 있는데 실제로 해보니 정말 그렇다. 네 개의 미니 세션으로 이뤄져 있으며 각 세션은 구글 코랩과 연동되어 있어서 바로 바로 코드를 돌리며 확인할 수 있다. 코랩을 이용하면 GPU가 미약한 내 컴퓨터에서도 당당히 pytorch GPU 버전을 사용할 수 있다. 블로그를 주욱 읽어 내려가면 자연스럽게 이해할 수.. [CS234] Lecture 16: Monte Carlo Tree Search 정리 CS234 대망의 마지막 강의를 장식하는 주제는 Monte Carlo Tree Search[MCTS]이다. 몬테카를로는 익히 배웠던 비효율적인 방식인데다가 Tree Search라고 하면 가지치기로 결정을 내리는 이미지가 있어서 그런지 그동안 배웠던 멋진 Policy Gradient 따위의 알고리즘을 제치고 마지막 강의로 쓸 법한 내용이 맞긴 한가 하는 의문이 든다. 하지만 MCTS는 생각보다 굉장히 중요한 알고리즘이라고 한다. 알파고에 적용되어 있을 뿐만 아니라, 모델이 주어진 경우의 강화학습에 대한 이해를 높여준다나. 일단 알파고가 나온지도 5년이 지났는데(군대에 있었다), 아직도 알파고 하면 멋져보인다는 것은 나름대로 문제가 있다. 또한 모델이 주어진 경우의 강화학습은 왜 이렇게 많이 나오는 건지 모.. LG 롤러블 스마트폰은 롤러블 TV와 뭐가 다를까? 2020년 10월 출시된 LG 롤러블 TV의 발표 타임라인이다. 2016년과 2018년 CES에서 발표한 주체는 LG 디스플레이였기 때문에ㅓ 아직 제품화 단계가 아니었다고 칠 수 있지만, 2019년에 롤러블 TV를 발표해놓고 2년이나 지난 뒤에 롤러블 스마트폰을 발표하는 이유는 무엇일까? 단순히 생각해보더라도, 화면에 물리적인 변형이 가해졌을 때 이득을 보는 제품은 TV가 아니라 스마트폰이다. 도대체 TV가 접었다 펼쳐졌을 때 받을 수 있는 이득이 무엇일까? 깔끔한 배치를 좋아하는 미니멀리스트들이야 "아, TV가 거실에 없으니 속이다 시원하군" 하고 좋아하겠지만 일반인으로서는 TV는 문신처럼 거실 한켠에 묵묵히 자리잡은 존재이다. 문제는 LG전자의 사업부 구분에서 찾을 수 있다. 프리미엄 TV, 모니터 .. 쿠팡이 나스닥 상장을 노리게 된 이유와 한국기업들의 나스닥 도전사 난 처음 알았지만, 쿠팡의 목표는 처음부터 나스닥 상장이었다고 한다. 블룸버그 통신은 발빠르게도, 작년 1월 기사에서부터 "쿠팡이 2021년 나스닥 상장할 것이다" 라는 기사를 싣기도 했다. 도대체 어떻게 이렇게 정보가 빠르게 퍼지는지 모를 일이다. 아니면 모든 종류의 정보가 떠다니다가, 어떤 일이 일어난 이후에는 그것과 관련된 정보만 남는 것일지도 모른다. 어쨌거나, 왜 갑자기 나스닥이지? 하는 의문이 들었다. 2020년 7월 기준 누적 적자만 3조 7000억 원이 넘는다고 하니 적어도 흑자 전환은 한 뒤에 상장을 해야 하는 것은 아닌가 싶기도 했다. 이제까지 한국 기업 중에서 나스닥에 상장해서 아직도 살아있는 사례는 한 곳 뿐이다. 그라비티(Gravity)인데, 처음 들어봤을 때는 뭐하는 곳이지 싶었.. [CS234] Lecture 15: Batch RL 정리 14강은 Chelsea Finn 교수의 Meta-Learning 강좌였고 15강은 Batch Reinforcement Learning의 차례이다. 사실 CS231n강좌를 들을 때에도 Batch Normalization은 욕하면서 넘겼기에(이해가 안된다 퉤퉤) 오히려 Meta-Learning 강의를 듣고 싶었는데, 아쉽게도 해당 영상은 유튜브에 업로드 되지를 않았다. 근데 이참에 batch류에 대해 이해할 수 있다고 생각하니, 오히려 좋아. Batch RL이 상정하는 문제는 다음과 같다. 치료 과정의 경우, 주사를 맞고 약을 먹는 것과 약을 먹고 주사를 맞는 경우에 회복률 차이가 존재하는지? 그 차이를 정확히 감별하기 위해 필요한 정보는 무엇인지? 일반화해서 말하자면, 기존 프로세스가 있을 때 순서를 바꿈.. [CS234] Lecture 13: Fast Learning III 정리 (2) 13강에서 MBIE-EB에 대한 설명은 정말 똥이다. 웬만큼 중요한 내용이라면 구글에 영어로든 한국어로든 튜토리얼 글이 올라와 있을텐데, 전혀 없다. 그래서 그냥 넘기기로 했다. 퉤퉤퉤. 다음 내용은 Model-Based RL에 Baysian 을 적용하는 것이다. 실생활에서는 Model Based 자체가 성립하지 않기 때문에 상세한 알고리즘 보다는, Model-free Control에 사용하기 위해서 중요하게 여겨야 하는 점들을 위주로 공부하면 될 것 같다. 또 헷갈리는 용어가 많이 등장하는데, 우선, 상태 전환 확률 매트릭스인 T는 Multinomial Distribution으로 나타난다고 한다. Binomial Distribution이 동전의 앞면 뒷면 같은 분포였다면 유한한 n개의 선택지가 있을 때.. 이전 1 ··· 15 16 17 18 19 20 21 다음