본문 바로가기

트렌드 한눈에 보기/학계 트렌드

(114)
Diffusion Model을 이해해보자 4편 - CIFAR10 튜토리얼 해석 새로 찾은 튜토리얼을 분석해보니, 혼란만 가중된다. 이게 맞나? 다른 튜토리얼을 찾아 검증하기 전에 현재 튜토리얼을 정리해보고 어떤 점이 혼란스러운지 확인해보자.Make Diffusion model from scratch ( easy way to implement quick diffusion model ) | by Seachaos | tree.rocks Make Diffusion model from scratch ( easy way to implement quick diffusion model )This article is a tutorial on building a diffusion model from scratch by yourself. ( using TensorFlow / also have a Py..
Diffusion Model을 이해해보자 3편 - 새로 찾은 튜토리얼 도전 Diffusion Model을 이해해보자 2편 - chatGPT로 튜토리얼 생성 망한 이유 (tistory.com) 에서 이어집니다. CIFAR10을 사용하는 최대한 간단한 예제를 찾으려고 했지만, 녹록지가 않다. 그도 그럴 것이, 노이즈를 만들고 복구하는 과정에서는 일반 딥러닝도 아니고 U-Net 정도는 들고 와야 제대로 된 성능을 보여줄 수 있다. U-Net으로 말하자면, 기본적인 레이어 수만 8개 이상이라고 볼 수 있을 정도로 복잡한 CNN 모델이다. 지난 튜토리얼에서는 CNN 두 세 개 레이어만 가지고 모델을 만들었지만, 애초에 작동하지 않았을 것이다.  Make Diffusion model from scratch ( easy way to implement quick diffusion model ..
Diffusion Model을 이해해보자 2편 - chatGPT로 튜토리얼 생성 망한 이유 Diffusion Model을 이해해보자 1편 - 태초마을 (tistory.com) 에서 이어집니다.  뭐, 해볼라면 해볼수도 있었겠지만, introduction 이후의 논문은 잠시 미루기로 했다. 사실 내 머리만으로는 이런 복잡한 수식들을 이해하기도 힘들고, 언제까지 기억할 수 있을런지도 확신이 들지 않는다. 그래서 파이썬 실습을 통해 구조를 익힌 뒤에 다시 논문으로 돌아오기로 했다. 파이썬 실습을 하는 방법은, 다양하게 있겠지만 난 요즘 그렇듯 chatGPT를 활용했다. 질문하기에도 훨씬 편하고, 원하는 수준의 튜토리얼을 설정할 수 있다. 참 공부하기 쉬워진 세상 아닌가? 그래서 더 공부하게 되지 않는 것 같기도 하지만. 전체 코드는 아래와 같다.더보기 class DiffusionModel(tf.ke..
Diffusion Model을 이해해보자 1편 - 태초마을 회사에서는 간단한 CNN, 그보다 더 간단한 SVM을 주로 쓰고 있다. 애초에 더 높은 수준의 모델이 돌아갈 연산능력도 되지 않는 보드를 쓰고 있기 때문에, 한계가 명확하다. 하지만 언제까지 한계 속에서 머무를 수는 없는 법, 더 높은 수준의 모델을 일단 자습해보기로 했다. 내 개인적 목표가 있다면, 간단한 수준의 웨어러블 센서만으로도 착용자의 자세를 모델링할 수 있는 서비스를 만드는 것이다. 그럴려면, 일단 사용자의 자세를 보여줄 수 있는 generative AI에 대한 이해가 필요할 것이라고 생각했다. 그래서 관련 강좌를 찾아보는데 웬걸, 일반 강좌들은 죄다 CNN부터 시작한다. 돈을 주고 강의를 들으려고 해도, 거기서부터 들을 수는 없는 노릇이다. 그래서 그냥 논문들을 찾아보면서 공부해보기로 했다...
예제와 함께 단숨에 이해하는 Lyapunov Stability [2/2] 1편에서 이어집니다. 예제와 함께 단숨에 이해하는 Lyapunov Stability [1/2] 0. 배경 "단숨에"라는 부사와 [1/2]라는 편명이 조화롭지 않다는 것은 알고 있다. 하지만, Lyapunov를 단숨에 이해하기는 불가능하다. 혹시 너무 직관적으로 이해하고 있다면, 제대로 이해하지 못했 mech-literacy.tistory.com 1편을 쓴 지 17일이 지났는데, 이제서야 2편을 쓰는 이유는 오늘에서야 Lyapunov를 이해했기 때문이다. 이해라기 보다는 계산 방법을 깨달았다는 수준에 그치겠지만, 여튼 내가 사용할 수 있기까지 2주가 넘는 시간이 걸렸다. 이게 뭐라고... 싶지만, 막상 알고보니 이거 참 유용하다. 예제를 활용한 Lyapunov stability 계산법, 정확히는 Maxim..
예제와 함께 단숨에 이해하는 Lyapunov Stability [1/2] 0. 배경 "단숨에"라는 부사와 [1/2]라는 편명이 조화롭지 않다는 것은 알고 있다. 하지만, Lyapunov를 단숨에 이해하기는 불가능하다. 혹시 너무 직관적으로 이해하고 있다면, 제대로 이해하지 못했다는 증거일 테다. 하지만 한 번 이해하고 나면, 이름에서 오는 간지와 더불어 나 이제 완전한 공학도로 거듭났구나 하는 뽕맛도 느낄 수 있다. 게다가 웬걸, 한 번 이해하고 나면 아 이런 간단한 거구나! 하는 상쾌함도 다가온다. 이에 간단한 예제 (보행 상황에서 Lyapunov stability 확인) 와 함께 Lyapunov stability를 설명하는 글을 작성해봤다. 나처럼 이야기 좋아하는 사람들은 본격적인 리야푸노프 튜토리얼 자체보다는 그 개개인에 대한 역사를 좀 더 흥미로워한다. 사실 리야푸노프..
[Bayesian 1차] 모르면 모른다 말하는 Deep Learning - "What Uncertainties Do We Need in Bayesian Deep Learning for Computer Vision?" 저자인 Alex Kendall은 2017년 SegNet이라고 하는 Encoder-Decoder 구조를 발표하면서 해당 분야의 선두주자로 뛰어오른 바 있다. 잘 감이 안오겠지만, 생성형 AI (Generative AI)의 두 분야가 1) Encoder/Decoder 구조 2) Generative Adversarial Network (GAN) 라고 생각하면 된다. 그 중 천하통일을 하고 있는 것이 Encoder/Decoder 구조인 것이다. 다른 저자인 Yarin Gal 역시 젊은 나이에 해당 분야에서 두각을 나타내며 현재는 영국 Oxford의 교수를 하고 있다. 2020년부터 200여개 가까운 연구결과물을 발표했으니, 성과가 상당하다. Encoder/Decoder 구조를 더 잘 이해할 수 있으면 좋겠지만,..
[2023 ver.] tensorflow에서 GPU를 사용하는 방법 Windows 개발 환경은 하루가 멀다 하고 바뀌기 때문에, 종이 책으로 공부하는 것은 절대로 추천하지 못한다. 심지어 인터넷 자료들조차도 라이브러리 업데이트 속도를 따라가지 못하는 경우가 허다하다. 아래 자료가 가장 최신 (2023년 11월 기준)으로, Windows 11 / Tensorflow 2.10 이하 / python 3.9 이하에서 GPU를 사용하는 방법을 정리한 것이다. pip로 TensorFlow 설치 pip로 TensorFlow 설치 Learn the latest in machine learning, generative AI, and more at WiML Symposium 2023Register 이 페이지는 Cloud Translation API를 통해 번역되었습니다. Switch to English..
Transformer 를 Classification/Regression에 사용하려면 어떻게 해야 할까 [2화] Transformer 이해를 하기 위해 필요한 것들 [1화] (tistory.com) Transformer 이해를 하기 위해 필요한 것들 [1화] "Attention is all you need", Transformer 모델을 처음으로 제시한 2017년 논문의 제목이다. [1706.03762] Attention Is All You Need (arxiv.org) 익살스러운 이름이지만, 2023년 11월 현재 97,503 건의 피인용수를 자랑한다. mech-literacy.tistory.com Transformer 를 통해 번역기 모듈을 만든다면 모르겠지만, Regression 혹은 Classification에 Transformer를 적용하기 위해서는 약간의 시행착오가 필요하다. Transformer의 구조..
Transformer 이해를 하기 위해 필요한 것들 [1화] "Attention is all you need", Transformer 모델을 처음으로 제시한 2017년 논문의 제목이다. [1706.03762] Attention Is All You Need (arxiv.org) 익살스러운 이름이지만, 2023년 11월 현재 97,503 건의 피인용수를 자랑한다. 저자들은 모두 구글 브레인 소속이었지만, 현재는 모두 (!) 퇴사하여 창업을 했다는 점도 인상적이다. Attention Is All You Need The dominant sequence transduction models are based on complex recurrent or convolutional neural networks in an encoder-decoder configuration. The..