본문 바로가기

[강화학습 1강] 강화학습 introduction David Silver 교집합이 기계학습이 아니라 저 모든것을 포함하는 더 큰 범위가 기계학습니다. 강화학습은 지도학습처럼 정답이 없지만 행동을 했을때 보상이 있다. 이 방법론의 경우 지도자 없이 스스로 Optimal을 찾고자 하기에 사람을 뛰어넘는 결과에 도달할 가능성이 있다. supervised같은경우 iid(독립적인 샘플), 강화학습 같은경우 sequential data을 이용하기 때문에 더 어렵다. reward는 강화학습의 전부: 한 시간때의 숫자(scalar) 하나이다. 강화학습은 목적은 cumulative reward를 최대화 하는것이라 할수있다. 중요한것은 Sequantial하게 행동을 잘해야됨 목적은 미래에 받을 reward의 총합을 최대화하는 액션을 선택하는것 계속 greedy하게 하면 .. 더보기
[Django #11] Dynamic sidebar 이번장에서는 tutorial 페이지에서 side nav bar을 추가할것이다.views.py내에서 single_slug funtion에 다음과 같은 코드를 추가하자 tutorials = [t.tutorial_slug for t in Tutorial.objects.all()] if single_slug in tutorials: this_tutorial = Tutorial.objects.get(tutorial_slug=single_slug) return render(request = request, template_name='main/tutorial.html', context = {"tutorial":this_tutorial})이제 튜토리얼 페이지를 만들어보자.{% extends 'main/header.ht.. 더보기
[Django #10] Working with Foreign Keys 이번장에서는 foreign key를 사용해서 각 table간 어떻게 작동시키게 할건지를 만들어 보겠다. 우리는 각 series 페이지에 들어갈때 주소를 simple하게 하나의 제목 "one slash"로 구성하게 할것이다. 대부분의 사이트는 directory안에 있으면 그 full 경로를 주소창에 쳐야 접속이 되겠지만 가 지져분해보이고 내가만든 사이트에서는 그리 복잡한 구조가 아니기 때문에 그냥 단순히 파일이름을 치면 그 웹페이지로 가게 할것이다. 이런 기능을 위해서 view에서 내용을 검색하고 주소를 반환해주는 하나의 함수가 필요하고 이를 single_slug함수라 하겠다. from .models import Tutorial, TutorialCategory, TutorialSeriesfrom djang.. 더보기