Posts
Haehwan Lee
Cancel

Probability Space

Probability Space 확률공간(Probability Space)이란, 확률(Probability)을 다루기 위해서 가장 기본적으로 선행되어야할 일종의 조건과 가깝습니다. 수학에서 Space가 의미하는 바를 이해한다면 조금 더 체화해서 이해할 수 있을 것 같습니다. 대수학에 수많은 Space가 있겠지만, metric space 예시를 들...

P, NP, and NP-Completeness

지난 포스팅에서는 알고리즘 분석에 필요한 개념들을 설명했습니다. 사실 이를 통해 배우고 싶었던 것은 오늘 다룰 P, NP 등의 개념들입니다. 이번 글은 지난 포스팅의 내용을 모두 숙지했다는 상태로 진행하겠습니다. 머신러닝 논문을 읽다보면 모르던 용어들을 마주칠 때가 있습니다. 알고리즘이나 자료구조와 같은 과목을 수강해본 적이 없는 ...

Algorithm Analysis

어떤 문제를 해결하기 위한 방법은 다양합니다. 예를 들어 Bubble sort, Quick sort, Merge sort와 같은 알고리즘들은 모두 임의의 숫자들을 크기 순서대로 재배열해줍니다. 그러나 알고리즘의 작동 방식이 모두 다르기 때문에, 문제해결에 필요한 시간과 메모리 양은 모두 다를 것입니다. 이러한 알고리즘 간의 차이를 이해하는 것은 프...

[Bokeh] interactive geo data

저는 bokeh를 자주 사용하는 편입니다. 사실 아직까지도 익숙하지는 않지만, 워낙 다양한 기능을 제공하고 있어서 조금만 다룰 줄 알아도 꽤나 멋진 시각화 자료를 만들 수 있습니다. 앞으로 가능한, Bokeh의 여러 기능을 활용하는 방법에 대해 포스팅을 하려고 합니다. 가장 유용한 기능 중에 하나는 지도를 활용하여 interactv...

[Encoding] 5. Target Encoding

데이터를 처리하다보면 범주형 자료를 수치형 자료로 바꾸어야할 필요성이 많습니다. 이러한 변환을 인코딩이라고 하는데, 다양한 목적과 자료의 특징에 맞추어 올바르게 인코딩한 범주형 자료는 모델의 퍼포먼스와 효율에 상당한 영향을 끼칩니다. 특히 최근 각광받는 머신러닝과 딥러닝에서 범주형 자료에 대한 인코딩은 필수적입니다. 그러나 인코딩은 생각만큼 단...