분류 전체보기14 [Baysian 1] 빈도주의(Frequentist) VS 베이지안(Baysian) 보통 통계학에서 한 사건이 장기적으로 일어날 때 발생하는 빈도를 확률이라고 한다. 확률을 사건의 빈도로 보는 것을 빈도주의(frequentist)라고 하고 확률을 사건 발생에 대한 믿음 또는 척도로 바라보는 관점이 베이지안(baysian)이라고 한다. 빈도주의와 베이지안은 "확률을 해석하는 관점의 차이" 라고 설명할 수 있다. 빈도주의 빈도론자들은 얼만큼 빈번하게 특정한 사건이 반복되어 발생하는가를 관찰하고 가설을 세우고 모델을 만들어서 검증한다. 확률은 장기적으로 일어나는 사건의 빈도라고 주장 모수(parameter, 우리가 알아내고자 하는 값, 평균, 분산등)는 (우리가 모르는) 고정 된 상수 장점 여러번의 실험, 관찰을 통해 알게된 사건의 확률을 검정하므로 사건이 독립적이고 반복적이며 정규 분포형태.. 2021. 8. 16. 작심삼일 처음 공부를 시작할때는 엄청난 의지를 가지고 공부를 시작한다. 하지만 점점 어렵고 이해안가는 부분에 마주치면 공부를 더 이상하고 싶지않고 '나는 의지가 부족해서 못하는거야' 또는 '내 능력이 부족해서 못하는거야' 이런 생각을 가지게 된다. 지금 내가 배우고 있는 학문, 분야 등 여기까지 발전하기 위해서 얼마나 많은 사람들이 자신의 인생을 받쳤을까? 라는 생각을 해보자. 누군가는 평생을 받쳐서 발전시킨것을 단 글자 몇자만 보고 이해하기 쉬울까? 전혀 아니다. 이해를 잘 할때도 있고 못할때도 있지만 내가 직접 익히지 않고는 한번에 이해하기란 쉽지않다. 그러니까 포기가 아니라 잠시 쉼을 가져라. 쉬면서 공부했던것도 정리해보고 내가 이걸 배워서 어떤 문제를 해결하고 싶었는지 생각해보고 문제 해결에 사용해봐라. .. 2021. 8. 9. [데이터 시각화 이론] 1. 데이터 시각화 : 매핑 데이터의 시각화 목차 시각적 속성 데이터 유형 데이터 스케일에 따른 시각화 1. 시각적 속성 (Aesthetics type) 데이터 시각화의 과정 데이터 값을 "체계적이고 논리적인 방식을 통해" 시각적 속성으로 변환 후 속성을 이용해서 최종 그래프를 만듬 시각화 유형 산점도, 파이차트, 히트맵등 다양 모든 데이터 시각화는 데이터 값을 정량화(수치화) 가능한 속성으로 표현 후 그래픽으로 나타내는데 이를 시각적 속성(aesthetics) 라고 함 시각적 속성은 그래프를 구성하는 요소의 모든 측면을 나타낸다. 시각적 속성의 유형 2. 데이터 유형 모든 시각적 속성은 연속형 데이터를 표현할 수 있는 데이터와 없는 데이터로 나눔 데이터의 연속성에 따른 데이터 유형 연속형 데이터(continous data)시각적 속성 중 위치, .. 2021. 8. 9. [ML] Pre 4. 머신러닝의 분류 머신러닝의 기법은 다양하지만 크게 세가지로 나누게 된다면 지도학습, 비지도학습, 강화학습이다. 지도학습(supervised learning) 지도학습이란 기계에 무언가를 가르친다는 의미이다. 예를 들어 문제와 답을 학습시켜서 비슷한 문제가 나오면 풀수있게 하는것이 지도학습이다. "문제집으로 학생을 가르치듯이 지도하는것"이 지도학습이라고 생각하면된다. 위의 표를보면 온도에 따라서 판매량이 변화되는 것을 볼수있다. "그러면 1.9일의 온도에 따라 판매량을 추측할수있지 않을까?" 라는 생각을 가질수있다. 결국 지도학습은 과거의 데이터를 학습해서 결과를 예측하는데 주로 사용되는 것을 볼수있다. 지도학습에는 독립변수(원인)과 종속변수(결과)를 통해서 모델을 만들고 모델을 통해 문제를 해결하고 있다. 지도학습을 잘.. 2021. 8. 3. [데이터 시각화 이론] 0. 데이터 시각화에 대해 목차 1. 데이터 시각화를 포스팅하려는 이유 (나의 공부 필요성) 2. 데이터 시각화에 대해 1. 데이터 시각화를 포스팅하려는 이유 (나의 공부 필요성) 현재(2021년 7월) 나는 데이터사이언스를 공부하는 대학원 석사과정 중이다. 머신러닝/ 딥러닝을 공부하면서 데이터에 대한 전처리 과정에 중요성을 절실히 깨닫고 있는 중이다. 머신러닝에서 garbage in garbage out 이라는 말이 있는데 쓰레기 데이터를 넣으면 결과는 쓰레기 밖에 나오지 않아서 나온 말이다. 데이터를 전처리 과정 중 python의 matplotlib, seaborn과 같은 시각화 툴을 사용해서 데이터에 대한 통찰력을 얻으려고 한다. 하지만 어떻게 효과적으로 데이터를 시각화할지는 생각하지 않고 단순히 남들과 같은 코드를 이용해서.. 2021. 8. 2. [ML] Pre3. 머신러닝을 배우기 전 필요한 지식 현실을 데이터로 표현해서 처리한다면 크고 작은 복잡한 문제들을 해결하기 쉽다. 데이터를 표현하기는 어렵지만 만약 표현을 할 수 있다면 데이터를 처리하는 기법 중 하나를 머신러닝이라고 부른다. 이렇게 현실에 문제를 데이터화해서 여러가지 복잡한 문제들을 보기쉽게 단순하게 만들어서 해결하는것을 데이터 산업이라고한다. 데이터 산업은 2가지로 나뉘어져있다. 데이터 과학 : 데이터를 만들고, 만들어진 데이터를 이용하는 일 데이터 공학 : 데이터를 다루는 도구를 만들고 도구를 관리하는 일 데이터 과학과 데이터 공학은 정신과 육체의 관계로 보면된다. 그렇기 때문에 둘의 관계는 서로 상관관계가 존재한다. 표(table) 인간은 무언가를 배울 때 시각, 청각, 촉각 등 다수의 감각을 가지고 학습한다. 머신러닝을 사용하기 .. 2021. 7. 26. 소프트스퀘어드(부트캠프) 후기 소프트스퀘어드에서 개발을 배우게 된 계기 나는 프로그램과 관련이 없는 해양학과 학생이었다. 2020년 대학을 졸업하고 개발자가 되기로 결심하고 C언어부터 독학을 시작했다. (2020년 회고록이나 내 블로그 첫글에 내가 개발을 시작하게 된 계기가 있다.) 그 후에 파이썬, html, css, javascript, aws, nodejs 등 프로그래밍 언어와 인프라를 인터넷 강의와 책을 보면서 공부했다. 혼자 독학을 하면서 이해가 가지 않는 부분을 채우기가 어려웠다. 또한 클론코딩 강의로 공부를 하면 강의를 듣고 코드를 따라쳐보는 것까지는 가능했지만 '만약 강의를 보지 않고 나만의 서비스를 만들수 있을까?' 라는 생각이 들었다. 그리고 개발자는 혼자 하는 일이 거의없기 때문에 협업경험이 필요한데 서비스를 같이.. 2021. 2. 24. [ML] Pre2. 모델(Model) 모델이란 무엇일까? 모델은 머신러닝을 이해하는데 중요한 열쇠이다. 모델이라는 단어는 많이 들어봤을거다. 모델이라는 직업, 3d 프린트 모델링, 모델 하우스 등등 현실에서 많이 쓰이고 있다. 모델을 설명하기 위해 아파트를 짓는다고 생각해보자. 건축가가 아파트를 짓기전에 어떻게 지을것인지 도면을 그리고 들어가는 자재량 인테리어 비용 등을 생각할것이다. 하지만 바로 아파트를 지으려고 시공하기에는 위험이 크다. 건축가는 시공에 들어가기전에 비용이 많이 들어가기 때문에 아파트 모델을 만들어서 건축이 가능한지의 여부와 문제점을 파악할것이다. 즉 모델은 현실의 복잡한 문제 또는 바로 해결할 수 없는 문제를 해결하기 위해 만들어진다고 할 수 있다. 머신러닝에서는 모델을 판단력이라고 생각하면된다. 좋은 아파트를 지으려면.. 2021. 2. 10. Pre 1.머신러닝이란? 머신러닝이란 무엇일까? 머신러닝이란 인공지능의 한 분야로써 기계에 학습을 통해 기계 스스로 문제에 대한 해결책이나 기술을 발전시킬 수 있게 하는 분야이다. 다양한 분야에서 쓰이고 있다. 머신러닝의 예) 알파고, 추천 음악, 커피 판매량 예상 등 머신러닝이 만들어진 이유 기계를 학습시켜서 인간의 판단을 기계에게 위임하기 위해서 만든 기술이다. 인생에 있어서 무언가를 단순비교하는것은 어렵다. 왜냐하면 여러가지의 원인이 있기때문에... 그래서 인간은 수를 만들어서 어떤것이 더 필요한지에 대해서 비교했다. ⬇️ 진화 수를 통해서 통계라는 학문을 만들어냈고 세상을 수로 표현해서 비교하려고 했다. ⬇️ 단순계산 반복의 문제점 해결 컴퓨터의 탄생으로 인해 인간이 어려워하는 단순, 반복적인 문제를 해결했고 계산은 컴퓨.. 2021. 2. 9. 0. 머신러닝 공부하기 앞서... 미디어 매체에서는 4차 산업혁명이라는 말이 항상나온다. 또한 정부나 기업에서도 4차산업혁명을 대비안 인공지능 분야 인재 키우기에 열을 올리고 있다. 나는 해양학과를 나왔고 수산직 공무원이나 연구원쪽으로 생각하고 있었다. 하지만 이렇게 머신러닝을 공부하면서 내용을 정리하려고 한다. 머신러닝을 공부하게 된 현실적인 계기 형의 권유로 컴퓨터 분야에 입문하게 되었고 해양학과 졸업 후 방통대에 입학하면서 2020년 1년동안 CS분야를 공부하고 스스로 서버개발쪽을 공부했다. 물론 맛보기정도 컴퓨터 분야에 입문하기전 여러분야를 찾아보게 되었는데 데이터 분야가 눈에 들어왔다. 해양학과에서도 실험실에 있으면서 대학원생 형들이 데이터분석프로그램을 사용해서 실험이나 연구를 진행한것을 종종 볼수있었다. 또한 지도 교수님께서도.. 2021. 2. 9. 이전 1 2 다음