Side Project/머신러닝 야학 2기

[머신러닝 야학 2기] 머신러닝1 - 교양의 끝, 직업의 시작, 표, 독립변수와 종속 변수

  • -
728x90

ml.yah.ac/

 

머신러닝야학

모르는 것이 생겼다고요? 진로에 대한 고민이 있다고요? 조력자에게 물어보세요. 현업에서 활동 중인 엔지니어들이 여러분을 돕겠습니다. 조력자들이 가진 기술을 확인하시고 아래 영상에서 안

ml.yah.ac

opentutorials.org/course/4548/28903

 

교양의 끝 - 생활코딩

지금까지 우리는 머신러닝에 대해서 차고 넘치게 경험했습니다. 그리고 우리의 앞에는 교양과 직업이라는 두 개의 갈림길이 놓여있습니다. 이 갈림길에서 필요한 것은 현명함입니다. 어떤 길을

opentutorials.org

opentutorials.org/course/4548/28904

 

직업의 시작 - 생활코딩

 

opentutorials.org

앞선 강의에서 여러 가지 아이디어를 구상해 보았다.

아이디어를 현실화하기 위해서는 데이터가 필요하다는 것이 느껴질 것이다.

 

예를들어 레모네이드 카페를 운영한다고 가정해보자.

온도와 판매 개수와 같은 개념을 데이터로 표현해야한다. 데이터 자체는 현실이 아니다.

하지만, 현실을 데이터로 표현할 수만 있다면, 컴퓨터의 엄청난 힘으로 데이터를 처리할 수 있게 된다.

그 처리 방법 중 하나가 머신러닝이다.

 

머신러닝으로 무언가를 하려면 당연히 데이터가 필요하다.

 

세상에는 무한히 많은 데이터가 있다.

현실을 데이터화 할 수 있다면, 복잡한 현실에서 발견하기 어려운 통찰을 단순해진 데이터로부터 찾아 낼 수 있을 것이다.

 

이를 통해서 현실을 변화시키는 일을 하는 것이 "데이터 산업"이다.

 

"데이터 산업"은 크게 "데이터 과학"과 "데이터 공학"으로 분리할 수 있다.

 

데이터 과학은 데이터를 만들고, 만들어진 데이터를 이용하는 일을 한다.

 

데이터 공학은 데이터를 다루는 도구를 만들고, 도구를 관리하는 일을 한다.

 

opentutorials.org/course/4548/28928

 

표 - 생활코딩

 

opentutorials.org

회계사들이 만든 표는 행과 열이라는 쇠창살 속에 데이터를 욱여넣는 극도로 억압적인 도구이다.

하지만, 우리는 아무리 복잡한 데이터라도 일단 표 안에 속박시킬 수 있다면, 단정하게 정리정돈 할 수 있다.

뿐만 아니라, 엑셀이나 데이터베이스와 같은 도구에 표를 옮겨 담으면

컴퓨터가 가진 엄청난 저장 용량과 처리 속도를 이용해서 강력한 표 로봇을 만들 수 있다.

 

여기에 머신러닝을 투입한다면, 인간만이 지닐 수 있다고 여겨졌던 통찰력을 기계도 발휘할 수 있게 된다.

 

데이터 산업에서는 행과 열이라는 표현 대신 아래의 표현을 사용한다.  

o 행(row)

  • 개체(instance)
  • 관측치(observed value)
  • 기록(record)
  • 사례(example)
  • 경우(case)

o 열(column)

  • 특성(feature)
  • 속성(attribute)
  • 변수(variable)

 

opentutorials.org/course/4548/28929

 

독립변수와 종속변수 - 생활코딩

구슬이 서 말이라도 꿰어야 보배라는 말이 있지요? 데이터를 표에 가두는 것만으로는 부족합니다. 표 속에 구속된 데이터에서 의미있는 정보를 뽑아낼 수 있어야 합니다. 이에 능한 사람을 통찰

opentutorials.org

변수(variable)은 '변할 수 있는 수'라는 뜻이다

표에서 변수를 언급하면 그것은 열(column)을 이야기하는 것이다.

 

위 표에서 온도의 값은 

 

온도 = 20

온도 = 21

온도 = 22

 

와 같이 달라지고 있다.

 

예를 들어 보면

 

'온도가 20도일 때 40잔이 팔렸다.'

여기서 원인은 온도 20이고 결과는 판매량 40잔이다.

잘 생각해보면 원인은 결과와 상관없이 일어나는 사건이다.

 

판매량 때문에 온도가 달라질리가 없지 않은가?

 

결과에 영향을 받지 않는 독립적인 사건이 독립변수이고, 원인에 종속되어서 발생한 사건이 종속변수이다.

상관관계

 

이 표에 있는 특성(열)들 중에서 서로 상관있는 특성은 무엇일까?

한쪽의 값이 바뀌었을 때, 다른 쪽의 값도 바뀐다면, 두 개의 특성은 '서로 관련이 있다'고 추측할 수 있다.

이 때, 두 개의 특성을 '서로 상관이 있다'고 추측할 수 있다. 이런 관계를 상관관계라고 한다.

인과관계

표를 잘 살펴보면 온도와 판매량 사이에 보다 미묘한 관계가 있는 것을 알 수 있다.

상관관계와 인과관계는 비슷한 듯 하지만 중요한 차이가 있다.

상관관계는 인과관계를 포함한다. 즉, 모든 인과관계는 상관관계이다. 

하지만, 모든 상관관계가 인과관계인 것은 아니다.

728x90
300x250
Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.