CJ REMOTE Internship/데이터 리터러시

데이터 이해 1 (공감적이고 직관적인 이해)

똔똔똔 2022. 6. 8. 05:59

 

데이터를 공감적으로,
직관적으로 이해할 수 있을까?

 

1. 데이터를 공감하는 힘

데이터 공감역량

데이터 공감능력: 데이터가 가진 값 자체가 아닌, 정황에서의 의미를 찾는 것

 

예시1:

세계 남자 100m 신기록 그래프, 신기록이므로 장기 우하향 중, 2009년 이후론 신기록 갱신x

1) 지난 40년의 100m 신기록 데이터 추이 파악

2009년 경 급격한 신기록 갱신, 우사인 볼트는 지난 40년간 인류가 만든 신기록 추이 데이터의 기울기를 바꾼 남자

 

2) 우사인 볼트가 만들어낸 신기록 낙폭과 똑같은 낙폭을 다른 선수들은 얼마나 걸렸는지 계산

단, 1년간 우사인볼트가 만들어낸 낙폭은 지난 15년간 7명의 선수가 만든 것과 동일

 

3) 같은 1초라 하더라도 1초를 줄이기 위한 난이도의 차이 (눈에 보이지 않는)

이전에 줄어든 1초와 우사인 볼트가 줄인 1초의 난이도는 다름

위대한 우사인 볼트

데이터를 단순히 해석하는 것이 아닌, 이렇게 데이터에 의미를 부여하여야 올바른 의사결정이 가능하다.

그래서 바로 의미부여가 중요한데, 이는 데이터만 뚫어지게 본다고 가능한 것이 아니다.

데이터를 둘러싸고 있는 정황정보에서 정확한 의미를 찾아야 한다. (때에 따라서는 상상력을 동원해서라도)

 

데이터 이해의 3요소

정보: 데이터의 값 / 정서: 데이터 고유의 느낌 / 정황: Context is everything!

데이터의 값이 어떠한 의미인지는 데이터가 아닌,
Context가 결정한다.

 

즉, 데이터 분석가에게 필요한 역량은 숫자를 다루는 능력, 분석기법과 툴에 대한 전문적인 역량보다

상황을 다루는 능력인 것.

 

가설을 설정하고, 설정된 가설에 맞는 데이터와 맞지 않는 데이터를 선별하여,

분석기법과 툴을 이용하여 데이터를 분석해야 함

 

 

2. 데이터를 직관적으로 보는 힘

데이터 직관역량

국내 주요 테마파크 입장객 추이 그래프

Q. 위 그래프를 보고 국내 테마파크 산업의 특징을 유추해보시오.

(힌트): 사실성을 다루지 않고 개연성을 다룬다.

 

A1.
국내 테마파크 산업은 정체되어 있다.
에버랜드와 롯데월드가 국내 테마파크를 쌍두마차격으로 끌고 가고 있다.

-> 이 답변들은  데이터를 읽은 것에 불과. '산업의 특징'은 다른 산없엔 없는 특별한 것을 의미

 

 

데이터를 조금만 먼발치에서 바라보면 보이는 것

다른 산업의 경우, 일반적으로 한 기업의 점유율이 줄어들면 다른 기업은 반사이익을 누림

ex. SKT의 점유율 하락 -> KT & U+의 점유율 상승

 

그러나, 위 그래프에서 롯데월드의 입장객 수가 큰 폭으로 떨어졌음에도 경쟁사들의 입장객 수는 반응하지 않음

즉, 국내테마 파크 산업의 특징은
산업 내 플레이어 간 영향이 미치지 않는다는 것

 

이러한 유추가 중요한 이유는?

 

Q. 롯데월드의 CEO인 당신, 에버랜드에서 400억짜리 롤러코스터를 짓는다는 첩보를 입수했다. 당신의 선택은?
A1.
"그래프를 보니, 산업이 정체되어 있고 1등과 2등의 구분이 명확하군."
"업계 1위인 에버랜드가 새로운 어트랙션을 들이다니, 우리도 뭐라도 해야겠어!"
A2. 
"그럴 수 있습니다. 일단 지켜봅시다."
"에버랜드와 우리는 고객 기반이 다를 수 있습니다."

 

 

 

데이터를 올바르게 읽었다면 A2의 답변이 나올 것.

 

데이터를 이해한다는 것은 사실을 다루기전에 사실스러움을 다룰 수 있는 힘이 필요

 

3. 데이터를 공감하고 직관적으로 보기 위한 TIP

데이터 공감: 데이터는 값만 보지 말 것, 정황까지 이해하여 정확한 의미를 부여할 것
-> 의미가 없으면 의사결정이 불가

직관: 딱 보고 아는 능력을 기를 것
사실성이 확보되지 않아도 문제될 것은 없다는 것.
직관적으로 결정한 뒤, 추가적인 데이터로 보강할 것.

 

 

 

 

 

출처: CJ Remote Internship 1주차 학습콘텐츠