CJ REMOTE Internship/데이터 리터러시

데이터 기반 의사결정 1 (데이터보다 맥락이 중요하다.)

똔똔똔 2022. 6. 8. 22:52
데이터 기반 의사결정 시
가장 먼저 바라봐야 할 것은?

1. 맥락 파악 역량

데이터로 문제 해결하는 과정에서 발생한 실패 요인
1. 데이터가 없는 경우

- 데이터가 없는 경우는 큰 문제가 아님

 

-> 시간이 해결해 줄 수 있는 문제

 

2. 실무가 너무 바쁨

기업의 흔한 데이터 기반 문제해결 방식

 

데이터 전문가문제를 가진 실무자의 협업 프로젝트 속에서 문제해결을 시도

 

데이터 전문가 조직이 아무리 열심히 해도, 실무자 쪽이 업무가 너무 바쁘면 프로젝트는 실패함

 

즉, 데이터 기반 문제 해결과정에서 전문가처럼 모든 역량을 갖출 필요는 없음을 의미함 

 

3. 문제 정의를 정확히 하지 못해서

실제 데이터 기반 문제 해결 시 특정 분석 기법과 툴에 대한 이해가 없어서 문제 해결이 안 되는 것이 아니다!

 

문제 정의 자체가 잘 이루어지지 않으면, 아무리 좋은 툴이 있어도 말짱 꽝이다.

 

중요한 것은

맥락을 이해하는 것

 

맥락의 중요성을 보여주는 사례1

2차대전 당시 미 해군 전투기에 남은 피탄 흔적과 부분별 비율

어떻게 하면 전쟁을 마치고 돌아온 비행기의 생존율을 높일 수 있을까?

 

대표적인 오답: 점이 많이 찍힌 곳을 보강한다.

 

오답인 이유: 위 데이터 속 비행기들은 전쟁을 마치고 돌아온 비행기 대상으로만 나올 수 있는 데이터

 

즉, 저 부분에는 총알을 맞아도 돌아오는 데 문제가 없다

                                          +

점들이 없는 부분에 총을 맞은 비행기는 돌아오지 못했다.

 

정답: 총알이 없는 곳을 보강해야 한다.

 

 

맥락의 중요성을 보여주는 사례2

곰이 공이 튀어 오를 때마다 공을 딛고 다음 절벽으로 넘어가려면?

주요변수

환경적 요인: 날씨가 공의 운동에너지를 증폭, 오른쪽 절벽이 실제로 충분히 낮은 경우, 바닥면의 운동에너지 증폭 기능

곰의 요인: 곰의 운동 능력, 궤적을 예측하는 곰의 역량

공의 요인: 공 자체의 운동에너지 증폭 기능

 

2. 어프로치 설계

어프로치란?

상황 및 문제 인식에서 어떤 분석 기법과 툴에 강한지 변수에 의해 문제를 해결하는 다양한 방법

 

정해져 있는 정답이 있는 것이 아닌, 상황과 역량에 따라 다름

 

실제 데이터 문제 정의에서의 어프로치

최적 방문 시간대를 정하는 나만의 분석은?

 

 

주장1: 사람이 많이 붐비면 내가 콘센트 자리에 앉을 가능성이 낮으므로
사람이 많이 붐비는지 아닌지에 대한 데이터를 모은다.

사람이 많다 = 콘센트 자리에 앉을 가능성이 낮다 ?

 

중요 요인은 맞지만, 충분히 분석이 완성되었는 가에 대한 고민이 필요

 

+ 한가지 더 중요한 요인은 '회전율'