데이터 이해 3 (비판적 사고와 데이터 이해)
왜 데이터 리터러시 역량 중
비판 능력이 가장 중요한 것일까?
1. 데이터 비판 능력
데이터 비판 능력이 중요한 이유
1. 속지 않기 위해서
데이터로 상대방을 속이려는 행위가 급증한 지금(ex. 가짜뉴스, 딥페이크 등)
데이터는 잘 쓰면 약이지만 그렇지 못하면 독
2. 비판 받지 않기 위해서
나의 주장을 전개하기 위한 발판인 데이터.
다른 사람의 주장과 데이터 사이 관계 비판 시 내가 나의 주장을 비판할 때 사용할 수 있음
3. 비판 능력이 좋아야 기획 능력도 좋기 때문
데이터 분석 기획 능력이 좋다는 것은
설득을 위한 데이터를 감각적으로 판단 + 필요한 것에 대한 명확한 구분 가능한 힘
좋은 근거로서의 3가지 요건
사실성: 이 근거는 사실에 입각하였는가?
데이터가 많아질수록 나의 주장은 설득력이 높아짐. 하지만 그만큼 약점이 상대방에게 노출
그래서 메시지 전체를 받아들이지 않을 가능성 또한 높아짐
즉, 데이터를 사용할 경우 정확하게 오류없는 내용으로 구성해야 한다.
연관성: 이 근거는 주장의 메시지와 정말 관련이 있는가?
각 주장 속 키워드가 같더라도 관련성이 없는 경우가 많음
충분성: 동일한 대전제 하에 상충되는 근거가 존재하지는 않는가?
상대방이 나의 주장을 받아들일만큼의 충분성. 충분성은 본질적으로 사실성과 연관성에 비해 난이도가 높다.
사실성, 연관성: 화자가 점검 가능
충분성: 청자가 결정
충분성이 어려운 이유는
내가 결정하는 것이 아닌 상대방이 결정하기 때문
데이터 분석가들이 흔히 하는 실수
: 분석 자체에 매몰된 나머지 본래의 목적인 설득을 잃어버리는 것
-> 사실성, 연관성, 충분성을 점검해야하는 이유
2. 데이터 비판 능력 사례
사실성, 연관성, 충분성 사례
예시1. 강동원은 잘생겼다. 왜냐하면 여자이기 때문이다. 사실성 위배
예시2. 강동원은 잘생겼다. 왜냐하면 노란색 옷을 입었기 때문이다. 연관성 위배
예시3. 강동원은 잘생겼다. 왜냐하면 OOO이기 때문이다.
Q. 예시3. 문장을 충분성 위배로 바꾸려면?
- 사실이면서 연관성을 있지만, '잘생겼다'라는 개념을 대표하기 어려운 경우
스캐터 차트 속 데이터 분석
<추가정보>
Y축이 위로 올라갈수록 폭력성이 높은 학교
100명 학생에게 질문하여 교내에 일진이 있다에 YES라고 응답한 경우가 50명이라면 50%
Q. 폭력성과 학업 능력은 연관성이 있을까?
일반적으로 차트 속 점들이 원처럼 한쪽에 몰려 있을수록 X축과 Y축의 상관관계는 낮음
주장: 즉, 학업능력과 폭력성은 연관성이 없다.
차트를 보면 아무 관련이 없는 것처럼 한 곳에 모여 있기 때문.
Q2. 위 주장은 사실성, 관련성, 충분성에 적합한 주장일까?
A. 아니다.
<이유>
1) Y축의 한계: 각 고등학교별 일진의 양 측정 -> 질에 의한 노이즈 발생 가능성 있음
ex. 학교에 일진이 단 1명이지만, 뉴스에 나올 정도로 악랄한 친구라 전교생 모두 알고 있는 경우에는
일진이 1명이지만 Y축이 100%
충분성 부족
2) X축의 한계: (고등학교별 수능 1,2 등급 합계 비율) 구조적으로 1,2등급의 학생 수는 적음
ex. 각 학교의 학생 정원 수가 비슷하다면, 비중의 값은 당연히 오른쪽으로 갈수록 적을 수밖에 없음
즉, 애초에 점들이 왼쪽에 모여있을 수밖에 없는 것
사실성 오류
3) 아웃라이어: 전체 변량 대비 너무 떨어져 있는 것
차트 속 우측 상단에 위치한 점의 의미 -> 전국에서 4~5번째로 공부를 잘하고 일진 인식률이 100%인 고등학교
저 차트 속 아웃라이어는 민족사관고등학교
비판적 사고: 민사고의 일진 인식률이 100%가 나온 것이 이상하다.
민사고가 일진 인식률이 100%인 이유는
전체 정원 중 단 2명의 학생만 응답했기 때문
일진 인식률에 대한 다른 학교 확인 결과, 전체 정원 대비 현격히 모자한 학생이 답을 한 학교가 약 80%
즉, Y축 자체를 쓸 수 없다는 것
즉, 데이터 자체를 쓸 수 없다는 것
즉, 이 차트의 데이터를 기반으로 한 메시지는 성립할 수 없다는 것