CJ REMOTE Internship/데이터 리터러시 14

데이터 기반 문제해결(개인의 사고력과 AI의 조화)

데이터와 인공지능의 관계는 무엇일까 1. 데이터와 인공지능 인공지능이란? 컴퓨터가 데이터를 이용해 학습할 수 있도록 하는 기술 인공지능이 대체하고자 하는 영역은 인간의 판단력 그 중에서도 '복잡한 관계를 깨닫고 분별할 줄 아는 지능'을 인공지능은 대체하려고 한다. 2. 데이터와 빅데이터 빅데이터란? 인간이 생산하는 모든 형태의 신호와 흔적(특정 데이터베이스의 특정한 형식을 가진 것) - 일상에서 만들어내는 모든 이미지, 음성, 문자, 기호 등이 모두 데이터 좋은 데이터란? 3. 인공지능과 빅데이터의 힘 문제해결 함수에서의 인공지능의 비중 확대 인공지능 기술은 점차 머신러닝에서 딥러닝으로 발전 중 다양성, 신뢰도, 양 모두를 만족하는 데이터의 양이 급속도로 증가 -> 문제해결 함수에서의 인공지능 비중이 크..

데이터 기반 문제해결(문제 해결 실사례1)

1. 국내 모 건설 자재 유통회사의 데이터 기반 문제해결 사례 배경 국내 건설 자재 B2B 시장은 04년도부터 깊은 침체를 겪고 있었다. 그러나 04년도부터 착공 면적 및 분양 물량이 급증하며, 기초 소재 수요에 대한 큰 성장이 예상되었다. 분량물량이 2015년경에는 41만 호에 달하는 사상 최대치로 예상되어 주택 중심의 착공 물량 및 착공 면적 증가는 건설자재 생산 및 유통업 업체에도 영향이 있었다. 시장 분석 또한 기존 건물에서 발생하는 건자재 부품 수요가 증가했다. 일반적으로 건자재 시장은 주거의 질에 대한 소비자의 욕구와 비례한다. 따라서, 셀프 인테리어, 친환경에 대한 트렌드에 대한 관심이 급증하던 2010년은 새로운 건물의 증가와 맞물려 건자재 시장에서 매우 중요했던 시기였다. 기업의 고민 당..

데이터 기반 문제해결(문제해결 실사례 현황과 시사점)

원천데이터는 없다. 1. 기업이 해결하고 싶어하는 문제점 데이터 기반 실무 문제해결 2. 문제의 종류에 따른 해결 방법 문제해결 목적에 따른 분류 - 상황을 인지하고 표현하고 싶은 건지 - 평가하고 싶은 건지 - 나아가 미래를 예상하고 싶은 건지 - 어떤 문제를 해결하고 싶은 건지 기술: 현재 온도는 35도입니다. 평가: 더운 날씨는 온라인 사업에 우호적인 조건입니다. 예측: 앞으로 우리나라 기후는 아열대 특성이 강해질 것이므로, 오프라인 매장의 인접성보다는 접근성이 훨씬 더 중요할 것 입니다. 문제해결: 사람의 소비 성향을 자극하는 실내 온도는 섭씨 24도로 분석되었으므로, 매장의 온도를 2도정도 내려보세요. 예측분석 정량적 분석: 미래의 변화를 예측 모형 등의 수리적 근거를 통해 추정할 수 있는 경우..

데이터 기반 문제해결(문제 정의 및 구조화)

문제를 파악하는 것은 목적을 명확히 하는 과정 데이터 자체가 목적이고 메시지일 수는 없다. 1. 문제 및 분석의 구조화 분석의 목적과 목표 구분 구체적으로 무엇을 어떻게 분석해야할 지 모호한 것이 문제 즉, 분석목표를 실제 분석이 가능한 세부단위로 나누어 구체적인 목표 단위로 나누어야 한다. 문제 자체를 나누어 이해한 뒤 데이터 분석을 통해 문제를 실행해야 하는 것. Q. 어떤 회사에 취업하는 것이 좋을까? - 모호하고 추상적인 질문 ㄴ '좋은 회사'라는 기준을 명확히 하지 않았기 때문 예를 들어, 좋은 회사의 조건을 (전공적합성, 재무안정성, 성장가능성)으로 본다면 좋은 분석을 할 수 있게 된다. 2. 핵심 원인 지목 핵심 원인 지목의 중요성 핵심 원인을 분석하면 문제해결자의 권환 하에서 해결할 수 있..

데이터 기반 문제해결(데이터 중심 조식이 되기 위한 조건과 사고력2)

방법보다 이유에 집중해야 한다. 1. 문제해결의 범위(Scope) 설정 문제해결의 범위 충분한 질문과 풍성한 쟁점을 완성하기 위해서는 먼저, 문제해결의 범위부터 설정해야 함. 문제가 문제로 느껴지는 범위 또는 해결의 범위를 먼저 결정해야 깊은 이치를 따지는 질문과 쟁점을 생성 가능하다. 문제해결의 범위를 요약하는 네 가지 개념 1) 맥락(CONTEXT)의 명확화 2) 니즈(NEED)의 명확화 3) 문제해결의 최종 모습(VISION) 상상 4) 분석의 효과(OUTCOME) 예측 => CoNVO 해결하고자 하는 문제를 CoNVO로 정리하면 - 상대방에게 입체적인 이해 제공 가능 - 내가 왜 이 문제를 풀고싶어하고, 어떤 가치와 고민들을 다룰 것인지 충분히 전달 - 분석과 관련된 더 좋은 질문/쟁점을 만들어낼..

데이터 기반 문제해결(데이터 중심 조식이 되기 위한 조건과 사고력1)

기초 사고력이 탄탄해야 문제해결이 가능하다. 1. 한계적 사고력 한계적 사고력? 한계적 사고력: 마지막 하나가 어떤 영향을 미치는지 보고 결정한다. 새로운 의사결정을 만날 때마다 편익과 비용을 따져가면서 결정한다. 한계적 사고에 기반한 의사결정이 필요한 이유 -> 잘게 나누어서 여러번 판단하는 것이 좋음 신제품은 출시하는 것이 아니라 업데이트 하는 것 분석의 완성도보다 시의적절한 의사결정이 중요 분석 도중에 중간 결론이 기존 가설을 무력시키거나 전혀 몰랐던 데이터를 발견하게 될 가능성 존재 데이터가 주어지는 빈도와 속도에 맞게 답을 더듬듯이 찾아가는 분석의 유연성에 기여 2. 가설/비판적 사고력 가설적 사고? 지금 알고 있는 정보를 가설로 상정(현재 가능성이 제일 높은 결론) 가설을 마지막 분석지로 의식..

데이터 기반 소통 1 (데이터로 심금을 울려라)

읽지 않아도 읽히게 그려야 한다. 1. 논리력을 기반으로 한 표현 데이터 분석가? 데이터 문제 해결자 데이터 분석의 목적은 설득과 문제 해결. 상대방 잘 설득하기 위한 방법 1) 데이터 시각화 역량 시각과 과정에서 가장 중요한 능력 -> 질문력 데이터 DB에 던지는 질문이 시각화 되는 내용을 결정하기 때문 2) 데이터 표현 역량 데이터 표현에서 가장 중요한 역량 -> 논리력 위 두 데이터는 하고 싶은 말을 극대화하기 위해서 데이터 값이 가지고 있는 실제의 사실성을 왜곡 위 데이터 차트에서 잘못된 점은? 문제의 지점은 X축이 사실성을 왜곡하는 것처럼 보일 수 있다는 것 36%부터 차트가 시작되기 때문에, 실제 두 후보의 지지율 차이 대비, 왜곡된 이해를 불러올 수 있음 위 데이터는 데이터 표현관점에서 어떤..

데이터 기반 의사결정 2 (질문속도가 분석속도다.)

벤쿠버 동계 올림픽 '스키 활강' 종목을 시청 중인 A와 B A는 스키 활강에 대해 잘 모르고, B는 잘 알고 있다. 두 친구의 대화 A: 우와 저것 봐! 엄청난 스피드로 내리 꽂는데? B: 아~ 저건 스키의 꽃 활강 경기야. 남자의 경우 최고속도가 130km/h가 넘어 A: 아 그렇구나, 근데 어떻게 진행되는 건지 알아? B: 일단 기록 경기야. 주어진 슬로프를 누가 먼저 내려오는가가 관건이지. 이번 대회에도 출전 선수가 60명이나 돼. A: 그렇게나 많이? B: 출전 선수가 많긴 한데, 경기는 금방 끝나. 단 한번의 시도로 승부를 가리고 속도가 워낙 빨라 한 선수당 약 1분 50초 정도면 진행이 가능해 그래서 1등과 2등의 차이가 0.01초 차이로 갈리는 경우도 다반사래 저것봐! 코너에서는 스키의 바..

데이터 기반 의사결정 1 (데이터보다 맥락이 중요하다.)

데이터 기반 의사결정 시 가장 먼저 바라봐야 할 것은? 1. 맥락 파악 역량 데이터로 문제 해결하는 과정에서 발생한 실패 요인 1. 데이터가 없는 경우 - 데이터가 없는 경우는 큰 문제가 아님 -> 시간이 해결해 줄 수 있는 문제 2. 실무가 너무 바쁨 기업의 흔한 데이터 기반 문제해결 방식 데이터 전문가와 문제를 가진 실무자의 협업 프로젝트 속에서 문제해결을 시도 데이터 전문가 조직이 아무리 열심히 해도, 실무자 쪽이 업무가 너무 바쁘면 프로젝트는 실패함 즉, 데이터 기반 문제 해결과정에서 전문가처럼 모든 역량을 갖출 필요는 없음을 의미함 3. 문제 정의를 정확히 하지 못해서 실제 데이터 기반 문제 해결 시 특정 분석 기법과 툴에 대한 이해가 없어서 문제 해결이 안 되는 것이 아니다! 문제 정의 자체가..

데이터 획득(필요데이터 지목과 조작적 정의)

1. 데이터 지목 역량 데이터 지목의 2가지 요건 데이터 지목의 사례 사례1: 무한도전 피겨 판매중단 주장1: 무한도전에서 제일 인기가 좋은 건 유재석이 아닌, 정형돈이다. 이때, 단 하나의 데이터를 피겨 제작사에게 요청하여 이 주장의 사실 여부를 점검하고자 할때, 어떤 데이터를 요청해야 할까? -> '피겨별 생산량' "품절되었다"는 의미는 적은 생산량 혹은 많은 판매량을 의미 애초에 정형돈 피겨의 생산량이 적다면, 가장 인기가 없는 것은 정형돈일 수 있음. 사례2: 데이터를 통해 국내 자동판매기 시장의 성장 유무 파악 주장1: 필요한 데이터는 생산 단가 데이터이다. 주장2: 필요한 데이터는 자판기 종류별 생산량 데이터이다. 둘 중 더 좋은 지목은? 좋은 지목은 가설을 검증하기 위한 지목 주장1은 주장의..