직접적인 경험 - 배움/AI 커리어 스쿨

01-02. 데이터 리터러시

우주진 2025. 1. 15. 15:50

 

이미지를 누르면 강의 새창으로 연결됩니다:  https://www.inflearn.com/course/pm-데이터-리터러시 (배너는 microsoft designer에서 제작)

 

1. 데이터 안에 답은 없다. 찾아내야 하는 것이다.

직접적인 답을 주지 않고, 보는 사람의 해석에 따라서 답이 달라질 수 있다.

데이터는 의사결정을 위해 활용하는 것일 뿐, 진리가 아니다.

선택의 불확실성이 존재하기에 리스크를 관리하기 위해 데이터를 활용하는 것이다.

데이터는 자신이 알고 있는 것, 생각한 것을 합리적으로 전달할 수 있는 도구

'데이터는 예측하지 않는다'라는 책을 읽었는데, 상통하는 부분이 있다고 느꼈다.

데이터는 예측을 하려고 하는 것이 아니다, 미래가 아니라 과거로부터 추론하는 영역이며,

한정된 자원을 효율적으로 사용하고 리스크를 관리하려는 목적으로 이용하는 것이라는 지점이.

 

2. 데이터에 기반한 의사결정은 그 당시의 최적local optima이지, 진리의 최적점global optima은 아니다.

시즈널리티가 심한 서비스는 시기에 따라 서비스의 특성이 다르다. 다만 특정 결과가 시간의 흐름에도 불구하고 게속된다면 최적점에 가까운 결과로 볼 수 있다. 그러나 영원히 global optima에 도달하지 못할 수는 있다.

학창시절에 정답이 존재하여 정답 찾기에 몰두한 기간이 길어서일까,

끝없이 정답을 찾아 헤맨다는 것이 망망대해를 보는 느낌이다.

하지만 시간이 지나고, 상황이 변하고, 사람들이 변하기에 특정 시점에 맞았던 해결책이 지금은 맞지 않을 수 있고, 과거에 실패한 해결책이 오히려 지금은 알맞을 수도 있다는 생각은 해왔다.

 

3. 정답이 하나라고 생각하지 마라

문제를 푼다는 것이 반드시 존재하는 하나의 정답을 찾는다는 말이 아니다.

주어진 리소스 하에서(제약조건) 제일 적합한 해답을 찾기 위한 논리적 사고 방식을 전개하는 것이 문제 풀이.

문제 해결 방식은 여러 가지 방법이 있을 수 있다.

그 중 다각도로 고민한 후 한 가지를 취할 수도 있고, 여러 가지 시도를 할 수도 있다.

여러가지 해결책을 시도해본다는 것은 매력적이다. 다만, 그런 경우 어떤 해결책이 문제 해결에 주효한 영향을 미쳤다는 것을 파악하기는 어려운 일이 되지 않을까.

 

 4. 'Data driven'은 'data person'(DA,DE)에게 맡긴다는 뜻이 아니다. 모두가 데이터를 사용해야 한다.

 

5. 내 데이터나 가설이 틀릴 수도 있다는 가능성을 생각해야 한다.

비판적 사고, 열린 마인드를 가지고 편향을 경계하기. 

맞고 틀리냐가 아니라 제품을 더 많이 사용하게 만드는 등의 성공을 이루는 것에 집중.

내 가설도, 모은 데이터도 틀릴 수 있다. GIGO

언제나 편향을 경계하고자 하지만, 인간 인지에서 고속도로와도 같다는 생각이 든다. 

우선순위와 목적에 집중해서 그 외의 가지는 덜 중요하게 여기기.

 

---

 

데이터 리터러시는 데이터 문해력이라고도 하는데, 데이터를 읽고, 이해하고, 활용하는 역량이다.

데이터를 어떻게 해석하고 의사결정을 내릴까를 고민.

이 강의를 듣고자 한 이유이기도 하다. 

 

분석과 통계의 정확도를 1%라도 높이는 것은 PM,PO 관점에서의 목표가 아니다.

실무에서 유의미한 성과를 내기 위핸 필요한 내용(인싸이트)를 알아내고 구체적인 액션이나 판단을 할 수 있는 결론을 도출하는 것이 목표이다.

분석과 통계의 정확도가 낮으면 그로 인한 결과, 액션도 잘못된 판단이 되는 게 아닌가 하는 걱정으로 다시 살펴보게 된다. 한 편으로는 71%정확도나 74%의 정확도나 액션을 도출하고 이행하는 데 있어 완전히 다른 결론을 주지는 않을 것이라는 생각도 든다.

 

구체적인 목적 없이 대시보드를 그리고, 그래프에서 또는 sql 쿼리 데이터에서 정보를 얻는 것을 분석이라고 할 수 없다.

보고 '그렇구나'에서 그치지 않고, so what, 무엇을 해야할까에 대한 답을 찾으려고 해야 한다.

작업자가 재밌다고 생각한 내용 토대로 데이터를 보는 호기심 중심 사고도 결론을 토대로 액션을 추가적으로 생각하지 않은 채 단순히 재미있다고 끝내면 안 된다. 흥미, 호기심 기반은 추후 액션을 내기 어려운 경우가 많기에 해결해야 하는 문제, 알고 싶은 것(목적)에 따라 데이터를 수집하고 분석해 결론을 내는 과정이 필요하다.

무언가 차이점을 찾아내고, 그 원인을 파악하려는 행위는 재미있다. 하지만 언제나 목적을 잃지 않기.

 

데이터를 바라볼 때 자주 확인하여야 하는 관점

1) 목적을 생각하기

2) 목적을 확인할 수 있는 '비교' 대상을 확인하기. 비교군이 없으면 판단하기 어려움

3) 지표가 많이 떨어졌거나, 올라간 케이스 확인. 왜 발생했는지.

- 예시

우리 서비스의 퍼널에서 많이 이탈되는 구간은 어디일까? 왜 그럴까?

우리 서비스에서 탐색하다가 이탈하는 사람들은 이유가 무엇일까?

 

문제 -> 문제와 관련하여 개념의 조작적 정의 -> 이유에 대한 변수, 가설 설정

-> 각 상황에서 어떤 액션을 해야할까(action item 수립)

 

앞의 과정은 실험할 때와 비슷한 것 같다. 

다만 뒤의 액션 과정을 수립단계에서 미리 생각해본다는 차이점.

 

비교군은 실험군과 대조군 생각나기도 하고. 

 

다만, 적용해보려니 '목적'이 모호하지 않나..싶었는데, 현재 내 위치에서는 내부 사정을 알 수 없으니..

이 목적을 세우는 것은 결국 회사의 비즈니스 이해와도 닿아 있는 것 같다.