데이터먹는감자님의 프로필 사진

@eat-data-jeong

데이터먹는감자

현직 7년차 데이터 사이언티스트의 노하우를 전부 줄게요!

📊 데이터 요약할 땐 ‘5가지 수치’만 기억하면 됩니다
1/ 📦 데이터가 많을 땐 전부 들여다보는 건 무리! 그래서 핵심만 쏙 뽑은 요약이 필요합니다. 가장 많이 쓰이는 요약 방식? → 바로 ‘5가지 요약 수치’ (five-number summary) 2/ 이 다섯 가지는 이거예요 👇 최소값 (min) 제1사분위수 (Q1) 중앙값 (Q2, median) 제3사분위수 (Q3) 최대값 (max) Q1~Q3는 중심에 몰려 있는 값들 요약, min/max는 양쪽 극단값을 보여줘요. 3/ 📌 왜 중요한가요? 평균은 극단값에 흔들리지만, 중앙값(Q2)은 흔들림이 적어요 = 강건함(robust) 또한 Q1~Q3 사이 간격(IQR)은 데이터가 얼마나 퍼져 있는지를 말해줘요! 4/ 요약하자면: 데이터의 중심은 Q2 퍼짐 정도는 Q3 - Q1 (IQR) 극단값은 min/max 👉 5가지 수치로 데이터 한눈에 파악 가능! 통계 초입에선 이거 하나로도 충분해요.

1


📢 요즘 다들 한다는 A/B 테스트, 대체 뭔데?
1/ “버튼 색을 바꾸면 클릭이 늘까?” “이 문구가 더 끌릴까?” → 이런 고민, A/B 테스트 한 번이면 답 나옴. 두 버전(A/B)을 유저에게 동시에 보여주고 진짜 반응으로 결정하는 실험 방식! 2/ 🧪 이렇게 진행함 👇 비교할 요소 정하기 (예: 버튼 색, 문구, 이미지) “빨간 버튼이 더 클릭 잘 될 듯?” 같은 가설 세우기 유저 그룹 나눠서 실험 통계적으로 의미 있는 결과 확인! 3/ ✅ 왜 중요하냐면 "우리 생각엔 이게 좋아 보여!" → 유저는 무반응… A/B 테스트는 감이 아닌 데이터 기반 의사결정 실제로 넷플릭스, 현대차, 여기어때도 이걸로 성과 냄 4/ 결론은 감보다 데이터를 믿자. 작은 실험 하나가 전환율을 바꾸고, 성과를 바꾼다!

1


📌 평균으로의 회귀: 우리가 자주 오해하는 통계의 진실
1/ 한 번쯤 이런 경험 있지 않나요? 운 좋게 시험을 잘 봤는데 다음 시험에서 성적이 내려간다든지, 슬럼프였던 선수가 다음 경기에서 평소 실력을 되찾는다든지. 이건 실력이 바뀐 게 아니라, 대부분 ‘평균으로의 회귀(regression to the mean)’ 현상 때문이에요. 2/ ‘평균으로의 회귀’란 말 그대로, 극단적인 결과 뒤에는 평균 수준으로 돌아가는 경향을 말해요. 즉, 아주 높은 점수나 낮은 성과는 우연이나 일시적인 요인이 개입된 경우가 많기 때문에, 다음 결과에서는 원래 평균 실력에 가까운 수치로 돌아오는 거죠. 3/ 문제는 이걸 사람들은 자주 인과관계로 착각한다는 것. 예를 들어 “혼냈더니 성적이 올랐다”, “코치가 뭐라 하니까 경기력이 좋아졌다”는 식의 해석은 실제로는 그냥 평균으로 돌아온 결과일 수도 있어요. 이런 착각은 잘못된 판단과 비합리적인 피드백을 낳을 수 있어요. 4/ 그래서 통계를 볼 땐 특히 조심해야 해요. 평균으로의 회귀는 단순한 수치의 변화 같지만, 그 안엔 우리가 얼마나 쉽게 우연을 실력이나 효과로 오해하는지 보여주는 대표적인 통계 착시예요. 📉 데이터는 사실을 말하지만, 해석은 언제나 우리의 몫이에요.

0


📊 "통계에 속지 않는 법" - 『새빨간 거짓말, 통계』 리뷰
1/ 📖 이 책은? - "통계를 써서 어떻게 사람을 속일 수 있는지 알려주는 사기꾼의 안내서이자, 정직한 사람들을 위한 면역책!" 2/ ✨ 왜 읽어야 할까? → 데이터가 어떻게 왜곡되는지 실사례로 학습 → 평균, 상관관계, 그래프 등 익숙한 통계 개념의 숨겨진 함정 파헤치기 → 단순 지식이 아닌 데이터 리터러시와 비판적 사고력 향상 3/ 💡 핵심 인사이트 #1: 질문부터 조작이 시작된다 통계는 '어떻게 질문하느냐'부터 조작이 가능 ! → 질문 방식, 응답자 구성에 따라 결과 완전히 달라짐 4/ 💬 "설문은 중립적일 수 없고, 의도도 담긴다" 5/ 📈 핵심 인사이트 #2: '눈속임 그래프'의 실체 Y축 자르기, 축소·확대 기법은 사실상 일상적인 연출 → 체중계 그래프, 코로나 시기 판매량 차트 등 우리 주변 어디에나 존재 → 같은 데이터도 보여주는 방식에 따라 완전히 다른 스토리 6/ 💬 "관점을 조금만 바꾸면 숫자가 전혀 다른 의미로 보인다" 7/ ⭐ 핵심 인사이트 #3: 평점 비교의 함정 카카오 4.8점 vs 네이버 4.9점 → 과연 의미 있는 차이일까? → 서로 다른 기준, 다른 플랫폼에서 나온 수치 → 같은 수치라도 '어디서, 어떻게 나온 데이터인지' 반드시 확인해야 8/ 🎯 핵심 인사이트 #4: 데이터 시각화의 책임 분석자가 입맛대로 만들면 안 된다! → 객관성과 정확성 유지가 핵심 → 데이터로 설득하려는 유혹을 경계해야 9/ 💬 결론 : "데이터로 설득하려는 유혹을 조심하자" 10/ 🔍 한 줄 요약 이 책은 통계를 의심하는 눈을 기르게 해준다. 데이터 홍수 시대에 꼭 필요한 디지털 면역력을 키우고 싶다면 강력 추천! 📚✨

0


📌 도대체 문제 해결력이 뭔데 ? 데이터 분석가 취업의 노하우
"숫자만 보는 분석가"는 이제 그만! 👉 흐름을 설계하고 실행까지 도와야 진짜 실무형 분석가 💼 🔍 문제 해결력 = 실무에서 이렇게 쓰입니다 1️⃣ 지표 이상 감지 → “이 수치 왜 떨어졌지?”를 빠르게 눈치채는 감각 2️⃣ 원인 분석 & 맥락 이해 → 로그, 회의록, 외부 이슈까지 싹 모아서 파악 🕵️‍♂️ 3️⃣ 실행 가능한 방향 제안 → “그래서 어떻게 바꾸면 좋을까?”까지 제안하는 사고력 💡 🚀 이 능력, 이렇게 키워보세요 ✔ ‘왜 그런지?’ 계속 묻기 ✔ 숫자 뒤에 숨은 비즈니스 맥락 읽기 ✔ 실전 프로젝트, 사례 많이 경험해보기 📈 결론 이제 데이터 분석가는 단순 보고서 작성자가 아닙니다. 👉 문제를 정의하고, 해결 흐름을 설계하는 사람! 이 역량이 있으면? 💼 협업 잘 되고 📊 실무에서 인정받고 🎯 커리어도 훨씬 빠르게 성장합니다 #데이터분석 #문제해결력 #데이터커리어 #실무분석가 #분석가역량

0