수업 목표
- 데이터 분석가는 어떤 일을 하는지 알아보고 앞으로의 방향성을 설정한다
[ 강의 소개 ]
- Pandas를 활용해서 간단하게 데이터를 전처리하는 방법
- Matplotlib을 활용해서 데이터를 시각화하는 방법
- 단순히 스킬셋뿐만 아니라 데이터 분석가에 대해서 진지하게 고민해보기
1. 데이터 분석가란?
- 비즈니스 분석가
- 주로 비즈니스 문제를 이해하고 해결하기 위해 데이터를 분석
- 비즈니스 프로세스 및 요구 사항을 파악하고, 데이터 기반으로 의사 결정 지원
- 주로 업무 프로세스 개선, 비즈니스 모델 분석, 요구 사항 관리 등을 수행
- 프로덕트 분석가
- 제품이나 서비스의 성과를 평가하고 개선하기 위해 데이터를 분석
- 용자 행동 및 제품 성능과 관련된 데이터를 분석하여 제품 개선에 기여
- 주로 제품 경험과 사용자 행동에 대한 분석을 수행하며, A/B 테스트, 사용자 경로 분석 등을 담당
- 데이터 분석가
- 주로 정형 데이터를 분석하여 기업의 의사 결정을 지원
- 데이터베이스, 스프레드시트 등에서 데이터를 추출하고, 데이터를 정제하여 보고서 및 시각화를 생성
- 주로 기술적인 기술이 필요하며, SQL, Excel, 데이터 시각화 등을 활용하여 업무를 수행
- BI 분석가
- 기업의 비즈니스 인텔리전스 플랫폼과 도구를 사용하여 데이터를 시각화하고 보고서를 작성
- 주로 기업 내부 데이터를 시각화하고, 이를 통해 의사 결정에 필요한 정보를 제공
- BI 도구 (Tableau, Power BI 등)를 사용하여 대시보드를 구축하고, 데이터 시각화 및 보고서 작성을 담당
- 데이터 사이언티스트
- 주로 데이터를 활용하여 예측, 패턴 발견, 복잡한 분석을 수행하여 비즈니스 문제를 해결
- 통계, 머신러닝, 딥러닝 등의 기술과 알고리즘을 사용하여 데이터를 분석하고 모델을 구축
- 데이터 수집, 전처리, 모델링, 평가 및 해석을 포함한 end-to-end 데이터 분석 작업을 수행
2. 데이터 전처리와 시각화의 이유
1) 데이터의 목적은?
- 데이터의 목적은 결국 설득
- 설득하기 위해 데이터를 잘 전달해야하고 이 방법 중 하나가 '시각화'
- 즉, 데이터를 통해 무엇을 해야할 지 고민해야 한다
2) 글 vs 시각화 자료
- 표의 경우 줄글 형태로 나열식 정리되어 있지만, 확인하고자하는 데이터의 목적에 따라 보기 어려운 경우도 존재
- 전달하고자하는 목적에 부합하는 데이터를 시각화해서 보여준다면 한 눈에 알아보기 쉽고 빠르게 전달이 가능
- 적절한 시각화 자료는 분석 결과를 더욱 돋보이게 할 수 있다
3) 데이터 전처리와 시각화를 배우기 전에,
- 단순히 전처리를 어떻게 할 것인가? 를 정하기보다 ‘무엇을 위해 ~이런 형태의 데이터가 필요하다’라는 것을 먼저 정의할 필요 있음
- 복잡하고 많은 양의 데이터를 다루다보면, 하고자 했던 방향과 다를 수 있고, 무엇을 위해 전처리를 하였는지를 잊을 수도 있음
- 이러한 착오를 예방하고 올바른 의사결정을 위한 데이터 전달을 위해서 데이터를 사전에 어떻게 분석할 것인가 미리 설계하는 습관 중요
분석 설계 예시![]() |
1주차 숙제
- 채용공고 스크랩
- Pandas 예습 - 10분 Pandas
판다스 10분 완성 / 10 Minutes to Pandas
Pandas 10분 완성 역자 주 : 본 자료는 10 Minutes to Pandas (하단 원문 링크 참조)의 한글 번역 자료로, 번역은 데잇걸즈2 프로그램 교육생 모두가 함께 진행하였습니다. 데잇걸즈2는 과학기술정보통신
dataitgirls2.github.io
'내일배움캠프_QAQC 트랙 1기 > 강의 요약' 카테고리의 다른 글
[내일배움캠프] 데이터 전처리 & 시각화 4주차 (0) | 2025.01.06 |
---|---|
[내일배움캠프] 데이터 전처리 & 시각화 2-3주차 (1) | 2025.01.02 |
[내일배움캠프] 엑셀보다 쉽고 빠른 SQL 2주차 (1) | 2024.12.30 |
[내일배움캠프] 엑셀보다 쉽고 빠른 SQL 1주차 (0) | 2024.12.30 |
[내일배움캠프] 데이터 리터러시 (2) | 2024.12.27 |