내일배움캠프_QAQC 트랙 1기/강의 요약 23

[내일배움캠프] 데이터 전처리 & 시각화 2-3주차

수업 목표Python의 Pandas 라이브러리를 활용해서 데이터를 전처리하는 과정을 학습해보자[ 데이터 전처리 ]데이터 전처리란 원하는 데이터를 보기 위해 하는 모든 활동실제 데이터는 원하는 형태로 구축되어 있지 않으므로 데이터를 직접 가공해서 활용해야 한다데이터 전처리를 할 때, 꼭 방향성을 가져야 한다데이터를 통해 무엇을 확인할 것인지?어떤 의사결정을 위해 필요한지?데이터를 통해 무엇을 얻고자 하는지, 그 목적을 달성하기 위해 데이터 전처리가 필요함 1. Pandas 1) Pandas vs Exxel자동화와 프로그래밍 기능대용량 데이터 처리복잡한 데이터 처리 및 분석확장성과 유연성버전 관리 및 자동화즉, Pandas는 대규모 데이터셋 및 복잡한 작업을 처리하는 데 효과적이며, 자동화와 프로그래밍 기능..

[내일배움캠프] 데이터 전처리 & 시각화 1주차

수업 목표데이터 분석가는 어떤 일을 하는지 알아보고 앞으로의 방향성을 설정한다[ 강의 소개 ]Pandas를 활용해서 간단하게 데이터를 전처리하는 방법Matplotlib을 활용해서 데이터를 시각화하는 방법단순히 스킬셋뿐만 아니라 데이터 분석가에 대해서 진지하게 고민해보기 1. 데이터 분석가란?비즈니스 분석가주로 비즈니스 문제를 이해하고 해결하기 위해 데이터를 분석비즈니스 프로세스 및 요구 사항을 파악하고, 데이터 기반으로 의사 결정 지원주로 업무 프로세스 개선, 비즈니스 모델 분석, 요구 사항 관리 등을 수행프로덕트 분석가제품이나 서비스의 성과를 평가하고 개선하기 위해 데이터를 분석용자 행동 및 제품 성능과 관련된 데이터를 분석하여 제품 개선에 기여주로 제품 경험과 사용자 행동에 대한 분석을 수행하며, A..

[내일배움캠프] 엑셀보다 쉽고 빠른 SQL 2주차

수업 목표SQL을 이용하여 숫자 계산 값을 도출한다Query 결과를 원하는 순서대로 조회한다1. 엑셀 대신 SQL로 한 번에 계산하기(SUM, AVG, COUNT, MIN, MAX) 1) 숫자 연산  2) 기본 연산, 합계와 평균 구하기합계 : SUM(컬럼)평균 : AVG(컬럼)  3) 전체 데이터의 개수 구하기데이터 개수 : COUNT(컬럼) -> 컬럼명 대신 1 혹은 * 사용 가능몇 개의 값을 가지고 있는지 구할 때 : DISTINCT  4) 데이터의 범위, 최솟값돠 최댓값 구하기최솟값 : MIN(컬럼)최댓값 : MAX(컬럼)  2. GROUP BY로 범주별 연산 한 번에 끝내기카테고리별로 숫자 연산을 간단하게 하기여러 번의 Query 없이, 카테고리를 지정하여 수식 함수로 연산 할 수 있다 기본 구..

[내일배움캠프] 엑셀보다 쉽고 빠른 SQL 1주차

수업 목표데이터베이스와 SQL이 무엇인지 이해한다SELECT, FROM 문을 이용하여 데이터를 조회한다WHERE 절을 이용하여 데이터를 필터링한다1. SQLSQL은 데이터베이스와 대화를 하기 위한 언어데이터베이스는 쉽게 말해 '데이터가 저장되어 있는 큰 폴더'테이블은 엑셀과 유사한 구조로 데이터를 갖고 있고, 각 열을 '컬럼' 혹은 '필드'라고 부름 2. SQL 데이터 조회하기(SELECT, FROM)SELECT : 데이터를 가져오는 기본 명령어로, 데이터를 조회하는 모든 Query에 사용됨From : 데이터를 가져올 테이블을 특정해주는 문법* : 모든 컬럼을 가져와준다는 의미# food_order 테이블의 모든 컬럼 가져오기 select *from food_orders# customers 테이블의 모든..

[내일배움캠프] 데이터 리터러시

수업 목표데이터를 올바르게 활용하고 해석할 수 있는 역량인 데이터 리터러시에 대해서 알아봐요성공적인 데이터 프로젝틀르 위한 기초 단계인 문제 정의에 대해서 배워요지표 정의를 위한 데이터의 종류와 활용법에 대해 알아봐요정의한 문제를 판단할 수 있는 지표를 정의하는 방법과 종류에 대해 배워요데이터 분석의 마지막 단계인 결론 도출에 대해 배워요 1. 데이터 리터러시(Data Literacy)데이터를 읽는 능력데이터를 이해하는 능력데이터를 비판적으로 분석하는 능력결과를 의사소통에 활용할 수 있는 능력즉, 데이터 수집과 데이터 원천을 이해하고, 주어진 데이터에 대한 다양한 활용법을 이해하며 데이터를 통한 핵심 지표를 이해하는 것이다. 또한, 데이터 리터러시는 올바른 질문을 던질 수 있도록 만들어 준다. 1) 데이..

[내일배움캠프] 데이터 분석 파이썬 종합반 5주차

수업 목표다양한 유용한 문법들을 숙지하고 적재적소에 사용할 수 있다 [ 참고 ]- 가지고 있는 데이터 파일을 구글 코랩에 읽어드리려면 '드라이브 마운트'를 해준 후 파일 업로드해야 한다.# 드라이브 마운트 코드from google.colab import drivedrive.mount('/content/drive')  그 후 읽어들이고 싶은 데이터 파일을 구글 드라이브 중 원하는 폴더 안에 넣고 그 파일이 위치한 경로를 이용하여 파일 불러올 수 있음# 아래는 제가 데이터 파일을 넣은 구글 드라이브 경로에요!# 제 구글 드라이브 안에 '스파르타코딩클럽_데이터분석을위한파이썬'이라는 폴더가 있는데# 그 안에 파일을 넣은 상황 입니다.# 여러분의 폴더 이름에 맞게 경로를 바꾸어 보세요! root = "/conte..

[내일배움캠프] 데이터 분석 파이썬 종합반 4주차

수업 목표함수에 대해 이해하고 어떤 코드든 함수 형태로 만들 수 있다. [ 함수를 통해 무엇을 할 수 있을까? ]- 함수를 활용하여 긴 길이의 코드를 하나로 묶어 효과적으로 활용 가능머신러닝과 딥러닝이 하나의 거대한 함수데이터 처리하는 하나의 흐름(과정)을 함수로 제작 가능파이썬 코드를 하나의 함수로 묶어놓아 보다 효율적으로 사용 가능훨씬 더 길고 복잡한 코드들을 함수로 만들 수 있다간결하게 다양한 작업들을 수행할 수 있다 1. 함수 기본 배우기1) 함수란?함수는 입력을 받아 원하는 처리를 한 후 출력을 내보내는 일련의 작업을 수행하는 코드 블록프로그램 내에서 특정한 기능을 수행하기 위해 코드를 논리적으로 그룹화하여 재사용 가능한 형태로 정의 - 함수의 필요성코드 재사용 : 반복되는 코드를 함수로 정의하..

[내일배움캠프] 데이터 분석 파이썬 종합반 3주차

학습 목표조건문을 이해하고 특정 조건에 해당되었을 때 코드가 실행되게 할 수 있다반복문을 이해하고 코드를 원하는 만큼 반복되게 할 수 있다1. 조건문1) 조건문이란? : 특정 조건이 참(True)인 경우에만 특정 코드 블록을 실행  파이썬에서 조건문은 if, elif(else if의 줄임말), else 키워드를 사용하여 구성# 조건문의 기본 구조x = 10if x > 0:    print("양수입니다.")elif x 0:    print("음수입니다.")else:    print("0입니다.")출력 : 양수입니다.# 예시x = 10if x > 5:    print("x는 5보다 큽니다.")else:    print("x는 5보다 작거나 같습니다.")출력 : x는 5보다 큽니다.  2) 들여쓰기 및 띄어쓰..

[내일배움캠프] 데이터 분석 파이썬 종합반 2주차

학습 목표리스트가 무엇인지 알고 생성하며 활용할 수 있다.리스트와 튜플의 차이점을 이해하고 튜플을 생성할 수 있다.딕셔너리의 키(key)와 값(Value)의 개념을 이해하고 딕셔너리를 자유자재로 다룰 수 있다.[ 리스트, 튜플, 딕셔너리를 통해 무엇을 할 수 있을까? ] - 데이터를 자유자재로 다룰 수 있고 정리할 수 있다딥러닝 모델을 반복 학습하여 결과를 리스트에 추가데이터를 불러올 때, 경로 처리할 때 split 사용데이터를 임의의 범위만큼 선택할 때 슬라이싱, 인덱싱 사용데이터를 변경 불가능하게 사용하고 싶을 때데이터를 담는 하나의 방법주로 맨 처음 데이터를 불러오고 가공할 때 사용결과를 저장할 때 많이 사용1. 리스트 1) 리스트란? : 리스트는 파이썬에서 가장 자주 사용되는 데이터 구조 중 하나..

[내일배움캠프] 데이터 분석 파이썬 종합반 1주차

수업 목표파이썬에 대해서 이해하하고 왜 파이썬을 써야하는지를 이해한다출력문을 통해 내가 원하는 결과를 출력할 수 있다변수에 대한 개념을 이해하고 각 변수들을 종류에 맞게 자유롭게 사용할 수 있다파이썬은 다른 프로그래밍 언어에 비해 진입장벽이 낮고 직관적이며 코드 실행 결과를 수시로 확인해볼 수 있기 때문에 초보자들이 입문하기 좋은 언어이다.파이썬은 다양한 데이터 분석 패키지(ex.pandas), 데이터 시각화 패키지(ex.matplotllib, seaborn), 머신러닝 패키지(ex.scikitlearn), 딥러닝 패키지(ex. pytorch, tensorflow) 등을 사용할 수 있기 때문에 데이터 분석에서 매우 중요한 언어[ 데이터 분석에서의 파이썬 기대효과 ]데이터 관리 : 당장 데이터 분석을 위해..