학습 및 사례

[빅데이터분석기사 실기 1탄] 학습계획 수립

에스오에스데이터랩 2025. 5. 19. 09:35

동기부여? 동기부여? 동기부여?

왜 해야지? 왜 해야지? 왜 해야지?

 

답을 찾을수 없다. 그래서 '빅데이터 경진대회' 참여 및 상금 획득으로 했다.

 

학습계획

 

항목 내용
학습목적 - 2025년/2026년 빅데이터 경진대회 도전 (상금 일천만원이하 확보)
- 안산시/경기도 경진대회
학습목표 80점/100만점
자가진단 문제가 무엇인지 알고있다. 그러나 R함수로 못 푼다
학습방법 - 주말 영상 청취 
- 주중 R 함수 실습 
- 암기 및 반복
학습자료 - 동영상 3파트 ( 총20시간, 통계청 통계인재개발원)
- NCS 자료 및 관련 서적
- 구글 제미니
학습기간 05.24() ~ 06.20(금)
시험일 06월 21일(토) 10:00
위기요인 시간제약
** 컨설팅 역량교육(5일) 및 컨설팅 시작(6월)
** 슬기로운 직생 배정

 

 

 

문제분석 및 자가진단

 

문제유형 내용  점수



데이터전처리

1) 정규화 변환
 2) 0.5 큰값 추출
 30
Machine Learning

1) 성별예측 모델(train)
2) 성별예측 결과(test)
3) CSV 파일 저장 및 제출
4)제출형식 준수
40

통계분석

1)  이산변수 독립성검증
2) 로지스틱 회귀분석
3) Odds ratio 구하기
30 

 

  • 문제는 3개유형 9개 문제
  • 문제별 첫번째 틀리면 두번째도 틀린다.
  • '시각화' 은 없다.
  • 텍스트마이닝은 없다
  • 40점 과목에 집중해야한다. (** 틀리면 THE END.)

'문제가 무엇을 구해야하는지를 알고 있으나 R함수로 풀수 없다.' 

과목 세부분류 내용 자가진단
데이터전처리   데이터셋 읽기 및 출력
데이터셋 추출 및 조합
변환 (정규화, 표준화)
특이값 처리
NA 처리
기준값 이상 처리
설명할수있다. 그러나 R로 못푼다.
머신러닝 분류모델 KNN
Naive Bayes
Logistic Regression
ANN
Decision tree
SVM
Ensemble
분류검증 confusion matrix
예측모델 Simple linear regression
ANN
Regression tree
SVM
Ensemble
예측검증 Sum of Square
자율 k-means
PCA
통계   가설검정
이산변수 독립성검정
교차표
분산분석
상관분석
회귀분석

 

 

학습자료

 

항목 내용
영상 - 데이터 전처리(2025, 3시간
- R을 활용한 통계분석(2025, 12시간)
- 노코딩으로 배우는 머신러닝(2025, 5시간)
** 통계청 통계인재개발원 무료 이러닝
디지털교재 NCS 빅데이터 분석
** www.ncs.go.kr
참고서적 - 데이터과학입문자를 위한 R
- R 통계분석
- R 데이터분석
- 경영경제통계학
도구 - R 4.5 
- 시험환경 체험
- 구글 제니미
- 구글 칼렌더

 

 

학습전략

 

  - 머심러닝 문제 40점 100% 확보 

  - R함수 암기, 반복과 복기

 

 

실행계획서

 

 

구글 캘린더에 학습량 배분!

주말에 영상 학습 그리고 주중에 R함수 실습순으로 반복!

 

 

장소에 상관없이 R함수 실습!

 

'목적'을 늘 기억하자!  '일천만원' ~~^^

 

도전! GO! GO!