학습 및 사례 18

[빅데이터분석기사 실기 7탄] 학습실행 - 범주, 이산 및 연속형 변수 요약 및 검정

주) 본인 학습을 위해 학습기간중 지속적으로 update 됩니다. 방문하신 분들을 위한 것이 아닙니다. 타이핑 연습용!^^ 변수유형설명사례범주모집단을 독립적인 MECE 분해** R에서는 factor라함 남녀, 지역별, 고객등급 등이산정수형 ** R에서는 integer라함-4, -2, 0,1, 2 3,4 ..연속실수형** R에서는 number라함2.5, 4.0, 3.12, .... 범주형(Categorized) 변수 범주형 1개 요약더보기* 도수분포표- table() # 빈도수- prop.table() # 상대빈도- addmargins() # 합계추가- round( , digit=2) # 소수점이하 두자리# dataset - MASS - Cars93library(MASS)str(Cars93)# abs..

학습 및 사례 2025.06.17

Google 제미니와의 컨설팅 협업 - 2차원(=두 변수) 사분면에 기업 배치하기

Q1. 국내 전력케이블 제조 회사들을 찾고 전압과 단위가격의 2차원 평면에 배치해 볼까?더보기국내 주요 전력케이블 제조 회사와 각 회사의 주요 전압별 제품군을 파악해 보았습니다.1. 국내 주요 전력케이블 제조 회사대한민국에서 전력케이블을 제조하는 주요 회사들은 다음과 같습니다:LS전선 (LS Cable & System): 국내 최대이자 세계적인 전선 제조업체로, 초고압(HVDC 포함)부터 중저압까지 모든 범위의 전력케이블을 생산합니다.대한전선 (Taihan Electric Wire): LS전선과 함께 국내 전선 산업의 양대 산맥으로 꼽히며, 초고압, 가공선, 배전용 케이블 등 광범위한 전력케이블 제품군을 보유하고 있습니다.가온전선 (Gaon Cable): LS전선의 관계사로, 초고압, 배전용 케이블, 제..

학습 및 사례 2025.06.15

[빅데이터분석기사 실기 5탄] 학습실행 - 통계분석

주) 본인 학습을 위해 학습기간중 지속적으로 update 됩니다. 방문하신 분들을 위한 것이 아닙니다. 타이핑 연습용!^^ 상관분석 피어슨 모수 상관분석더보기- 두 연속변수의 선형관계- 모집단의 데이터는 '정규분포'를 가정- 모집단의 모 상관 추정이 목적- 피어슨 표본 상관계수로 모상관계수 추정- 양수/음수는 상관의 방향- 계수의 절대값은 상관의 강도- cor(x, y, method=" ") # 피어슨 표본 상관계수- cor.test( ) # 피어슨 모 상관 검정- cor(iris[, c(1:4)]) # 상관행렬# Load dataset irisdata(iris)# check missing valuetable(is.na(iris))FALSE 750 # Check structurestr(..

학습 및 사례 2025.06.07

[빅데이터분석기사 실기 4탄] 학습실행 - 머신러닝, Unsupervised Learning

주) 본인 학습을 위해 학습기간중 지속적으로 update 됩니다. 방문하신 분들을 위한 것이 아닙니다. 타이핑 연습용!^^ Unsupervised Learning이란?더보기더보기비지도 학습 알고리즘은 레이블(=정답)이 없는 방대한 데이터로부터 유용한 정보를 추출하고, 데이터의 본질적인 구조를 이해하는 데 강력한 도구로 활용 머신러닝 수행 단계별 사용 변수명단계내용사용변수명1데이터셋 전처리한다.-2머신러닝 모델 수행한다.model3 검증한다.- ML 모델별 라이브러리 및 함수ML 자율 모델 유형R 라이브러리함수명clusteringclusterkmeans( )Hierarchical Clustering--DBSCAN--Gaussian Mixture Models, GMM--PCAbaseprincomp( )..

학습 및 사례 2025.06.02

경기도일자리재단 베이비부머인턴쉽(컨설팅형) 역량교육 참여 (3) - Problem-solving

머리털 희끗한 베이비부머 용사들~~열공중^^ ** Problem-solving을 하려면 problem이 있어야한다.** solving을 했으니 solution이 나와야한다.** solution은 Gap을 해소시켜야 의미가 있다. ** GAP의 해소는 성과에 영향을 주어야한다. Problem항목내용문제정의기대와 현실의 차이(GAP) 컨설턴트정의문제해결사철학에서의 방법론정의개념 분석(Conceptual Analysis)변증법(Dialectics)현상학(Phenomenology)방법론적 회의(Methodological Doubt)사유 실험(Thought Experiment)** 철학에서의 방법론은 단순히 정해진 길을 따라가는 것이 아니라, 길 자체를 탐구하고, 그 길의 타당성(진리)을 끊임없이 묻는 과정과학..

학습 및 사례 2025.05.31

[빅데이터분석기사 실기 3탄] 학습실행 - 머신러닝, Prediction or Regression

주) 본인 학습을 위해 학습기간중 지속적으로 update 됩니다. 방문하신 분들을 위한 것이 아닙니다. 타이핑 연습용!^^ 머신러닝 수행 단계별 사용 변수명단계내용사용변수명1데이터셋 전처리한다.-2데이터셋 분할한다.train, test3머신러닝 모델 만든다. model4테스트셋으로 '예측'한다.yhat5실제값과 비교 검증한다.(yhat - y) ML 모델별 라이브러리 및 함수ML 분류 모델 유형R 라이브러리함수명다중선형회귀분석(MLR)baselm( )인공지능신경망(ANN)nnetnnet( )Regression트리(RT)rpartrpart( )서포트벡터머신(SVM)kernlabksvm( )랜덤포레스트randomForestrandomForest( )** base : 기본으로 설치된 라이브러리 MSE(..

학습 및 사례 2025.05.27

[빅데이터분석기사 실기 2탄] 학습실행 - 머신러닝, Classification

주) 본인 학습을 위해 학습기간중 지속적으로 update 됩니다. 방문하신 분들을 위한 것이 아닙니다. 타이핑 연습용!^^ 머신러닝 수행 단계별 사용 변수명단계내용사용변수명1데이터셋 전처리한다.-2데이터셋 분할한다.train, test3머신러닝 모델 만든다. model4테스트셋으로 '분류'한다.yhat5실제분류값과 비교 검증한다.- ML 모델별 라이브러리 및 함수ML 분류 모델 유형R 라이브러리함수명K-최근접이웃(KNN)classknn( )나이브베이즈e1071naiveBayes( )다항 로지스틱회귀nnetmultinom( )인공지능신경망(ANN)nnetnnet( )의사결정트리(DT)rpartrpart( )서포트벡터머신(SVM)kernlabksvm( )랜덤포레스트randomForestrandomFores..

학습 및 사례 2025.05.25

[빅데이터분석기사 실기 1탄] 학습계획 수립

동기부여? 동기부여? 동기부여?왜 해야지? 왜 해야지? 왜 해야지? 답을 찾을수 없다. 그래서 '빅데이터 경진대회' 참여 및 상금 획득으로 했다. 학습계획 항목내용학습목적- 2025년/2026년 빅데이터 경진대회 도전 (상금 일천만원이하 확보)- 안산시/경기도 경진대회학습목표80점/100만점자가진단문제가 무엇인지 알고있다. 그러나 R함수로 못 푼다. 학습방법- 주말 영상 청취 - 주중 R 함수 실습 - 암기 및 반복학습자료- 동영상 3파트 ( 총20시간, 통계청 통계인재개발원)- NCS 자료 및 관련 서적- 구글 제미니학습기간05.24() ~ 06.20(금)시험일06월 21일(토) 10:00위기요인시간제약** 컨설팅 역량교육(5일) 및 컨설팅 시작(6월)** 슬기로운 직생 배정 문제분석 및 자가진단..

학습 및 사례 2025.05.19

[직접생산확인] 2025년 실태조사원 역량교육 - 학습계획, 학습방법 및 시험결과

학습계획 항목내용학습목적- 2026년 일천만원이하 수입 확보- [슬기로운 직생] 2026년 12월31일까지 지속가능 확보학습목표80점/100만점자가진단'공직자의 이해충돌 방지법' 취약학습방법- 매일 오전 영상 2개씩 반복 및 자필 요약- 법령, 지침 등 보조 자료로 보완- 다음날 학습 시작전 전날 정리 30분 리뷰를 반복 - 마지막 날에는 전체를 정리한 것을 복기학습자료- 동영상 7개(총 210분),- 제공 법령, 교육 자료 및 카드뉴스학습기간05.12(월) ~ 05.18(일)예정시험일05월 18일(일) 오전시간위기요인'자만심'** 3년 했는데 뭐 별거 있겠어?'초심유지' 학습자가진단 과목영상길이(분)자가진단목표점수직접생산확인제도 및 확인기준 이해82상25공동구매종합정보망의 활용39상20직접생산확인..

학습 및 사례 2025.05.18

[직접생산확인] 공장없는 공장주소로 인한 '배정업체 반납' 사례

'배정업체 반납'이란? 직접생산확인을 위해 배정 받은 업체를 여러 사유로 한국중소기업유통원으로 반납하는 것을 의미한다. (본인이 조사 안하겠다는 의미입니다.) 물론 공공정보서비스망(SMPP)를 통해 반납이 이루어지며 아울러 신청 기업에도 이메일로 통보합니다. '반납 사유' 반납 사유는 여러가지가 있지만 이 업체의 경우 1) '공장 주소'에 불필요한 토지관련 '지번'이 포함 (공식적 사유) --> 삭제요청 2) 공장 토지 쪼개기 상속으로 '회사 자금 유출(?)'의 의심! (비공식적 사유) 조사원의 서류 검토 과정 먼저 조사원의 서류 검토 과정을 살펴보면 아래와 같이 단계별로 범위가 좁아집니다. 사업자등록증명원 > 공장주소 > 건축물대장 > 건물등기부등본 > 임대차계약서단계(제출)문서내용1..

학습 및 사례 2025.05.12