
유영주
Contact
Email [email protected]
Phone 010-6860-5009
Introduce
안녕하세요. 데이터를 통해 사용자들의 니즈를 파악하고 이를 비지니스 전략에 적용하는 데이터 분석가 유영주입니다.
Core Competency
- 사용자 경험 개선에 대한 깊은 관심이 있으며 분석을 통해 사용자가 실제로 원하는 기능과 개선점을 찾아내어 더 나은 서비스 경험을 제공하는 데 중점을 둡니다.
- 분석 과정에서 직면하는 문제들을 능숙하게 해결하며 데이터 노이즈 제거와 모델 튜닝 과정에서 발생하는 다양한 문제들을 효과적으로 처리하고 분석의 정확도를 높이는 유의미한 결과를 도출합니다.
Skills
[Language] Python, R, MySQL, SAS
[BI] Tableau
[OA] Excel, PowerPoint
[ETC] Slack, Notion
Projects
24.07 ~ 24.09
(6주)
26,848개의 유튜브 댓글 분석을 통한 아이폰 사용자 경험 및 차세대 기능 분석 프로젝트
26,848개의 아이폰 및 iOS 관련 댓글을 분석하여 대한민국 사용자들의 요구사항과 경험을 파악
차세대 아이폰 기능 개선 및 사용자 경험 향상을 위한 유용한 정보를 도출하고 엔지니어팀에 기술 개발 방향성을 제시
기술 : Python(Pandas, LDA, NLP, Seaborn 등), MySQL, Excel, Youtube API
주요 역할
- 데이터 수집 및 전처리:
- 유튜브 API를 사용하여 ‘아이폰’, ‘iOS’ 관련 영상 댓글을 추출
- 불용어 제거, 광고 댓글 삭제, 분석 가치가 있는 댓글을 선별하기 위한 단어 리스트 생성
- 사전 기반의 정규화 과정을 통해 댓글 내 다양한 표현을 통일화
- kiwipiepy를 활용하여 문장 분리, 맞춤법 교정 및 토크나이즈 작업 수행
- 분석 모델 선정 및 구현: 감정 분석을 위한 KoELECTRA 모델과 토픽 모델링을 위한 LDA 모델을 적용하여 사용자 경험 분석 수행
- 인사이트 도출 및 연구노트 작성: 분석 결과를 바탕으로 사용자의 요구사항과 경험을 도출하고 이를 바탕으로 연구노트 작성
트러블 슈팅
- 데이터 노이즈 제거: 광고 댓글 및 불용어로 인한 데이터 노이즈를 식별하고 제거하는 과정에서 발생한 문제 해결
- 감정 분석 모델 튜닝: KoELECTRA 모델의 성능 향상을 위해 파인튜닝 작업을 진행하여 감정 분석의 정확도를 개선
- LDA 토픽 모델링 최적화: 토픽 수 및 모델 파라미터 최적화를 통해 의미 있는 토픽을 도출하는 데 집중
기술 의사 결정
- KoELECTRA 모델 선정: 한국어 감정 분석을 위해 기존 모델과 비교하여 가장 높은 성능을 보인 KoELECTRA를 선택
- 데이터 정규화 및 전처리 전략 수립: 사전 기반의 정규화 및 kiwipiepy를 활용한 전처리 방식을 결정하여 분석의 일관성과 정확성 확보
24.07
(1주)
배틀그라운드 게임 데이터를 활용한 유저 실력 예측 및 성능 분석 모델 개발 프로젝트
Kaggle의 배틀그라운드 데이터셋을 활용하여 유저의 실제 실력과 예측 등수를 비교할 수 있는 모델을 개발
기술 : Python(Pandas, RandomForest, XGBoost, LightGBM 등), MySQL, Excel
주요 역할
- 데이터 수집 및 전처리:
- 이상치 제거 및 파생 변수 생성
- 다양한 매치 타입을 구분하여 데이터의 일관성을 확보
- 분석 모델 선정 및 구현: 비선형 데이터를 처리하기 위해 RandomForest, XGBoost, LightGBM 모델을 사용하여 유저 실력 예측 모델을 구현
트러블 슈팅
- 데이터 노이즈 제거: 비정상적으로 높은 수치를 보이는 이상치 데이터를 식별하고 제거
- 다중공선성 문제 해결: 변수들 간의 다중공선성을 줄이기 위해 파생 변수를 생성
기술 의사 결정
- RandomForest와 XGBoost 모델 선택: 비선형 데이터에 강한 성능을 보이는 RandomForest와 XGBoost 모델을 선택하여 예측 성능을 향상
Education
17.03 ~ 24.02
한국외국어대학교 글로벌캠퍼스
Activities
Award & Certificate