코딩 및 데이터분석
-
[유저 이탈 지표 구축 프로젝트]K-means Clustering 예제코딩 및 데이터분석/데이터 분석(pandas, numpy 등) 2024. 1. 26. 04:18
https://lucy-the-marketer.kr/ko/growth/k-means-clustering-python-customer-data-analysis/ K-Means 클러스터링 파이썬 연습 예제 – 고객 구매 데이터 분석 K-Means 클러스터링의 파이썬 예제이다. 본 예제에서는 고객 구매 데이터를 분석하여 유의미한 인사이트를 얻어보는 과정을 다룬다. K-Means에 대한 개념적인 설명은 다음 글(클릭)을 참고하면 좋다 lucy-the-marketer.kr K-Means Clustering Exercise In [6]: # import pandas package import pandas as pd # load excel file using read_excel() function df = pd.re..
-
[유저 이탈 지표 구축 프로젝트][스크랩]코딩 및 데이터분석/데이터 분석(pandas, numpy 등) 2024. 1. 24. 21:16
https://eat-toast.tistory.com/20 유저 이탈 기준 정하기 제가 있는 곳에서는 데이터 분석팀이 있고 각자 담당하고 있는 프로젝트가 있습니다. 그리고 각 프로젝트에는 사업, 마케팅, 개발사가 있어서 그들과 함께 일을 합니다.그런데 각기 다른 프로젝 eat-toast.tistory.com https://data-kindergarten.tistory.com/35 SQL 실무 : DAU 및 신규, 복귀, 기존 유저 구별하기 오늘은 고객의 로그인 기록을 통해 데이터 분석을 해보도록 하겠습니다. 아래와 같이 가상의 모바일 게임 로그인 기록 데이터를 가지고 우리는 DAU(Daily Active User)의 숫자와 고객이 신규 유저인지 data-kindergarten.tistory.com SQL..
-
[네트워크 분석] Pyvis 패키지를 이용한 유저 간 거래 네트워크 분석 (1)코딩 및 데이터분석/데이터 분석(pandas, numpy 등) 2023. 12. 20. 22:19
유저가 부정한 방법으로 재화를 취득한 경우 그 재화를 조사해 회수해야 하는데, 재화를 템창에 고이 모셔놓는 게 아니라 이를 거래, 강화, 분해 등 행위를 통해 계속 변형시키기 때문에 그걸 추적하는 게 쉽지 않다. 지금 내가 관심 있는 주제는 BOT 캐릭터들이 취득한 재화가 과연 어디로 흐르는가이다. 이 주제를 위해 여러가지 찾다가 Pyvis라는 네트워크 분석 패키지를 발견. 매우 유용해보였다. https://pyvis.readthedocs.io/en/latest/introduction.html Introduction — pyvis 0.1.3.1 documentation Introduction The goal of this project is to build a python based approach to..
-
[정리] 평균, 분산, 표준편차, 공분산, 상관계수의 이해코딩 및 데이터분석/통계 관련 기초 지식 2023. 11. 8. 02:31
https://www.youtube.com/watch?v=j4dIbyBRGPw 짧고 굵게 핵심을 짚어서 잘 설명한 강의 - 평균 : 데이터를 모두 더한 뒤 그 수만큼 나눈 값 - 분산 : 평균과 각 데이터 간 차이(편차)를 제곱한 뒤 평균을 낸 값 (단, 표본분산일 경우 n-1로 나눔) : 편차를 평균내면 항상 0이 나오기 때문에 음수를 제거하기 위해 제곱함 - 표준편차 : 분산의 제곱근 : 제곱으로 커진 스케일을 다시 줄이기 위해 루트를 씌움 - 공분산 : 변수 x와 변수 y의 각 데이터의 편차를 곱셈 : 그 곱셈 값의 평균을 냄 : 두 변수 x와 y의 편차 간의 관계를 파악 가능 (음수인가 양수인가) - 상관계수 : 공분산을 변수 x와 변수 y의 표준편차를 곱셈한 값으로 나눔 : 이렇게 하면 상관계수..
-
[스크랩] 250+ Python and Data Science Tips — Covering Pandas, NumPy, ML Basics, Skl코딩 및 데이터분석/데이터 분석(pandas, numpy 등) 2023. 9. 20. 09:10
https://medium.datadriveninvestor.com/250-python-and-data-science-tips-covering-pandas-numpy-ml-basics-sklearn-jupyter-and-more-e33074b92d58 250+ Python and Data Science Tips — Covering Pandas, NumPy, ML Basics, Sklearn, Jupyter, and More.A self-curated collection of Python and Data Science tips to level up your data game.medium.datadriveninvestor.com
-
주요 게임 매체 스크랩하기(bs4 활용)코딩 및 데이터분석/웹크롤링 2023. 7. 26. 00:04
각 기사 옆에 'Summary'라는 이름으로 본문 세 줄 요약까지 해버리고 싶은데, 아직 초보라 방법을 모르겠다. 그리고 이 결과로 만든 xlsx파일을 컴퓨터로 봐봤자 의미가 없기 때문에 모바일로도 간편하게 받아보고 싶은데... 이 역시 방법을 모르겠다. GPT 선생이 없었으면 혼자 힘으로는 절대 이 코드를 얻지 못했을 것이다. AI란 정말 신묘하다. 앞으로 해외 매체들도 추가해볼 생각이다. 각 매체 별로 기사 탭에 들어가면 제일 먼저 보이는 메인 페이지에 노출된 기사의 제목, 링크만 10~20개 정도 추출하는 것이라, 아마 각 홈페이지에 이 스크랩으로 인한 부담은 없을 것이라고 생각한다. 버전 2023.8.10 GameDeveloper 비즈니스 섹션 추가 import requests import pan..
-
파이썬으로 데이터 주무르기 - 챕터 1 실습코딩 및 데이터분석/데이터 분석(pandas, numpy 등) 2023. 7. 23. 21:35
책 정보: https://www.yes24.com/Product/Goods/57670268 파이썬으로 데이터 주무르기 - YES24 독특한 예제를 통해 배우는 데이터 분석 입문이 책은 누구나 한 권 이상 가지고 있을 파이썬 기초 문법책과 같은 내용이 아닌, 데이터 분석이라는 특별한 분야에서 초보를 위해 처음부터 끝까지 www.yes24.com 나는 실습 위주로 부딪히면서 배우는 걸 좋아하는 편이라 기초부터 가르치는 책이 별로 재미가 없었다. 그런데 이 책은 바로 실전으로 들어가서 너무 좋다. 2017년 기준으로 작성된 것 같은데, 지금 기준 데이터랑 다른 점이 있어서 그걸 해결하면서 하다보니 한 줄 한 줄 이해도 더 잘 되는 느낌이다. 나 같은 성향을 지닌 분들에게는 강추하는 책. 이걸 보면서 절실히 느..
-
주요 게임사 뉴스_키워드 출현 빈도순 정렬코딩 및 데이터분석/웹크롤링 2023. 6. 28. 04:48
네이버뉴스에서 '관련도순', '최근 6개월' 옵션을 선택하고 99페이지까지(즉 1000개 기사) 크롤링한 뒤, 뉴스 제목에 사용된 단어를 출현 빈도순으로 정렬했다. 이때 일반적인 불용어 외에도 각 기업명과 너무 자주 쓰이는 단어는 제외했다. (예: '업데이트', '출시', '신규', '게임', 엔씨소프트 기사일 때 "엔씨소프트", 넥슨 기사일 때 "넥슨" 등) 아래는 그 결과이다. 연습삼아 해보았는데, 뉴스 제목을 단어로 자를 때 좀 세심하게(?) 자르는 방법이 없는 건지 고민을 해봐야겠다. '배틀그라운드'가 '배틀', '라운드'로 잘리고, '김창한'이 '김창' '한'으로 잘리고... 이 문제를 해결하지 못하면 실제 적용하기 좀 애매할 듯하다. 1. 넥슨 2. 엔씨소프트 3. 넷마블 4. 크래프톤