ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 주요 게임사 뉴스_키워드 출현 빈도순 정렬
    코딩 및 데이터분석/웹크롤링 2023. 6. 28. 04:48

    네이버뉴스에서 '관련도순', '최근 6개월' 옵션을 선택하고 99페이지까지(즉 1000개 기사) 크롤링한 뒤, 뉴스 제목에 사용된 단어를 출현 빈도순으로 정렬했다. 이때 일반적인 불용어 외에도 각 기업명과 너무 자주 쓰이는 단어는 제외했다. (예: '업데이트', '출시', '신규', '게임', 엔씨소프트 기사일 때 "엔씨소프트", 넥슨 기사일 때 "넥슨" 등) 아래는 그 결과이다.

     

    연습삼아 해보았는데, 뉴스 제목을 단어로 자를 때 좀 세심하게(?) 자르는 방법이 없는 건지 고민을 해봐야겠다. '배틀그라운드'가 '배틀', '라운드'로 잘리고, '김창한'이 '김창' '한'으로 잘리고... 이 문제를 해결하지 못하면 실제 적용하기 좀 애매할 듯하다.

     

    1. 넥슨

     

    2. 엔씨소프트

     

    3. 넷마블

    '신의' '탑'이 잘려서 나오는 거 같은데... 어떻게 처리해야 할지 잘 모르겠다;;

    4. 크래프톤

    도대체 '김창한'을 왜 '김창'으로 자르는 걸까..? 쓰읍...

Copyright 2023. 준호의 게임 이야기. All rights reserved.