통계분석 시각화능력을 키우기

 

<R을 이용한 웹 크롤링과 텍스트 분석>R-Studio를 활용하여 기본적인 통계분석, 시각화 하는 기초능력을 키우는 데 도움을 준다. 이 책은 웹 크롤링을 통해 데이터를 수집하고 R을 이용해 텍스트를 분석하는 R 강의 교재로 활용될 수 있다.

 

R을 이용한 텍스트마이닝은 대용량 텍스트를 분석하는 도구로, 대용량 텍스트로부터 유용한 정보를 추출한다. 텍스트마이닝은 뉴스, 소셜미디어, 논문 등을 분석해 현상을 이해하고, 이론을 검증하는데 목적이 있다. <R을 이용한 웹 크롤링과 텍스트 분석>은 실행과정에서의 오류를 최소화하기 위해 웹 크롤링과 텍스트 분석 처리기법들을 최신 버전으로 실행한 결과를 제시하고 있다.

 

1, 2장은 R 프로그램의 기본 원리를 이해할 수 있도록 구성되어 있다. 3장은 R 프로그램의 기초 사용법을 익힐 수 있게 하고, 4장으로 기본적인 객체지향형 데이터 구조를 이해할 수 있다. 5장의 R기초통계는 통계의 이론적인 접근과 더불어 데이터에 대한 기술통계량과 중급통계를 실행할 수 있는 능력을 끌어올릴 수 있게 하고, 6장에서는 다양한 데이터를 그래프로 표현하여 시각화 하고, 데이터에 나타난 현상과 이론적 패턴을 찾아내는 방법을 학습한다. 이 책의 핵심은 7장의 R을 이용한 웹 크롤링과 8장의 텍스트 분석이다. 그렇기 때문에 이 책은 다양한 문서를 스크렙핑 또는 크롤링하는 역량을 익힐 수 있도록 많은 사례를 포함하고 있다.

 

저자는 R의 동향을 파악하고 상용 프로그램과 연결하는 연구를 통해 연구결과를 저널에 발표해왔다. 저자는 초기 R수용과정 경험을 이 책에 반영하고자 노력해왔다. 인공지능 시대, 머신러닝이 중요해진 이 시기에 <R을 이용한 웹 크롤링과 텍스트 분석>이 머신러닝 알고리즘 구현과 텍스트분석을 해내는 학생들을 양성하고 더 나아가 인공지능 연구에 기여가 되기를 기대한다.

 

키워드: R, 텍스트마이닝, 웹크롤링, 텍스트분석, 미디어통계, 미디어커뮤니케이션, Rstudio