본문 바로가기

Data Science29

R을 활용한 다변량 데이터 시각화 :: Data 쿡북 오늘은 R을 활용한 다변량 데이터를 시각화 하는 몇 몇 기본적인 사례를 공유한다.시각화에 대한 방법은 너무도 많고 때에 따라서 적당한 시각화를 고려해야 하기 때문에 많은 사례들을 알아두는것도 도움이 된다고 본다. | Bibrate boxplot 두 변수에 대한 boxplot을 그릴 때 사용한다.MVA 패키지에서 제공한다. 코드library(HSAUR2)library(MVA)data(USairpollution)head(USairpollution) x = USairpollution[,c(4,5)]bvbox(x, xlab="manu", ylab="popul")title("bivariate boxplot")identify(x) # identify함수는 outliers를 밝히기 위해 이용된다. 결과 | Bubbl.. 2017. 3. 6.
텍스트마이닝 - R을 활용한 웹 크롤링 및 단어 연관 분석 (KoNLP) :: Data 쿡북 2017.1.9 춥고 흐림. 수정사항 : 2017-08-18, 인코딩 관련 소스라인 추가 2017-09-11, 텍스트 마이닝 python korea 2017 에서 발표된 명사 추출 관련 자료 link , 데이터 기반의 명사 추출 기법 https://www.slideshare.net/kimhyunjoonglovit/pycon2017-koreannlp, | 들어가며 오늘은 R을 이용해서 웹 데이터를 크롤링하고, 수집된 텍스트를 기반으로 연관 분석을 하는 과정을 공유할까 한다. 참고로 웹 크롤링은 웹 사이트가 빈번하기 바뀌기 때문에 작성하는 현 시점기준의 스크립트임을 밝힌다. 혹 크롤링 대상 사이트에 변경이 있을 경우 해당 부분의 수정은 필요하다| R을 활용한 웹 크롤링오늘 해 볼 것은 1. DAUM 의 영화.. 2017. 1. 8.
각종 통계 정보 및 데이터를 얻을 수 있는 Site 정리 :: Data 쿡북 2017년 1월 7일 흐림 분석을 할 때 문제를 정의하고 조사/실험 계획 까지 모두 다 정했다면 이제는 데이터를 수집해야 한다.그러나 막상 데이터를 어디서 가져와야 할지를 찾는것도 일이고 알아보느라 시간이 다 간다.이번 블로깅에서는 지속적인 업데이트를 통해 각종 통계 정보와 데이터를 얻을 수 있는 곳을 꾸준히 정리할까 한다. 국가 통계정보 관련 ▶ KOSIS 국가통계 포털 (http://kosis.kr)- KOSIS (Korea Statistical Information System)- 통계청을 비롯하여 여러 통계작성 기관에서 제공되고 있는 통계 정보 제공 ▶ e-나라지표 : 국가주요지표 (http://www.index.go.kr)- 국정 전문 분야에 대한 각종 국정통계에 대해 정확한 통계와 추이, 통계.. 2017. 1. 7.
그리스 문자 / 표기 정리 :: Data 쿡북 그리스 문자 / 표기 정리 2017년 1월 5일 맑음 수학이나 통계를 배우다 보면 수포자들이 항상 좌절하는것이 그리스 문자다뜻은 고사하고 읽기도 힘들어 하는 경우가 많은데 잠깐 기억하자는 뜻에서 올려 본다. [출처] http://tire.egloos.com/m/10672217 2017. 1. 5.