Se ha denunciado esta presentación.
Utilizamos tu perfil de LinkedIn y tus datos de actividad para personalizar los anuncios y mostrarte publicidad más relevante. Puedes cambiar tus preferencias de publicidad en cualquier momento.

데이터분석의 길 2: “고수는 최고의 연장을 사용한다” (툴채인)

4.415 visualizaciones

Publicado el

데이터 분석의 길 시리즈 (권재명)

Publicado en: Datos y análisis
  • Inicia sesión para ver los comentarios

데이터분석의 길 2: “고수는 최고의 연장을 사용한다” (툴채인)

  1. 1. 데이터분석의 길 2: “고수는 최고의 연장을 사용한다” (툴채인) Mar 2015 권재명
  2. 2. “훌륭한 목수는 연장을 탓하지 않는다”—속담
  3. 3. 데이터분석 고수가 되기 위해서는 최고의 연장 (툴채인; toolchain)을 구비하는 것이 중요하다. 최고의 연장은 컴퓨터와 몇가지 오픈소스 소프트웨어들이다. 툴 설치에 관한 디테일들은 생략한다. 앞장에서 “고기를 잡을 줄 알게 된" 여러분 들에게는 쉬운 일일 것이다: 구글에서 검색하고, 웹페이지에서 따라하면 된다. * 다시 강조하건데, 이것은 2015년 현재 실리콘밸리 인터넷사업 자료분석가들이 흔히 사용하는 툴채인 이다. 다른 지역 / 인더스트리의 툴들은 다를 수 있다. 고수의 연장
  4. 4. 보통* 맥 OSX 아니면 리눅스 랩탑. 하여간 유닉스/리눅스 되는 것이 좋다. (unix command line tool 때문에...) * 어디까지나 실리콘밸리가 그렇다는 것. 이 시리즈의 모든 내용은 MS 윈도우즈 (Windows) PC 에서도 실행가능하다. 유일하게 부족한 “bash” 부분은 cygwin이나 win-bash 등의 소프트웨어로 이뮬레이션이 가능하다. 구글에서 “windows bash” 로 검색해보자. 연장: 컴퓨터
  5. 5. 해당 사이트에서 다운받고 인스톨하면 된다. 인터넷에 연결한 후, RStudio 를 실행하고 다음 패키지들은 설치해주자. 앞으로 자주 쓸 것이다. 연장: R과 알스튜디오 (RStudio)
  6. 6. 연장: 써브라임 에디터 (Sublime Text) 코딩 덕후들은 좋은 에디터에 (그리고 좋은 의자!)에 집착한다. 현재 밸리의 최고인기에디터는 써브라임 에디터이다. http://www.sublimetext.com/ 50불이다. 오만원이 아까우면 무료로 며칠에 한번 나오는 “안사실래요?" 메시지 를 무시하고 쓰면 된다. 써브라임 에디터의 강점: ● 키보드 숏컷들, ● 무한한 개인화 기능들 (customization), ● 고수들이 공헌한 수많은 쓸모있는 패키지들, 등등. 특히 다중선택 (multiple selection; Cmd+D)은 묘한 중독성이 있다.
  7. 7. 패키지 덕을 잘 보려면 일단 Sublime Package Control부터 설치하자. “Cmd+Shift+P”를 누르면 Command Palette 시작. “install”을 입력하면 아래와 같은 리스트가 뜨고, 그중 “install package”를 선택하면 몇 초 후 (굉장히 많은 패키지를 읽어옴) 패키 지 리스트가 로드된다. 그중 원하는 패키지를 찾아서 선택하면 인스톨된다. 써브라임 에디터 셋업
  8. 8. 써브라임 에디터 유용한 패키지들 개인 취향마다 다르겠지만 내가 생각하는 필수 패키지는: ● Monokai-extended # 화면이 편안해진다 ● SublimeLinter # 코드 linting ● SublimeLinter-pylint # pylint plugin ● Markdown-extended # 마크다운 신택스 하이라이트 ● GitGutter # 깃(git)에서 편집된 행이 어디인지를 보여준다.
  9. 9. Git Gutter , Pylint 맞뵈기. 자세한 것은 나중에...
  10. 10. 연장: 파이썬 Python “anaconda python”이 가장 속편한 디스트리뷰션이다. 2.7 버전이 아직은 쓸만하다. (3.x 버전으로 갈아탈 필요 없는 듯) 다음처럼 정상적으로 인스톨되었는지 확인!
  11. 11. OSX에 기본으로 따라 나오는 터미널이다. “Terminal” 앱을 실행하면 된다. 일단은 간단한 명령만 쓰려고 한다: ● ls ● cd ● mkdir ● more ● rm ● mv ● wc ● grep 장기적으로 고수가 되려면 친해지도록 애쓰자. 배쉬 쉘 터미널 (Bash shell)
  12. 12. 맺음... 이로써 최강의 자료분석 시스템이 완성되었다. 너무 쉬워서 눈물이 나려고 하지 않는가?
  13. 13. 1. R and RStudio (Statistical computing) 2. Anaconda Python pip install pylint pip install awscli curl https://sdk.cloud.google.com | bash 3. Sublime Text Editor and packages ln -s /Applications/Sublime Text.app/Contents/SharedSupport/bin/subl /usr/local/bin/subl 4. JDK (Java SE Development Kit) and Eclipse (IDE for Java and more) 5. homebrew (package manager for OSX) 6. oh my zsh and dotfiles (for advanced unix uses) 7. OSX tuning (keyboards repeat / shortcuts; trackpad; terminal windows group) 부록: OSX 노트북 셋업 예

×