전체 글 (52) 썸네일형 리스트형 Anaconda, jupyternotebook 설치 ( Centos 7 ) anaconda + jupyter_notebook + python 3.8.5 https://www.anaconda.com/products/individual anaconda 사이트 접속 후 python 3.8에 해당하는 installer 파일 다운로드 (.sh) 다운받은 파일 명령어 실행 sh Anaconda3-2020.11-Linux-x86_64.sh license terms 관련해서 yes|no 나오면 yes 입력 path 설정 부분이 나오면 원하는 경로 입력 yes -> .bashrc 파일에 환경변수 기록 혹시 no를 입력해서 path 설정이 안됐다면 $sudo vi ~/.bashrc 로 들어가서 export PATH=/home/.../anaconda3/bin:$PATH 를 추가 :wq 후 터미널 .. 하둡 분산저장 + 분산처리 확인 ( 미항공데이터 + 맵리듀스 wordcount ) + 윈도우 리눅스 연동( 파일 전송, 호스트 설정 ) 먼저 하둡에 데이터가 잘 올라가는지 체크 먼저 해보겠습니다. stat-computing.org/dataexpo/2009/the-data.html The data. Data expo 09. ASA Statistics Computing and Graphics Data expo ‘09 Get the data The data comes originally from RITA where it is described in detail. You can download the data there, or from the bzipped csv files listed below. These files have derivable variables removed, are packaged in yearly chunks and h .. Hadoop - HDFS HDFS는 범용 하드웨어에서 동작하고, 장애 복구성을 가지는 분산 파일 시스템을 목표로 합니다. - HDFS는 실시간 처리보다 배치처리를 위해 설계 - 빠른 데이터 응답시간이 필요한 작업에는 취약 이전 1 ··· 9 10 11 12 13 14 15 ··· 18 다음