본문 바로가기

Python20

[Python] Hadoop에 있는 csv파일 내용 pandas를 사용하여 읽기 안녕하세요. 이번에는 Python으로 Hadoop에 있는 csv파일 내용 pandas를 사용하여 읽기 방법을 알아보려고 합니다. from hdfs import InsecureClient import pandas as pd # hdfsIp - hadoop이 설치 되어 있는 IP를 써주시면 됩니다. ex) 192.168.1.1:9870 client = InsecureClient(hdfsIp) # filePath - hadoop 기준 어디에 있는 파일인지 path를 설정해주시면 됩니다. with client.read(filePath, encoding = 'utf-8') as data: # header - 헤더를 제외하고 데이터를 불러오게 됩니다. / delimiter - csv 구분자를 지정해주는 기능입니다... 2021. 12. 6.
[Python] 파이썬 설치 및 실행 방법 안녕하세요. 이번에는 파이썬 설치하는 법을 알려드릴건데요. 파이썬은 최신 버전보다는 한단계 낮은 릴리즈 버전을 다운받는것을 추천드립니다. ex) 3.10.x 이 최신이라면 3.9.x를 추천 드립니다. 그렇다면 파이썬 설치법을 알려드리겠습니다. 첫번째로는 파이썬 공식 사이트에 가서 원하는 버전의 파이썬을 설치하시면 됩니다. 현재 기준 3.10.x가 최신이므로 3.9.x 버전을 설치하도록 하겠습니다. https://www.python.org/downloads/ Download Python The official home of the Python Programming Language www.python.org 글 쓰는 날을 기준으로는 3.9.x 중 3.9.7이 제일 최신이네요! 그럼 저는 3.9.7을 설치해보.. 2021. 10. 19.