네이버 금융, 주식시장에 발 내미나
파이썬Python웹스크롤링 BS4나 Selenium이나 Pandas의 html read 함수를 이용해서 주식 정보를 가져오려고 시도 했다면 그 과정이 만만치 않음을 알 수 있습니다. ykrx 모듈은 네이버금융Naver finance와 KRX 정보 데이터 시스템에서 주가 정보를 지속적으로 스크래핑scraping 하고 에서 업데이트 해줍니다. 해당 API를 사용하면 단 한줄로 주가 정보를 쉽게 가져 올 수 있습니다. pykrx의 상세 사용법을 알고 싶다면 위에 링크를 클릭해서 확인하시면 됩니다.
데이터 프레임을 CSV 모습 파일로 저장하기
date dfday.iloc0날짜filename fitemnameitemcodedate.csvdfday.tocsvfilename, index Falseprintdone
df.tocsv csv파일로 저장합니다.
index 옵션을 False로 두어 DF의 기초 index가 저장되지 않도록 합니다.
파일명은 종목명종목코드API호출날짜.csv 로 저장합니다.
주식종목 DB 설계
제 포스팅에서는 DB를 설치하고 책상 만들고,. JDBC MYBATIS 이런 일반적인 설명은 현재 너무 길어질것 같으니 처음 실제로 사용할 수 있는 주식종목을 관리하는 테이블에 대하여 설계해봅시다. 처음 주식 종목은 1. 종목코드 2. 종목이름 3. 시장 구분코스피, 코스닥 등 이렇게 크게 이루어 져있고 구분하기 쉽겠습니다. 물론 개인마다. , 기업마다. system 필드를 추가하거나 추가적인 레퍼런스형 컬럼들을 추가해 줄 수 있으나 저희 프로젝트에는 너무 투머치이며 필요합니다.면 정규화를 잘하여 테이블을 따로 빼내어 사용한다면 간결한 책상 형태로 관리 가능할 수 있습니다.
설계이후 작성했지만 생성날짜 정보, 수정날짜 정보한 컬럼을 추가한다면 더 완벽할 것같습니다. 만들고 보니 아쉽네요 그래도 필요한 3가지 컬럼을 만들어줍니다.