import urllib.request
from furl import furl
import json
import math
from time import sleep

import pandas as pd

# 날짜, 파일명 세팅을 위한 import
import datetime
from datetime import datetime

# Navet API KEY
client_id = "YOUR_CLIENT_ID"
client_secret = "YOUR_CLIENT_SECRET"

def Security_Main():
    json_result = []
    req_query = ['정보보안', '정보보호']
    req_display = '100'
    req_sort = 'date'
    req_target = ['news']  # 네이버 뉴스

    Search_Main(req_target, req_query, req_display, req_sort, json_result)


def Search_Main(req_target, req_query, req_display, req_sort, json_result):
    nStart = 0

    for target_url in req_target:  # 검색섹션을 정한다
        json_result.clear()

        for target_query in req_query:  # 검색 키워드를 정한다
            check_today = 0
            target_query = target_query.rstrip('\n')
            print("\nKeyword is " + target_url + "_" + target_query + ".......")
            json_search = Set_Search_Option(target_url, target_query, 1, req_display, req_sort)
            if (json_search == None):
                json_result.append({'Keyword': "", 'Title': "", 'Description': "", 'Link': "", 'Date': ""})
                continue

            while ((json_search != None) and (json_search['display'] != 0)):
                for post_data in json_search['items']:
                    if (post_data['originallink'] != None):
                        date_result = Calc_Date(post_data)

                        if (date_result == 0):
                            Get_Data(post_data, json_result, target_query)
                        else:
                            pd.set_option('display.max_columns', 5)
                            pd.set_option('display.width', 5000)
                            df = pd.DataFrame(json_result)
                            print(df)
                            check_today = 1
                            break

                tmp_nStart = nStart
                nStart = json_search['start'] + json_search['display']
                if (nStart == 1001 or (
                        nStart - json_search['start']) < 100 or tmp_nStart == nStart or check_today == 1):
                    break
                json_search = Set_Search_Option(target_url, target_query, nStart, req_display, req_sort)


def Calc_Date(post_data):
    date_result = datetime.strptime(post_data['pubDate'], '%a, %d %b %Y %H:%M:%S +0900')
    now_time = datetime.now()
    calc_time = now_time - date_result

    if (calc_time.days == 0 and math.floor(calc_time.seconds / 3600) < 24):
        ret_calc = 0
    else:
        ret_calc = 1
    return ret_calc

# 검색 결과를 얻어옴
def Set_Search_Option(target_url, search_keyword, page_start, display, sort):
    sleep(0.1)
    url = furl('https://openapi.naver.com/v1/search/' + target_url)
    url.args['query'] = search_keyword
    url.args['display'] = display
    url.args['sort'] = sort
    url.args['start'] = page_start

    ret_data = Get_Search_Result(url)

    if (ret_data == None):
        return None
    else:
        return json.loads(ret_data)

# 검색 요청 보냄
def Get_Search_Result(req_url):
    request = urllib.request.Request(req_url)
    request.add_header("X-Naver-Client-Id", client_id)
    request.add_header("X-Naver-Client-Secret", client_secret)
    try:
        response = urllib.request.urlopen(request)
        rescode = response.getcode()

        if (rescode == 200):
            return response.read().decode('utf-8')
    except Exception as e:
        print(e)
        print("Error Code:" + str(req_url))
        return None

# 필요한 데이터만 선별
def Get_Data(post, jsonResult, query):
    title_result = post['title']
    description_result = post['description']
    link_result = post['link']

    date_result = datetime.strptime(post['pubDate'], '%a, %d %b %Y %H:%M:%S +0900')
    col_date = date_result.strftime('%Y-%m-%d %H:%M')

    jsonResult.append({'Keyword': query, 'Title': title_result, 'Description': description_result, 'Link': link_result, 'Date': col_date})

    return

Security_Main()

Keyword is news_정보보안.......
    Keyword                                            Title                                        Description                                               Link              Date
0      정보보안  컴퓨터학원 코리아IT아카데미, ‘뜻밖의 특템’ 이벤트로 31,000여 개의 무료...  <b>정보보안</b>학원 코리아IT아카데미 관계자는 “따즈아 온라인 강의는 코리아교...  http://edu.donga.com/?p=article&ps=view&at_no=...  2020-04-29 12:00
1      정보보안                       서울시 2022년까지 와이파이6 공공생활권 설치  장비 성능평가시험(BMT)에 참여를 희망하는 업체는 5월11일(월)~12일(화) 서...  http://www.newsmaker.or.kr/news/articleView.ht...  2020-04-29 11:58
2      정보보안         쌍용차 리스펙 코란도·티볼리···&quot;CJ오쇼핑에서 판매&quot;  안전 및 <b>보안</b>, 비서, <b>정보</b>, 즐길거리, 원격제어, 차량관...  http://www.seoulfn.com/news/articleView.html?i...  2020-04-29 11:55
3      정보보안        모질라, 인기 높은 화상 회의 앱 15개의 <b>보안</b>성 검사해 발표  많은 사람들이 찾는 유명 앱들이며, 사용자들이 궁금해 하는 <b>보안</b> 관련 ...  http://www.boannews.com/media/view.asp?idx=879...  2020-04-29 11:54
4      정보보안            서울 S-NET 핵심 와이파이6 구축 돌입...BMT 참여기업 공모  장비 성능평가시험(BMT)에 참여를 희망하는 업체는 5월 11일~12일 서울시청 <...  https://news.naver.com/main/read.nhn?mode=LSD&...  2020-04-29 11:40
..      ...                                              ...                                                ...                                                ...               ...
132    정보보안          롤스로이스, COVID-19 데이터 연합 구축…비즈니스·경제 회복 지원  데이터 출판물과 라이선스, 개인<b>정보</b>보호 및 <b>보안</b>, 데이터 ...  http://www.efnews.co.kr/news/articleView.html?...  2020-04-28 12:55
133    정보보안                      인텔, 마이크로소프트 애저 DCsv2-시리즈 출시  애저는 클라우드에서 데이터를 처리하는 동시에 <b>보안</b> 및 개인 <b>정보<...  http://www.it-b.co.kr/news/articleView.html?id...  2020-04-28 12:42
134    정보보안                             인텔, 애저 기밀 컴퓨팅의 기반 마련  애저는 클라우드에서 데이터를 처리하는 동시에 <b>보안</b> 및 개인 <b>정보<...  http://sports.news.naver.com/esports/news/read...  2020-04-28 12:40
135    정보보안          포스트 코로나19 시대를 준비하는 유망기술은? 29일 온라인 포럼 개최  □ (2단계 : 영역별 변화상) 두 번째 단계로,향후 4대 환경변화에 의해서 큰 변...  https://news.naver.com/main/read.nhn?mode=LSD&...  2020-04-28 12:20
136    정보보안   &quot;포스트코로나 원격의료·비대면 서비스 향상…글로벌 공급망도 재편&quot;  두 번째 단계로, 향후 4대 환경변화에 의해서 큰 변화가 예상되는 사회·경제 영역으...  http://www.topstarnews.net/news/articleView.ht...  2020-04-28 12:13

[137 rows x 5 columns]

Keyword is news_정보보호.......
    Keyword                                            Title                                        Description                                               Link              Date
0      정보보안  컴퓨터학원 코리아IT아카데미, ‘뜻밖의 특템’ 이벤트로 31,000여 개의 무료...  <b>정보보안</b>학원 코리아IT아카데미 관계자는 “따즈아 온라인 강의는 코리아교...  http://edu.donga.com/?p=article&ps=view&at_no=...  2020-04-29 12:00
1      정보보안                       서울시 2022년까지 와이파이6 공공생활권 설치  장비 성능평가시험(BMT)에 참여를 희망하는 업체는 5월11일(월)~12일(화) 서...  http://www.newsmaker.or.kr/news/articleView.ht...  2020-04-29 11:58
2      정보보안         쌍용차 리스펙 코란도·티볼리···&quot;CJ오쇼핑에서 판매&quot;  안전 및 <b>보안</b>, 비서, <b>정보</b>, 즐길거리, 원격제어, 차량관...  http://www.seoulfn.com/news/articleView.html?i...  2020-04-29 11:55
3      정보보안        모질라, 인기 높은 화상 회의 앱 15개의 <b>보안</b>성 검사해 발표  많은 사람들이 찾는 유명 앱들이며, 사용자들이 궁금해 하는 <b>보안</b> 관련 ...  http://www.boannews.com/media/view.asp?idx=879...  2020-04-29 11:54
4      정보보안            서울 S-NET 핵심 와이파이6 구축 돌입...BMT 참여기업 공모  장비 성능평가시험(BMT)에 참여를 희망하는 업체는 5월 11일~12일 서울시청 <...  https://news.naver.com/main/read.nhn?mode=LSD&...  2020-04-29 11:40
..      ...                                              ...                                                ...                                                ...               ...
472    정보보호                           개별주택 공시가격 열람 및 이의신청 접수  지난해부터 전자 열람의 보편화, 개인<b>정보보호</b>, 예산 절감 등에 따라 개...  http://www.upkorea.net/news/articleView.html?i...  2020-04-28 12:30
473    정보보호       경기남부경찰, 성 착취물 제작·판매·유포 72명 검거...10대가 가장 많아  경찰은 이들 중 9명을 아동·청소년의 성<b>보호</b>에 관한 법률 위반 등 혐의...  http://www.hg-times.com/news/articleView.html?...  2020-04-28 12:24
474    정보보호             한국환경공단, '가축분뇨 전자인계관리시스템' 사전 알림 기능 강화  액비살포 금지구역 알림 기능은 전국 수변구역 및 상수원 <b>보호</b>구역 위치<...  http://theleader.mt.co.kr/articleView.html?no=...  2020-04-28 12:24
475    정보보호                 서울아산병원, '의료진 손위생' 인공지능(AI) 관리 가능  의료진 개인<b>정보</b>가 안전하게 <b>보호</b>된다는 장점이 있다.서울아산...  http://www.dailymedi.com/detail.php?number=855...  2020-04-28 12:20
476    정보보호      KISA, 중소기업 ‘개인<b>정보</b> 솔루션’ 지원… 점검도구 무료 배포  지난 2015년부터 개인<b>정보보호</b> 종합포털을 통해 배포하고 있다. 특히 ...  http://www.viva100.com/main/view.php?key=20200...  2020-04-28 12:20

[477 rows x 5 columns]

파이썬으로 홈택스 사업자등록상태조회 프로그램 만들기 (0)	2020.05.29
네이버 검색 API를 이용한 코로나, 부동산 뉴스 검색 - with Python (0)	2020.04.03
네이버 Open API 로 단축 URL 생성하기 (0)	2020.03.10
파이썬 & Nmap 으로 Anonymous FTP 찾기 (0)	2020.03.09
네이버 파파고 API로 번역 프로그램 만들기 by Python (0)	2020.02.26

Audit & Security

네이버 검색API로 키워드 수집(with Python)

'Programming > Project' 카테고리의 다른 글

티스토리툴바

네이버 검색API로 키워드 수집(with Python)

'Programming > Project' 카테고리의 다른 글

'Programming/Project' Related Articles

티스토리툴바