:: python

python :: 파이썬 웹페이지 url 에서 json 데이터 가져오기 (구글 애드센스 sellers.json 에서 자신의 사용자 정보 찾기)

토람이 2022. 1. 2. 10:19
http://{도메인 주소}/{파일명}.json

 

위와 같은 형태의 주소로 웹에 등록된 json 파일을 읽어오고자 할 때,

파이썬 스크립트를 작성하여 json data 를 가져올 수 있다.

 

 

1. requests 라이브러리로 웹페이지 json 데이터 불러오기

import requests

url = "{웹페이지 json url 전체 경로}"

data = requests.get(url).json()

 

requests 를 사용하여 이렇게 간단하게 불러올 수 있다.

 

 

 

2. Google Adsense 'sellers.json' 에서 자신의 사용자 정보 찾기

구글 애드센스 허가를 받은 후 광고를 게재하면

 

 

이렇게 Google sellers.json 파일에 판매자 정보를 게시하라는 안내 문구가 뜬다.

 

 

1) sellers.json 에 판매자 정보 게시하기

위 안내사항 우측의 '작업' 버튼을 누른 후

 

'판매자 정보 공개 상태' 를 위와 같이 '공개' 로 설정하면

sellers.json 에 자신의 정보가 등록된다고 한다.

(tistory 블로그의 경우 비즈니스 도메인: tistory.com 입력)

 

 

2) sellers.json 에 판매자 정보 등록 확인하기

이제 내 정보가 잘 등록되었는지 확인해보고 싶을 것이다.

이 때, 구글에서 제공하는 가이드는 다음과 같다.

 

그런데 아마 시도해본 사람은 알겠지만

sellers.json 파일의 사이즈가 너무 커서 웹페이지가 로딩조차 제대로 되지 않는다.

이와중에 나의 seller id 를 찾기란 쉽지 않다.

 

 

 

파이썬 스크립트 작성하여 sellers.json 파일 데이터 가져오기

위에 설명한 파이썬 requests 라이브러리를 이용한 스크립트를 작성하여 데이터를 가져올 수 있다.

import requests

url = "http://storage.googleapis.com/adx-rtb-dictionaries/sellers.json"
# url 에 https 가 아닌 http 사용할 것

data = requests.get(url).json()

for seller_info in data['sellers']:
    if seller_info['seller_id'] == "{나의 seller id}":
        print("==== SUCCESS ====")
        print(seller_info)

 

1) url: 구글에서 제공하는 sellers.json 주소는 https 인데

  이 경우 ssl verify 에러가 나기 쉬우니 http 를 사용하여 연결한다.

2) data: 받아온 json 데이터는 다음 key 값들을 가지고 있다.

  'contact_email', 'contact_address', 'identifiers', 'version', 'ext', 'sellers'

  이 중 우리가 확인할 사용자 정보는 'sellers' 에 담겨 있다.

3) 나의 seller id: 구글 애드센스 > 계정 > 설정 > 계정 정보 > 게시자 ID

  'pub-' 으로 시작하는 id 를 입력하면 된다.

 

print 시킨 정보가 정상 출력되면 나의 판매자 정보가 정상 등록된 것이다.

 

 

 

 

* 참고

만약 다음과 같이 connection 에러가 발생한 경우,

TimeoutError: [WinError 10060] 연결된 구성원으로부터 응답이 없어 연결하지 못했거나, 호스트로부터 응답이 없어 연결이 끊어졌습니다

requests.exceptions.ConnectionError: HTTPConnectionPool(host='storage.googleapis.com', port=80): Max retries exceeded with url: /adx-rtb-dictionaries/seller.json ...

 

 

https://toramko.tistory.com/entry/python-%ED%9A%8C%EC%82%AC-%ED%94%84%EB%A1%9D%EC%8B%9Cproxy-%ED%99%98%EA%B2%BD%EC%97%90%EC%84%9C-%ED%8C%8C%EC%9D%B4%EC%8D%AC-%ED%8C%A8%ED%82%A4%EC%A7%80-%EB%8B%A4%EC%9A%B4%EB%A1%9C%EB%93%9C-api-%ED%98%B8%EC%B6%9C-%EC%84%B1%EA%B3%B5%ED%95%98%EA%B8%B0

 

위 포스팅을 참고하여 코드에 프록시 설정을 세팅하면 된다.

300x250