python :: 파이썬 웹페이지 url 에서 json 데이터 가져오기 (구글 애드센스 sellers.json 에서 자신의 사용자 정보 찾기)
http://{도메인 주소}/{파일명}.json
위와 같은 형태의 주소로 웹에 등록된 json 파일을 읽어오고자 할 때,
파이썬 스크립트를 작성하여 json data 를 가져올 수 있다.
1. requests 라이브러리로 웹페이지 json 데이터 불러오기
import requests
url = "{웹페이지 json url 전체 경로}"
data = requests.get(url).json()
requests 를 사용하여 이렇게 간단하게 불러올 수 있다.
2. Google Adsense 'sellers.json' 에서 자신의 사용자 정보 찾기
구글 애드센스 허가를 받은 후 광고를 게재하면
이렇게 Google sellers.json 파일에 판매자 정보를 게시하라는 안내 문구가 뜬다.
1) sellers.json 에 판매자 정보 게시하기
위 안내사항 우측의 '작업' 버튼을 누른 후
'판매자 정보 공개 상태' 를 위와 같이 '공개' 로 설정하면
sellers.json 에 자신의 정보가 등록된다고 한다.
(tistory 블로그의 경우 비즈니스 도메인: tistory.com 입력)
2) sellers.json 에 판매자 정보 등록 확인하기
이제 내 정보가 잘 등록되었는지 확인해보고 싶을 것이다.
이 때, 구글에서 제공하는 가이드는 다음과 같다.
그런데 아마 시도해본 사람은 알겠지만
sellers.json 파일의 사이즈가 너무 커서 웹페이지가 로딩조차 제대로 되지 않는다.
이와중에 나의 seller id 를 찾기란 쉽지 않다.
파이썬 스크립트 작성하여 sellers.json 파일 데이터 가져오기
위에 설명한 파이썬 requests 라이브러리를 이용한 스크립트를 작성하여 데이터를 가져올 수 있다.
import requests
url = "http://storage.googleapis.com/adx-rtb-dictionaries/sellers.json"
# url 에 https 가 아닌 http 사용할 것
data = requests.get(url).json()
for seller_info in data['sellers']:
if seller_info['seller_id'] == "{나의 seller id}":
print("==== SUCCESS ====")
print(seller_info)
1) url: 구글에서 제공하는 sellers.json 주소는 https 인데
이 경우 ssl verify 에러가 나기 쉬우니 http 를 사용하여 연결한다.
2) data: 받아온 json 데이터는 다음 key 값들을 가지고 있다.
'contact_email', 'contact_address', 'identifiers', 'version', 'ext', 'sellers'
이 중 우리가 확인할 사용자 정보는 'sellers' 에 담겨 있다.
3) 나의 seller id: 구글 애드센스 > 계정 > 설정 > 계정 정보 > 게시자 ID
'pub-' 으로 시작하는 id 를 입력하면 된다.
print 시킨 정보가 정상 출력되면 나의 판매자 정보가 정상 등록된 것이다.
* 참고
만약 다음과 같이 connection 에러가 발생한 경우,
TimeoutError: [WinError 10060] 연결된 구성원으로부터 응답이 없어 연결하지 못했거나, 호스트로부터 응답이 없어 연결이 끊어졌습니다
requests.exceptions.ConnectionError: HTTPConnectionPool(host='storage.googleapis.com', port=80): Max retries exceeded with url: /adx-rtb-dictionaries/seller.json ...
위 포스팅을 참고하여 코드에 프록시 설정을 세팅하면 된다.