본문 바로가기
  • BLG-ZYNGIROK-모토-꿈꾸며-배우고-나누며-이루다
ICT

구글 서치 콘솔 | 티스토리 | robots.txt에 의해 차단됨 (feat. guestbook)

by dazwischen 2023. 1. 27. 20:30
반응형

티스토리로 운영하는 블로그가 구글 서치 콘솔 크롤링 과정중 robots.txt에 의해 차단됐을 경우 해결해 가는 과정을 기록한 글이다.

robots.txt에 의해 차단됨

구글 서치 콘솔을 이용하고 있다면 가끔 이런 메일이 오곤 한다.

 

구글서치콘솔에서-문제가있어서-보낸-메일이다.
구글 서치 콘솔 메일

색인 생성에 문제가 해결되지 않았다는 것이다. 메일을 확인해 보면 아래와 같이 세부 문제를 바로 볼 수 있도록 링크를 보내준다.

메일에-들어가보면-문제-세부정보-보기-버튼이-있다.
문제 세부정보 보기

링크를 타고 들어가면 robots.txt에 의해 차단됨이라는 메시지가 뜬다.

robots.txt에-의해-차단됨-메시지를-구글서치콘솔에서-볼-수-있다.
robots.txt에 의해 차단됨

보통 이 메시지는 구글봇이 사이트를 크롤링(페이지 하나하나를 긁어가기)이 성공적으로 완료 되지 않았을 때 나타난다. 자세히는 제출한 사이트맵에는 존재하는 페이지가 구글이 긁어 갈 수 없기 때문에 발생한다. 세부정보 보기를 눌러 정확히 어떤 페이지에서 문제가 발생했는지 확인해 보자.

세부정보를-들어가보면-정확히-어떤-URL에서-문제가-발생했는지-보여준다.-guestbook-에서-문제가-발생했다고-뜬-모습이다.
세부정보 guestbook

문제를 일으킨 페이지는 정확히 /guestbook 이라는 url을 갖는 페이지이다. 그럼 정확히 이 페이지가 구글봇이 읽지 못하게 되어 있는지 확인해 보도록 하자.

 

Google Search Console

로그인 Google 검색 콘솔로 이동

accounts.google.com

위 링크를 클릭하면 아래와 같은 페이지가 나타난다. 여기서 속성을 선택하세요를 눌러서 해당 도메인 주소를 선택한다.

구글서치콘솔에서-페이지별-어떤-속성을-갖고있는지-확인할-수있는-페이지-모습이다.
구글서치콘솔 속성

선택하고 조금 기다리면 해당 웹사이트가 어떤 URL들을 구글이 크롤링 못하게 막아놨는지 뜬다.

페이지의-속성모습이다.-guestbook이-Disallow-되어있는걸-확인할-수-있다.
속성

역시나 guestbook이 리스트에 있고 Disallow로 설정되어 있다.

해결방법

이제 해결 방법은 두가지이다.

Allow로 변경

Disallow를 Allow로 변경한 뒤 제출 버튼을 눌러주면된다. 그럼 guestbook이라는 페이지를 구글이 크롤링 할 수 있게 되고 문제는 해결된다. (수정 이유 : 티스토리의 robots.txt 파일은 수정할수 없다. Meta 데이터 등록을 통해 크롤링 허용 또는 비허용만 할 수 있다.)

1. guestbook 페이지 제거

또는 guestbook 페이지를 제거해주면 된다. guestbook은 티스토리에서 방명록을 말한다. 해당 웹사이트의 티스토리 관리자 페이지로 가서 왼쪽 메뉴의 "댓글 방명록"에서 설정을 눌러준다. 

티스토리-댓글-방명록-메뉴-모습이다.
티스토리 댓글 방명록

그럼 아래와 같은 페이지를 볼수 있는데 역시나 방명록 작성을 허용해 두었다. 이 것을 비허용으로 바꿔준다.

댓글-방명록-설정에서-방명록-작성이-허용되어-있다.댓글-방명록-설정에서-방명록-작성을-비허용으로-변경한-모습이다.
댓글 방명록 설정

이렇게 한 다음 다시 구글 서치 콘솔로 돌아가서 왼쪽 메뉴에서 Sitemaps를 찾는다. 여기서 sitemap.xml을 입력하여 사이트맵을 다시 한 번 제출해 준다.

구글서치콘솔-사이트맵-메뉴모습이다.사이트맵을-제출하기-위해-URL에-sitemap.xml을-작성했다.
사이트맵

직접 하지 않아도 구글이 주기적으로 사이트맵을 최신상태로 유지하지만 당장 변한걸 반영하기 위해 제출해주는 것이다. 이제 다시 페이지 유효성 페이지로 돌아가서 "새로운 유효성 검사 시작"을 눌러준 뒤 기다려주면 된다.

사이트맵을-제출한-뒤-다시-페이지의-유효성-검사를-하기위해-새로운-유효성-검사-시작-버튼을-눌러준다.
새로운 유효성 검사 시작

결과

  • 2023년 1월 24일 위 작업수행

결과가 나오는데 까지는 수시간에서 며칠이 걸릴 수 있다.

 

  • 2023년 1월 28일 결과 메일로 통보

최종적으로 문제가 해결됐다는 메일을 일수로는 4일, 실제 시간으로는 3일정도 뒤에 받을 수 있었다.

robots.txt에-의해-차단되었던-페이지의-유효성-상태가-통과로-되었다.
robots.txt 유효성 검사 상태 통과

반응형

댓글