본문 바로가기
반응형

개발/브라우저와 네트워크24

SEO) robots.txt와 sitemap.xml robots.txt와 sitemap.xml 크롤러가 웹페이지의 콘텐츠를 복사해서 검색엔진으로 이동시키고 이를 주제별로 색인한다. 색인된 정보만이 검색결과에 노출되기에 마케터 입장에서는 크롤러에 대한 대응방법이 중요하다고 함. 이때 robot.txt와 sitmemap.xml은 크롤러를 제어하기 위해 설정하는 파일이다. robots.txt 크롤러(로봇)이 지켜야하는 규칙과 사이트맵(sitemap.xml)파일의 위치를 알려주는 역할 robots.txt에서 크롤러가 크롤링 할 수 있는 디렉토리를 설정할 수 있다. 만약 robots.txt에 아무것도 저장하지 않으면 크롤러는 모든 컨텐츠(모든 디렉토리)를 색인하고 검색결과에 노출시킨다. robots.txt를 작성하는 규칙은 이 문서에 잘 나와 있다. robots... 2022. 9. 22.
TLS 프로토콜 작동방식 위 사진에서 보다시피, TLS 연결은 TCP 연결이 열린 후에 일어난다. (참고로 SSL과 TLS는 그냥 같은의미라고 봐도 무방함. TLS가 SSL을 계승한 것임) TLS프로토콜은 보안통신인데 HTTP 통신 프로토콜과 TLS 프로토콜이 합쳐져서 HTTPS프로토콜이 되는 것이다. HTTPS는 흔히 공개키 암호화방식, 인증으로 데이터를 안전하게 주고받는다고 알려져있다. 그 원리를 말하겠다. 1. 클라이언트가 서버에게 자신의 능력을 말해준다. 요청으로 자신이 사용가능한 암호화방식을 포함한 여러가지 스펙 전달 2. 서버는 클라이언트에게 암호화방식과 인증서를 전달. 인증서에는 서버의 공개키가 첨부된다. 공개키 암호화 방식이 뭔지는 여기서 설명하지 않겠음 3. 클라이언트는 브라우저에 내장된 CA리스트를 통해 CA공.. 2022. 1. 4.
HTTP와 HTTPS HTTP 서버/클라이언트 모델을 따라 데이터를 주고 받기 위한 프로토콜. 클라이언트와 서버가 80번포트를 통해 통신한다. HTTP는 애플리케이션 레벨의 프로토콜로 TCP/IP 위에서 작동한다. 상태를 갖고 있지 않은 Stateless 프로토콜이다. HTTP는 암호화되지 않은 텍스트를 전송하는 프로토콜이기에 보안이 취약하다. 이러한 문제를 해결하기 위해 HTTPS가 등장하였다. HTTPS 클라이언트와 서버가 443 포트를 통해 통신한다. 보안통신을 위한 프로토콜인 TLS에 HTTP의 통신방법이 합쳐진 프로토콜이다. (TLS와 SSL에 대한 설명은 흐름에 방해가 되어 후반부에 적었다.) HTTPS는 일반텍스트대신 TLS를 통해 암호화된 데이터를 전송한다. 때문에 데이터를 탈취해도 정확한 '키'가 없다면 해커.. 2021. 12. 22.
CORS 정리 CORS(Cross Origin Resource Sharing) CORS 정책은 우리가 가져오는 리소스들이 안전한지 검사하는 관문이다. 웹에는 SOP(Same Origin Policy)와 CORS(Cross Origin Resurce Sharing) 두가지 정책이 있다. SOP는 Same Origin에서만 리소스를 공유한다 라는 규칙을 가진 정책이다. 우리가 Cross Origin으로 리소스를 요청하면 SOP정책을 위반한것이 되고, CORS정책까지 지키지 않으면 아예 다른 Origin의 리소스를 사용할 수 없게 된다. 그럼 Cross Origin과 Same Origin은 무엇일까 Cross Origin과 Same Origin 요악하면 프로토콜, 포트, 호스트중 하나라도 일치하지 않으면 Cross Orig.. 2021. 11. 22.
반응형