검색엔진과 시맨틱 웹(Semantic Web)

semantic = 의미론적인

사용자들은 원하는 정보를 찾기위해 google같은 검색엔진을 활용합니다. 이때 사용자의 검색에 노출되는 것은 웹사이트로서 매우 중요한 요소중 하나입니다

이런 검색에 노출되기위해 SEO(Search Engine Optimization)같은 도구를 사용해 웹 사이트를 개선하기도 합니다

검색 엔진은 Robot이라는 프로그램을 이요해 매인 전세계의 웹사이트를 크롤링합니다. 그리고 사용자가 검색할 키워드를 예상해서 인덱싱을 통해 미리 각 키워드에 대응하는 Index를 만들어 둡니다

Index를 만들때 사용하는 정보는 Robot이 수집한 정보이고, 이 정보는 결국 HTML코드를 말합니다. 검색 엔진은 이 코드만으로 그 문서의 의미를 이해해야 하는데 이를 위해 시맨틱 요소(Semantic element)를 해석하게됩니다

<font size="6"><b>Hello</b></font>
<h1>Hello</h1>

HTML의 코드는 컴퓨터가 해석하는 메타데이터와 사람이 사용하는 자연어가 섞여있습니다

위 코드는 브라우저에서 동일한 모습을 보여주지만, 가지는 의미는 다릅니다

font 요소는 단순히 폰트 크기와 볼드체를 지정한 메타데이터만을 가지지만, h1 요소는 그 자체로 제목(header)라는 뜻을 가지면서 개발자가 의도한 요소의 의미가 드러납니다

이러한 요소가 가지는 의미는 코드의 가독성을 높이고 유지보수를 도와줍니다

h1이 뜻하는 바가 제목이기 때문에 Index에 포함될 확률이 높고, 사람도 이 태그 내의 내용이 무엇인지 분명하게 알 수 있습니다

시맨틱 요소로 구성된 웹 페이지는 검색 엔진에 보다 의미론적으로 문서를 전달할 수 있고, 검색엔진도 이 시맨틱 요소를 활용해 효과적인 크롤링인덱싱이 가능함

시맨틱 태그브라우저, 검색엔진, 개발자 모두에게 컨텐츠의 의미를 명확히 알려준다

시맨틱 웹이란 결국 웹에 존재하는 기존의 웹페이지들에 메타데이터를 부여해 의미관련성을 가지는 일종의 데이터베이스로 만들고자하는 발상입니다

semantic 요소들

HTML의 요소들은 non-semanticsemantic으로 구분할 수 있습니다

HTML5로 넘어오면서 semantic요소들이 더 추가되었습니다

semantic 태그들


좋은 웹페이지 즐겨찾기