참고: SEO를 잘하는 방법이 아니라, 작동 원리에 관한 글입니다. 수학에 자신이 좀 있으신 분들이 읽으시는 것을 권장하고 싶습니다.
이 콘텐츠는 SEO를 충족시키는 가이드에 관한 내용이 아닙니다. SEO PageRank의 작동 원리에 관한 탐구적인 글인 점을 유념하여 주세요. 왜 다들 콘텐츠 SEO만 이야기할까요? (제목에 핵심 키워드를 넣고, 마크업을 잘 지키고, 내부 링크와 외부 링크를 잘 활용하고, 결국은 사용자를 위한 콘텐츠를 만들어야 한다?)
테크니컬 SEO는 어렵고, 콘텐츠 SEO는 쉽기 때문입니다. 그러니 콘텐츠 SEO에 관해서는 그럴듯하게 주관적인 의견을 담을 수 있습니다. 때문에 사실과 관련이 없이 설득력 있는 이야기면 대단한 노하우 또는 카더라로 많이 퍼지는 경향이 있습니다. 이 글은 주관적일 수가 없는 이야기만을 다룹니다. 그리고 ‘결국 SEO에서 가장 중요한 것은 사용자를 위한 좋은 정보 제공이라는 본질이다’라는 결론을 내지 않습니다. SEO를 어떻게 하면 만족시킬 수 있을지 답만 얻고 싶은 분들께서는 이 글이 답답할 겁니다. 그것보단, SEO의 작동원리에 관한 궁금증에 다다르고 싶으신 분들께서 이 글을 보시기에 적합하다는 점을 참고 부탁드립니다.
SEO란?
SEO = Search Engine Optimization = 검색엔진 최적화 = 사이트와 글을 검색엔진에 상위 노출되게 최적화시키는 과정과 개념
[SEO의 중요성 (짧게)]
- 광고선전비의 매출 기여도가 높아질수록 재무적으로는 불안정
- 광고비에는 인플레이션이 있음. 광고선전비의 매출 기여도가 높을수록, 매출 대비 광고선진비 비율(%)이 가파르게 오름.
- 광고에 돈을 써야지만 매출이 나오는데, 광고로 매출을 만들수록 적자만 더 커지는 상황이 발생. (천만 원 매출을 만들기 위해 2천만 원 광고비를 써야 하는 상황)
그래서 떠오르고 있는 것이 인바운드 마케팅입니다. 한국에서는 B2C 마케팅은 상당히 발전했지만, B2B 마케팅은 불모지입니다. 글로벌에서 인바운드 마케팅은 이미 기본이지만, 한국에서만은 생소한 개념입니다. 불특정 다수의 집단에 광고를 노출시켜 그 대상 중 우리 제품/서비스를 구매할 대상이 있기를 기도하는 마케팅이 아니라, 우리의 제품/서비스가 정말로 필요한 사람들만 우리를 찾아오게끔 하는 것이 인바운드 마케팅입니다. 누군가 우리를 찾으려면 온라인에 콘텐츠가 있어야 합니다. 그러므로 콘텐츠 마케팅이 인바운드 마케팅과 밀접하게 관련이 있습니다. 콘텐츠가 검색엔진에서 상위 노출되면, 광고비 없이 무료로 문의를 확보할 수 있습니다.
[구글 SEO 작동 원리의 개요]
구글의 상위 노출은 어떤 방식으로 작용하나요?
구글은 과거 “The Anatomy of a Large-Scale Hypertextual Web Search Engine”를 통해 최초로 자체적인 검색 엔진에 대해 상세하게 설명하고 있습니다. 때는 1999년 구글의 공동 창립자인 로렌스 페이지가 스탠포드 대학에서 컴퓨터 공학으로 박사 학위를 취득하는 동안 세르게이 브린과 함께 작성한 페이퍼입니다. 이 문서는 구글의 페이지 노출 방식 원리를 아주 쉽게 이해할 수 있게 작성되어 있습니다.

문서에서 확인해 보면, 히트 리스트(특정 단어가 나타나는 위치/글꼴/대문자 사용 정보), 앵커 텍스트(링크가 걸린 텍스트), 페이지 랭크를 고려한다고 되어 있습니다. 그리고 특정 요소가 지나치게 큰 영향을 미치지 않도록 순위 함수를 설계했다고 합니다.
즉, 어느 하나의 특정 요소가 검색 순위에 지대한 영향을 끼친다기보단 다양한 요소를 골고루 만족하는 것이 중요하다는 것입니다.
링크 : http://infolab.stanford.edu/~backrub/google.html
[페이지 랭크와 백링크(backlink)]
“The Anatomy of a Large-Scale Hypertextual Web Search Engine”에 따르면, 구글에서 페이지 순위를 결정하는 3요소는
① 히트 리스트
② 앵커 텍스트
③ 페이지 랭크
입니다.
이 중 오늘 우리가 눈여겨봐야 할 것은 페이지 랭크입니다.
간단하게는, 어떤 페이지에 링크가 많으면, 중요한 페이지라고 판단하는 것입니다.
물론, 이후에 다루겠지만 페이지에 링크가 많은 것보다는, 우리의 콘텐츠를 다른 곳에서 얼마나 많이 링크하고 있는지가 더 중요합니다.
즉, 좋은 링크를 연결하고, 좋은 링크에 연결되는 것이 중요합니다.
우리나라에선 백링크 구매 업체가 몇 있습니다만, ‘백링크’는 구글이 페이지랭크를 판단하는 수많은 요소 중 단 하나일 뿐입니다.
그리고, 좋은 신뢰도의 백링크가 아니라면 페이지 순위가 오르기는커녕 영원히 구글에 노출되지 않게 될 수도 있습니다.
그러면, ‘좋은 링크’를 구글이 판단하는 기준이 있을까요?
우리는 알 수 없습니다.
오늘은 이 링크를 구글이 어떻게 계산하는지를 알아볼 건데요.
그 계산식을 우리가 그대로 적용해 볼 수는 없습니다.
그러니까 “이렇게 하면 구글에서 상위 노출이 됩니다”를 말하려는 포스팅이 아니란 점을 참고해 주세요.
앞서 언급한 “The Anatomy of a Large-Scale Hypertextual Web Search Engine”에서 등장한 공식이 있습니다.
구글의 페이지랭크 계산 공식인데요.
PR(A) = (1-d) + d (PR(T1)/C(T1) + … + PR(Tn)/C(Tn))
이게 뭘까요?
[마르코프 행렬]
우리가 어떤 내부 링크와 외부 링크를 써야하는지 제대로 그 본질을 이해하기 위해서는 이 ‘마르코프 행렬’을 이해해야만 합니다.
참고로, 마르코프는 러시아 수학자 이름입니다. (위키백과 링크)

[행렬]
먼저, “행렬”이 뭔지 알아야 합니다.
> 행렬은 ‘그냥 숫자들이 모여 있는 표’라고 생각하면 됩니다.
예를 들어

이건 2행(가로), 2열(세로) 짜리 행렬입니다.
그럼 마르코프 행렬은 어떤 숫자들이 모인 표일까요?
‘특별한 규칙’을 가진 숫자표입니다.
특별한 규칙이 뭐냐면, 이 행렬에는 ‘상태’라는 것이 있습니다.
마르코프 행렬은 한 상태에서 다른 상태로 이동할 확률을 나타내는 표입니다.
[마르코프 행렬 예시]
예시로 아주 간단한 마르코프 행렬을 하나 보면,

이 숫자들이 무엇을 의미하냐면…..
- 1행 : “상태 A”에 있을 때
70% 확률로 다시 상태 A로 가고 (원점으로 되돌아감) - 30% 확률로 상태 B로 간다는 뜻입니다. (다음 위치로 이동함)
2행 : “상태 B”에 있을 때
- 40% 확률로 상태 A로 가고 (다음 위치로 이동함)
- 60% 확률로 상태 B로 간다는 뜻입니다. (원점으로 되돌아감)
이게 바로 상태 간 이동할 확률을 보여주는 마르코프 행렬입니다.
[마르코프 행렬의 규칙]
이 마르코프 행렬은 확률을 나타내는 표이기 때문에, 아무 숫자나 막 넣을 수 있는 것이 아닙니다.
꼭 다음 두 가지를 만족해야 합니다.
- 모든 숫자는 0 이상 1 이하의 소수 (확률이니까!)
- 각 행(가로줄)의 숫자를 다 더하면 무조건 1 (확률은 모두 더하면 100!)
지금 이 상태에서 1️⃣ 가만히 있을지, 2️⃣ 다른 곳으로 갈지, 둘 중 하나를 결정합니다
[마르코프 행렬의 예시 상황 : 날씨]
내일 서울의 날씨가 아래와 같은 패턴으로 움직인다고 해봅시다.
- 오늘이 맑음이면, 내일도 맑을 확률은 80%, 흐릴 확률은 20%
- 오늘이 흐림이면, 내일은 맑을 확률이 30%, 흐릴 확률은 70%
이걸 행렬로 쓰면?

내일은 어떤 날씨가 될 확률이 높은지 이렇게 계산합니다.
오늘 습도가 ㅁ%, 온도가 ㅁ℃, 조도량이 ㅁ%, 풍속이 ㅁ/ms 라면, 내일은 어떤 날씨가 될지를 슈퍼 컴퓨터가 계산할 수 있겠죠.
대신 날씨를 계산하기 위해선 변수가 좀 더 많아지기 때문에 행과 열이 좀 더 많아지게 됩니다.
[마르코프 행렬의 페이지 랭크 적용]
- 페이지 랭크 : 어떤 페이지가 더 중요할까?
- 마르코프 행렬 : 이동 확률
이제 유추할 수 있는 시사점이 하나 생깁니다.
‘구글은, 페이지들 간에 이동할 확률에 따라 사용자가 이동할 확률이 높은 페이지를 상위에 띄운다’는 것을 알 수 있습니다.
마르코프 행렬은 특별한 규칙이 있는데, 바로 이 행렬에는 ‘상태’라는 것이 있다는 것입니다.
그러면 페이지 랭크는 ‘페이지’를 ‘상태’로 본다는 것을 알 수 있습니다.
[페이지 랭크는 사용자의 페이지 이동 확률]
각 페이지를 하나의 ‘상태’라고 보면,
누군가가 웹을 돌아다니며 다양한 페이지를 확인하는 것을 ‘상태 간 이동’이라고 이해할 수 있습니다.
예를 들어, 이 세상에 웹 페이지가 “단 3개” 있다고 가정해 봅시다.
그런데,’ 페이지 A’는 ‘페이지 B’와 ‘페이지 C’로 이동하는 2개의 링크를 가지고 있지만,
‘페이지 B’는 ‘페이지 C’로만 가는 1개의 링크를 가지고 있고,
‘페이지 C’는 ‘페이지 A’로만 가는 1개의 링크를 가지고 있습니다.

- 페이지 A > 페이지 B
- 페이지 A > 페이지 C
- 페이지 B > 페이지 C
- 페이지 C > 페이지 A
사용자가 A에 있다면:
👉 B로 갈 확률은 50%, C로 갈 확률도 50% (링크 2개 있으니까)
사용자가 B에 있다면:
👉 C로 갈 확률은 100% (링크 1개)
사용자가 C에 있다면:
👉 A로 갈 확률은 100% (링크 1개)
그러면, 행렬은 이렇게 되겠죠.

[ 0 0 1 ] <- A로 갈 확률
[ 0.5 0 0 ] <- B로 갈 확률
[ 0.5 1 0 ] <- C로 갈 확률
여기서 열은 ‘지금 있는 페이지’
행은 ‘어디로 이동하는지’를 의미합니다.
[페이지 랭크는 마르코프 행렬을 어떻게 활용할까?]
페이지 랭크는 이 마르코프 행렬에 수많은 행과 열을 두고 계속 계산하면서, 사용자가 어느 페이지에 가장 오래 머무를 가능성이 높은지를 확인합니다.
즉, 많은 링크를 받는 페이지는 사람들이 자주 도착하게 되니까, “중요한 페이지”라고 판단하는 거죠.
이걸 여러 번 반복해서 계산하다 보면, 각 페이지에 머무를 확률이 점점 고정된 숫자로 수렴합니다.
이 숫자가 바로 페이지랭크 점수입니다.
[하지만, 구글은 더 똑똑했다…]
하지만 그대로 적용하기에는 실제로는 이런 문제가 있습니다.
- 페이지에 링크가 하나도 없으면?
- 모든 링크들이 데 자꾸 한 페이지로만 이동이 쏠리면?
그래서 구글은 “가끔은 무작위로 다른 페이지로 이동”하는 기능도 넣었습니다.
예를 들어, 85%는 페이지에 존재하는 링크만으로 이동하고, 15%는 무작위로 아무 데나 간다고 가정하는 겁니다.
이 무작위 이동의 확률을 “damping factor (댐핑 팩터)” 라고 합니다.
‘댐핑 팩터’라는 어려운 개념이니까 들어가기 앞서 이제까지의 내용을 중간 요약!
[중간 요약]
- 마르코프 행렬은 “어느 한 페이지에서 다른 페이지로 이동할 확률”을 표현한 표
- 페이지랭크는 “사용자가 웹페이지를 마구 돌아다니는 과정”을 마르코프 행렬로 모델링한 단위
- 페이지랭크가 높으면, 검색 결과에서 상위에 노출될 ‘확률’이 증가
- 링크를 많이 받는 페이지는 사용자들이 더 자주 도착 > 구글이 점점 더 중요한 페이지로 인식
- 이 과정을 반복 계산해서 각 페이지의 중요도 점수를 구하는 게 바로 페이지랭크
- 페이지 랭크를 계산할 때는 백링크만 판단하지 않음 (수십~수백가지의 요소를 판단하므로 백링크 하나는 크게 대수롭지 않음)
[이제부턴 공식과 계산과 숫자가 많이 나옵니다.]
위 페이지 랭크 공식에서 PR(A)=(1−d)+d(⋯) 이런걸 봤는데요.
이것이 바로 댐핑 팩터가 적용된 마르코프 모델입니다.
수정 마르코프 행렬을 사용 중인 것이죠.
[원래 공식]
원래 공식은 이렇습니다.

- A: 점수를 계산하고 싶은 웹페이지
T1~Tn: A로 링크를 보내는 다른 페이지들 - PR(Ti): 각 링크 보내는 페이지 Ti의 페이지랭크
- PR(A) : A페이지의 페이지랭크 (중요도, 한 상태에 도착할 확률)
- PR(Ti)/C(Ti) : T1페이지에서 나의 페이지로 이어질 확률 (한 상태에서 다른 상태로 갈 확률)
- C(Ti): 그 페이지가지고 있는 링크의 개수 (즉, Ti라는 페이지에서 몇 개의 페이지로 나뉘어 가는지)
- d: damping factor (보통 0.85, 무작위 이동 고려, 페이지에 링크가 있다고 해서 반드시 이동하는 것은 아님)
[현실은 공식으로만 적용하기 어렵다…]
- 어떤 페이지는 링크를 많이 받고,
- 어떤 페이지는 링크를 거의 안 받습니다.
- 어떤 페이지는 링크가 100개고,
- 어떤 페이지는 링크가 1개입니다.
그래서 단순히 “누가 나를 링크했는가”만 보면 안 되고, 그 링크의 “퀄리티”도 고려해야 합니다.
링크를 많이 받지 않더라도 좋은 콘텐츠일 수 있고, 링크를 많이 받지만 좋지 않은 콘텐츠일 수 있죠.
그게 바로 이 공식이 말하는 핵심입니다.
“중요한 페이지가 나를 링크하고 있다면, 나도 중요해진다.”
즉, 아래의 이 부분이 뜻하는 바는

그 페이지가 가진 점수를, 나를 포함한 다른 곳들과 나눠서 받는 것인데요.
신뢰도가 높은 사이트를 백링크로 사용하면, 그 사이트와 우리 사이트는 함께 추가 점수를 부여받는다는 것입니다.
[수식의 d에 관하여]
이전에 댐핑 팩터(damping factor)를 이야기했습니다.
마르코프 모델의 핵심은 어떤 상태에서 다른 상태로 반드시 이동한다는 것인데요.
실제 웹에서는 꼭 그렇진 않습니다.
- 페이지에 외부로 가는 링크가 없는 경우
- 페이지에 외부로 가는 링크가 존재하지만, 사용자가 아무 링크도 클릭하지 않고 랜덤으로 다른 데로 이동한 경우
그래서 구글이 “마르코프 행렬에 추가적인 조정”을 한 것이 바로 Damping factor “d” 입니다.
이걸 수식으로 표현한 것이
PR(A)=(1−d)+d(⋯)
입니다.
여기서, (1 – d)는 “무작위로 이동해서 도착할 확률”이 되고,
d는 “실제로 링크를 타고 이동한 결과”를 의미합니다.
[행렬의 관점으로 돌아가보면?]
- 구글은 모든 웹페이지 사이 링크 구조를 정규화된 행렬로 만든다.
- 즉, 각 페이지에서 다른 페이지로 갈 확률이 적힌 표가 있다.
- damping factor를 여기에 적용하면, 수식은 아래와 같습니다.
- M′=dM+(1−d)E
- M은 원래의 마르코프 행렬
- E는 “모든 페이지로 균등하게 이동할 확률”을 담은 행렬
- M′은 damping이 적용된 새로운 마르코프 행렬
이제 이 수식의 의미를 이해하실 수 있으실까요?
M은 원래의 수식, M’는 수정된 수식입니다.
[고유벡터]
그 후에 이 행렬을 반복해서 곱하면 점점 안정된 페이지랭크 숫자가 찾아집니다.
이게 바로 “고유벡터(eigenvector)” 계산인데요. 어려운 말 같지만, 그냥 계속 계산하다 보면 점점 값이 고정됨을 의미합니다.
[실습 – 가상의 웹 구조 설정]
가상의 웹 구조 설정
- A페이지에는 B로가는 링크와 C로 가는 링크가 있습니다.
- B페이지에는 C로 가는 링크가 있습니다.
- C페이지에는 A로 가는 링크가 있습니다.
- A는 B, C로 각각 0.5 확률로 이동
- B는 C로만 가니까 C로 1
- C는 A로만 가니까 A로 1
A (출발) |
B (출발) |
C (출발) |
|
A (도착) |
0 |
0 |
1 |
B (도착) |
0.5 |
0 |
0 |
C (도착) |
0등 .5 |
1 |
0 |
링크 정보 기반의 마르코프 행렬입니다.
우리가 계산할 것은 누군가 이동할 확률(한 곳에서 다른 곳으로 ‘redirect’)입니다.
각 페이지에서 나가는 링크 수로 확률을 나눠서 표현하면 되겠죠.
[실습 – 초기 PageRank 벡터 설정]
페이지랭크는 일단 A, B, C 모든 페이지가 균등하게 1/3씩 시작한다고 가정해 보겠습니다.

[실습 – damping factor 적용]
damping factor d=0.85를 사용해 볼게요
계산 공식은:

여기서:
- N=3 (페이지 수)
- M은 행렬
[실습 – 1회 반복 계산(Iteration)]
댐핑 팩터에 0.85를 적용하면 식은 아래와 같이 됩니다.
(1−d)/N=(1−0.85)/3=0.05
그럼, PR과 이후 행렬을 반복으로 곱한 값은 이렇게 됩니다.
[실습 – Iteration 2 해석]
- PR 값이 Iteration 1 보다 조금씩 변화했습니다.
- 계속 반복하면 이 변화가 점점 줄어듭니다.
- 결국 거의 변화가 없어지는 상태에 도달하는데, 이것을 수렴이라고 합니다. (바로 고유벡터)
- 그런데, Iteration 1과 비교해보면 큰 차이가 하나 보입니다.
- Iteration 1에서는 페이지 C가 링크를 가장 많이 받았기 때문에 PageRank 점수가 가장 높았는데, Iteration 2에서는 C보다 A의 점수가 더 높아진건데요.
[실습 – Iteration 1과 Iteration 2 의 값이 다른 이유 1]
PageRank를 계산하는 공식이 ‘단순 링크 수’가 아니라, ‘링크의 질과 순환’까지 고려하도록 만들어져있기 때문입니다.
PageRank는 단순히 백링크가 몇 개 있느냐, 글에 태그가 잘 적용되어있냐 이런 계산으로 적용되지 않는다는 뜻입니다.
우선 이번 계산을 통해 확인 가능했던 핵심은 이겁니다. “중요한 페이지가 나를 링크하면 나도 중요해진다”
단순히 많은 링크를 받는 것보다, 누가 나를 링크했는지가 훨씬 더 중요합니다.
[실습 – Iteration 1과 Iteration 2 의 값이 다른 이유 2]
- Iteration 1에서 C는 A와 B 두 곳에서 링크를 받았으니 점수가 가장 높았습니다.
- Iteration 2에서는 C가 점수를 제일 많이 받았으니까, C가 A로 링크하는 게 중요해졌습니다.
- 그런데 C는 A로만 링크하고 있습니다.
- Iteration 1에서 C가 받은 중요한 점수를 A로 넘겨주니, Iteration 2에서는 C보다 A의 점수가 높아졌습니다.
[실습을 통한 결론 – 핵심 정리]
여기까지의 계산을 통해 확인 가능한 몇가지 사실이 있습니다.
페이지 랭크의 작동 방식에는 아래와 같은 것들이 영향을 줍니다.
- 링크 수 : 초기에는 중요하지만, 1회 반복까지만 영향이 큽니다.
- 링크의 질 : 중요한 페이지에서 링크를 받는 것이 많은 페이지의 링크를 받는 것보다 중요합니다.
- 순환적 구조 : 내가 점수를 올리면, 나를 링크한 다른 페이지도 영향을 받습니다.
- 반복 구조 : 페이지가 많은 네트워크일수록, 단순 ‘링크 수’보단 ‘전체 네트워크 속에서의 관계’가 더 중요해 집니다.
[구글이 페이지를 어떤 기준으로 상위노출시키는지 이해가 가셨나요?]
‘구글 SEO의 작동 원리가 어떻게 되나요?’라는 질문에는 사실 이정도의 설명이 필요합니다.
크롤링하고 인덱싱하고… 이런 내용은 개념적인 설명이고, 원리적으로는 마르코프 행렬을 고려해야하는 것이죠.
[그럼, 1998년에 적용한 마르코프 행렬을 기반으로 한 공식이 아직도 반영이 되고 있을까?]
구글의 페이지랭크를 만드는 데 마르코프 행렬이 쓰였다는 문서는 1998년 후반에 작성되었습니다.
20년이 지났는데, 구글의 페이지랭크 방식에 마르코프 행렬이 지금도 쓰이고 있을까요?
실제 웹 검색 알고리즘은 상당히 빠른 속도로 진화하고 있습니다.
결론부터 말하자면, 지금도 페이지랭크는 마르코프 행렬을 기반으로 하고 있습니다.
하지만 예전처럼 아주 핵심적인 위치는 아닙니다.
[과거와 현재 마르코프 쓰임의 차이]
1998년 구글 초기에는 PageRank가 거의 검색 결과의 핵심 기준이었습니다.
- 그 방식은 정확히 우리가 앞서 배운 마르코프 행렬 + damping factor에 기반한 수학적 계산이었고, “중요한 페이지에서 나를 링크했다면 나도 중요하다”는 논리로 작동했습니다.
- 이때 PageRank는 정적이고, 구조적인 중요도 계산 방식이었습니다.
그런데, 웹은 많은 변화를 거듭했습니다.
- 웹 페이지 수는 수십억 단위로 폭증했고,
- 링크 조작(link farming, SEO spam)이 너무 쉬워졌고, (지금은 유효하지 않게 되었지만, 예전엔 백링크를 판매하는 업체들이 많았습니다)
- 모바일, 소셜미디어, 사용자 반응 데이터 같은 새로운 요소들이 중요해졌습니다.
이제는 단순히 링크 구조만으로는 “좋은 페이지”를 정확히 판단하기 어려워지고 있습니다.
[현대 PageRank의 작동 방식]
여전히 현재까지도 링크가 많고, 신뢰받는 페이지는 중요한 요소입니다.
따라서, 마르코프 행렬 기반의 구조적 PageRank 계산 방법은 여전히 유효합니다.
하지만, 이제는 PageRank가 단독으로 결정하지 않을 뿐입니다.
수백 가지 신호가 함께 작용합니다.
위에서 본 행과 열이 수없이 많이 늘어나게 된 것이죠.
[수백 가지 신호란…?]
신호 종류 |
예시 |
콘텐츠 품질 |
페이지에 유용한 정보가 있는가? 키워드 밀도, 내용 길이 등 (EEAT: Experience, Expertise, Authoritativeness, Trustworthiness) |
사용자 행동 |
클릭률(CTR), 머문 시간(Dwell Time), 이탈률 |
링크 품질 |
얼마나 신뢰되는 곳에서 링크되었는가? |
모바일 최적화 |
모바일에서도 잘 보이는가? |
위치/언어/사용자 의도 |
사용자의 검색 의도에 맞는가? 지역과 언어는? |
최신성 |
얼마나 최근에 작성된 콘텐츠인가? |
PageRank 비공개 확장 모델 |
Topic-Sensitive PageRank, Personalized PageRank |
현대 알고리즘 |
RankBrain, BERT, Helpful Content Update |
[PageRank 비공개 확장 모델]
PageRank 자체도 잘 만들어진 공식이지만, 현실 세계의 다양한 문맥, 관심사, 사용자 차이를 반영하기에는 너무 일반화된 모델이었습니다.
그래서 구글은 이를 보완하기 위해 다양한 PageRank 확장 모델들을 계속해서 개발하고 있습니다.
공개되어 있는 다양한 요소들 뿐만이 아닌 훨씬 더 많은 요소들이 영향을 미치고 있으며, 페이지의 상위 노출에 영향을 주는 요소들은 계속해서 추가되고 있습니다.
우리가 PageRank에 대해 알아본 이유는 구글에 상위노출되는 콘텐츠를 만드는 방법을 알기 위해서라기 보단, 구글 상위노출이 어떤 방식으로 동작하는지에 관해 탐구하기 위해서였습니다.
구글 상위노출을 위해선 이제 다른 것을 알아보아야 한다는 말이겠죠.
현재까지도 구글은 1년에 1,000번 가까이 되는 크고 작은 검색 알고리즘 업데이트를 계속해오고 있습니다. 그럼에도 불구하고 마르코프 행렬을 기반으로 하는 그 원형은 유지하고 있는데요. 마르코프 행렬은 대부분의 검색 상위 노출 알고리즘에 적용이 되어 있습니다. 구글과 같은 검색 엔진뿐만 아니라, 지도 앱 등에도 동일한 원리가 적용되어 있습니다. 단지 어떤 요소를 어느 정도 중요도로 보고 있는지가 모두 다를 뿐이죠.
이번 포스팅에서는 상당히 원론적인 SEO의 작동 원리에 관해 다루어 보았는데, 내용이 어렵지만 그만큼 재밌지 않은가요? 많은 수요는 없을 것으로 예상되므로… 해당 포스팅의 성과가 눈에 띄지 않을 정도라면 관련한 이야기는 추후 SEO 세미나에서 또는 SEO에 관심이 많은 분들과의 사적인 만남에서 더 풀게 될 듯합니다.
또 재미있는 인사이트가 생기게 되면 그 때 다시 이런 콘텐츠로 찾아뵙겠습니다.