PageRank alguna vez estuvo en el centro mismo de la búsqueda, y fue lo que convirtió a Google en el imperio que es hoy.
Incluso si cree que la búsqueda se ha alejado de PageRank, no se puede negar que ha sido durante mucho tiempo un concepto generalizado en la industria.
Cada profesional de SEO debe tener una buena comprensión de lo que era PageRank y lo que sigue siendo hoy.
En este artículo, cubriremos:
- ¿Qué es PageRank?
- La historia de cómo evolucionó PageRank.
- Cómo PageRank revolucionó la búsqueda.
- PageRank de la barra de herramientas frente a PageRank.
- Cómo funciona PageRank.
- Cómo fluye PageRank entre las páginas.
- ¿Se sigue utilizando PageRank?
Sumerjámonos.
¿Qué es PageRank?
Creado por los fundadores de Google, Larry Page y Sergey Brin, PageRank es un algoritmo basado en las fortalezas relativas combinadas de todos los hipervínculos en Internet.
La mayoría de la gente argumenta que el nombre se basó en el apellido de Larry Page, mientras que otros sugieren que “Page” se refiere a una página web. Es probable que ambas posiciones sean ciertas, y la superposición probablemente fue intencional.
Cuando Page y Brin estaban en la Universidad de Stanford, escribieron un artículo titulado: El ranking de citas de PageRank: poner orden en la Web.
Publicado en enero de 1999, el documento demuestra un algoritmo relativamente simple para evaluar la fuerza de las páginas web.
El documento se convirtió en una patente en los EE. UU. (pero no en Europa, donde las fórmulas matemáticas no son patentables).
La Universidad de Stanford posee la patente y se la ha cedido a Google. Actualmente, la patente expirará en 2027.
La historia de cómo evolucionó PageRank
Durante su tiempo en Stanford a fines de la década de 1990, tanto Brin como Page buscaban métodos de recuperación de información.
En ese momento, usar enlaces para determinar qué tan “importante” era cada página en relación con otra era una forma revolucionaria de ordenar las páginas. Fue computacionalmente difícil pero de ninguna manera imposible.
La idea rápidamente se convirtió en Google, que en ese momento era un pez pequeño en el mundo de las búsquedas.
Hubo tanta confianza institucional en el enfoque de Google por parte de algunas partes que la empresa lanzó inicialmente su motor de búsqueda sin la posibilidad de obtener ingresos.
Y mientras que Google (conocido en ese momento como “BackRub”) era el motor de búsqueda, PageRank era el algoritmo que usaba para clasificar las páginas en las páginas de resultados del motor de búsqueda (SERP).
El baile de Google
Uno de los desafíos de PageRank era que las matemáticas, aunque simples, debían procesarse iterativamente. El cálculo se ejecuta varias veces, en cada página y en cada enlace de Internet. En el cambio de milenio, estas matemáticas tardaron varios días en procesarse.
Los SERP de Google subieron y bajaron durante ese tiempo. Estos cambios a menudo eran erráticos, ya que se calculaban nuevos PageRanks para cada página.
Esto se conocía como el “Google Dance”, y notoriamente detenía a los profesionales de SEO del día cada vez que Google comenzaba su actualización mensual.
(Más tarde, Google Dance se convirtió en el nombre de una fiesta anual que Google organizaba para expertos en SEO en su sede en Mountain View).
Semillas de confianza
Una iteración posterior de PageRank introdujo la idea de un conjunto de “semillas confiables” para iniciar el algoritmo en lugar de dar a cada página en Internet el mismo valor inicial.
surfista razonable
Otra iteración del modelo introdujo la idea de un “navegador razonable”.
Este modelo sugiere que es posible que el PageRank de una página no se comparta de manera uniforme con las páginas a las que se vincula, pero podría ponderar el valor relativo de cada enlace en función de la probabilidad de que un usuario haga clic en él.
La retirada del PageRank
Inicialmente, se creía que el algoritmo de Google era “no compatible con el correo no deseado” internamente, ya que la importancia de una página estaba dictada no solo por su contenido, sino también por una especie de “sistema de votación” generado por los enlaces a la página.
Sin embargo, la confianza de Google no duró.
PageRank comenzó a volverse problemático a medida que crecía la industria de backlinks. Así que Google lo retiró de la vista del público, pero siguió confiando en él para sus algoritmos de clasificación.
La barra de herramientas de PageRank se retiró en 2016 y, finalmente, se restringió todo el acceso público a PageRank. Pero en ese momento, Majestic (una herramienta de SEO), en particular, había podido correlacionar sus propios cálculos bastante bien con PageRank.
Google pasó muchos años alentando a los profesionales de SEO a evitar la manipulación de enlaces a través de su documentación de “Directrices de Google” y mediante el asesoramiento de su equipo de spam, encabezado por Matt Cutts, hasta enero de 2017.
Los algoritmos de Google también cambiaron durante este tiempo.
La empresa dependía menos de PageRank y, luego de la compra de MetaWeb y su Knowledge Graph patentado (llamado “Freebase” en 2014), Google comenzó a indexar la información del mundo de diferentes maneras.
Barra de herramientas PageRank vs. Rango de página
Inicialmente, Google estaba tan orgulloso de su algoritmo que estaba feliz de compartir públicamente el resultado de su cálculo con cualquiera que quisiera verlo.
La representación más notable fue una extensión de barra de herramientas para navegadores como Firefox, que mostró una puntuación entre 0 y 10 para cada página en Internet.
En verdad, PageRank tiene una gama mucho más amplia de puntajes, pero 0-10 les dio a los profesionales y consumidores de SEO una forma instantánea de evaluar la importancia de cualquier página en Internet.
La barra de herramientas de PageRank hizo que el algoritmo fuera extremadamente visible, lo que también presentaba complicaciones. En particular, significó que estaba claro que los enlaces eran la forma más fácil de “jugar” con Google.
Cuantos más enlaces (o, más exactamente, cuanto mejor sea el enlace), mejor se clasificará una página en los SERP de Google para cualquier palabra clave específica.
Esto significó que se formó un mercado secundario, comprando y vendiendo enlaces valorados en el PageRank de la URL donde se vendió el enlace.
Este problema se agravó cuando Yahoo lanzó una herramienta gratuita llamada Yahoo Search Explorer, que permitió a cualquier persona comenzar a encontrar enlaces en cualquier página.
Más tarde, dos herramientas, Moz y Majestic, se basaron en la opción gratuita creando sus propios índices en Internet y evaluando los enlaces por separado.
Cómo PageRank revolucionó la búsqueda
Otros motores de búsqueda dependían en gran medida del análisis del contenido de cada página de forma individual. Estos métodos tenían poco para identificar la diferencia entre una página influyente y una simplemente escrita con texto aleatorio (o manipulador).
Esto significaba que los métodos de recuperación de otros motores de búsqueda eran extremadamente fáciles de manipular para los profesionales de SEO.
El algoritmo PageRank de Google, entonces, fue revolucionario.
Combinado con un concepto relativamente simple de “nGrams” para ayudar a establecer la relevancia, Google encontró una fórmula ganadora.
Pronto superó a los principales titulares del momento, como AltaVista e Inktomi (que impulsaron a MSN, entre otros).
Al operar a nivel de página, Google también encontró una solución mucho más escalable que el enfoque basado en “directorios” adoptado por Yahoo y más tarde DMOZ, aunque DMOZ (también llamado Open Directory Project) pudo proporcionar a Google inicialmente un código abierto. directorio propio.
Cómo funciona PageRank
La fórmula para PageRank viene en varias formas, pero se puede explicar en unas pocas oraciones.
Inicialmente, a cada página de Internet se le asigna una puntuación de PageRank estimada. Esto podría ser cualquier número. Históricamente, el PageRank se presentaba al público como una puntuación entre 0 y 10, pero en la práctica, las estimaciones no tienen por qué empezar en este rango.
El PageRank de esa página se divide luego por el número de enlaces fuera de la página, lo que da como resultado una fracción más pequeña.
Luego, el PageRank se distribuye a las páginas vinculadas, y lo mismo se hace con todas las demás páginas de Internet.
Luego, para la siguiente iteración del algoritmo, la nueva estimación de PageRank para cada página es la suma de todas las fracciones de páginas que enlazan con cada página determinada.
La fórmula también contiene un “factor de amortiguación”, que se describió como la posibilidad de que una persona que navega por la web deje de navegar por completo.
Antes de que comience cada iteración posterior del algoritmo, el nuevo PageRank propuesto se reduce por el factor de amortiguamiento.
Esta metodología se repite hasta que las puntuaciones de PageRank alcanzan un equilibrio establecido. Los números resultantes luego se transpusieron generalmente a un rango más reconocible de 0 a 10 por conveniencia.
Una forma de representar esto matemáticamente es:
Dónde:
- PR = PageRank en la siguiente iteración del algoritmo.
- d = factor de amortiguamiento.
- j = el número de página en Internet (si cada página tuviera un número único).
- n=número total de páginas en Internet.
- i = la iteración del algoritmo (inicialmente establecido como 0).
La fórmula también se puede expresar en forma de matriz.
Problemas e iteraciones a la fórmula
La fórmula tiene algunos desafíos.
Si una página no enlaza con ninguna otra página, la fórmula no alcanzará el equilibrio.
En este caso, por lo tanto, el PageRank se distribuiría entre todas las páginas de Internet. De esta manera, incluso una página sin enlaces entrantes podría obtener alguno PageRank, pero no se acumularía lo suficiente como para ser significativo.
Otro desafío menos documentado es que las páginas más nuevas, aunque potencialmente más importante que las páginas más antiguas, tendrán un PageRank más bajo. Esto significa que, con el tiempo, el contenido antiguo puede tener un PageRank desproporcionadamente alto.
El tiempo que una página ha estado activa no se tiene en cuenta en el algoritmo.
Cómo fluye PageRank entre páginas
Si una página comienza con un valor de 5 y tiene 10 enlaces, entonces cada página a la que enlaza recibe 0,5 PageRank (menos el factor de amortiguamiento).
De esta forma, el PageRank fluye por Internet entre iteraciones.
A medida que aparecen nuevas páginas en Internet, comienzan con solo una pequeña cantidad de PageRank. Pero a medida que otras páginas comienzan a vincularse a estas páginas, su PageRank aumenta con el tiempo.
¿Se sigue utilizando PageRank?
Aunque el acceso público a PageRank se eliminó en 2016, se cree que el puntaje aún está disponible para los ingenieros de búsqueda dentro de Google.
Una filtración de los factores usados por Yandex mostró que PageRank se mantuvo como un factor que podría usar.
Los ingenieros de Google han sugerido que la forma original de PageRank se reemplazó con una nueva aproximación que requiere menos potencia de procesamiento para calcular. Si bien la fórmula es menos importante en la forma en que Google clasifica las páginas, sigue siendo una constante para cada página web.
E independientemente de los otros algoritmos que Google podría elegir utilizar, es probable que PageRank permanezca integrado en muchos de los sistemas del gigante de las búsquedas hasta el día de hoy.
Dixon explica cómo funciona PageRank con más detalle en este video:
Patentes y documentos originales para una lectura más detallada:
Más recursos:
Imagen destacada: VectorMine/Shutterstock
Con información de Search Engine Journal.
Leer la nota Completa > Google PageRank explicado para principiantes de SEO