Search Analytics Unirioja 2008 Jorge Serrano-Cobos [email_address]
Indice Unirioja 2008 El problema: conocer al usuario ¿Qué es “Information Seeking Behaviour”? Modelos  Estudios Cuantitativos: Search Analytics  Herramientas Aplicaciones y ejemplos reales Conclusiones y futuro
EL PROBLEMA CONOCER AL USUARIO Unirioja 2008
Conocer al usuario Unirioja 2008 Cómo usan Cómo encuentran Cómo buscan Information Seeking  Search Analytics  Findability Arquitectura información Usabilidad
Information Seeking Behaviour Unirioja 2008 Conducta que se produce cuando un usuario interactúa con un sistema de recuperación de información específico para buscar información relevante  (Wilson, 2000)
MODELOS Unirioja 2008
Clásico Unirioja 2008 Documento Representación del Documento Query Necesidad de Información Matching Modelo de RI clásico: Marcia Bates
Modelos Information Seeking Unirioja 2008 Behavioral model (Ellis, 1987)  Berrypicking model (Bates, 1989) Information Search Process (Kulthau, 1991) Marchionini (1995) Information Foraging Theory (Pirolly, 2000)
Pirolli, 2000 Unirioja 2008 Information Foraging Theory : Los usuarios prefieren una  organización  del contenido que  minimice  la cantidad de  tiempo  y de  esfuerzo  de atención  invertidas  en obtener información. Information Scent: La  percepción  del usuario al  juzgar enlaces  u otros elementos de navegación debe ser  óptima  para que el  tiempo  de decisión y esfuerzo de elección sean  mínimos .
Information scent Unirioja 2008
Conocer al usuario Encuestas Card sorting Thinking aloud Observación etnográfica Cognitive Walkthrough Personas … Unirioja 2008
Estudios cualitativos Usabilidad: Método de evaluación que tiene como objetivo general la identificación y resolución de deficiencias de uso existentes en un sistema interactivo.  (Jesse James Garrett) Unirioja 2008
Usabilidad Conceptos relacionados: Diseño centrado en el usuario Diseño de interacción (HCI) Diseño iterativo Prototipado, diseño de interacción, wireframes, tests de usuarios Unirioja 2008
Usabilidad Unirioja 2008 Wireframe
Tests de usuarios Unirioja 2008 Conocemos los pasos que los usuarios dan para encontrar información Centrado en la navegación Se usan pocos usuarios Sirve para pre y rediseñar navegación  Cubre buscador + “browsing” (information seeking) Aplicable a la arquitectura de información macro y micro.
Tests de usuarios Al usuario se le propone preguntas / tareas Se monitorizan las tareas Se observan coincidencias Task # 4 Can you find a journal article on diabetes? Unirioja 2008
Eyetracking Unirioja 2008
Estudios cuantitativos del usuario Search Analytics Unirioja 2008
Search Analytics Unirioja 2008 Las búsquedas (queries) son oro: son datos reales que nos muestran exactamente qué están buscando los usuarios en sus propias palabras. (Rosenfeld & Wiggins 2006)
Search Analytics Unirioja 2008 Se centra en el archivo log del buscador + log navegación Informa: del lenguaje usado (“labelling” o etiquetado)  de quién y cuándo lo ha buscado (bajo registro) del contenido encontrado, y del no encontrado. Conceptos relacionados Categorías (+ buscado) > Subcategorías (- buscado) Categorías (- palabras) > Subcategorías (+ palabras)
Ventajas Unirioja 2008 Sistema no intrusivo para el usuario Sistema a priori barato Aporta datos reales Datos exhaustivos (de todos los usuarios del sitio que usan el buscador) Los datos son del propio contexto del sitio
Key Performance Indicators (KPI´s) Unirioja 2008 resolvo.com Establecer objetivos Recolección de datos Predicción Análisis Acciones como respuesta
Algunos indicadores Unirioja 2008 Nº de búsquedas por período en el año Top  de búsquedas Top temáticas (clusters del Top búsquedas) Top de 0 respuestas Top de pocas respuestas Patrones de movimiento: expresiones o búsquedas más o menos frecuentes (seasonality, trends) Top de páginas más visitadas tras consultas y a través de qué búsquedas Correlación de datos con cambios en diseño A/B, etc.
Estudios posibles Unirioja 2008 Sinónimos y conceptos relacionados Variantes idiomáticas, jergas y equivalentes multilingües Determinación de “best bets” Falta de contenido (“Nº de respuestas: 0”) Relevancia por retroalimentación Análisis sincrónicos y diacrónicos (evolución temporal)
¿Cuándo y cómo se estudia? Prediseño   Post diseño Externo Interno Unirioja 2008 ADWORDS TRENDS SEARCH LOG GOOGLE  ANALYTICS BUSINESS INTELLIGENCE ESTUDIOS  CUALITATIVOS
Search log Unirioja 2008
Punto de partida Unirioja 2008 Las búsquedas siguen una distribución según Zipf, con búsquedas más comunes lourosenfeld.com
Estacionalidad Unirioja 2008
Google Analytics Unirioja 2008 Rebekah Kilzer - Ohio State University Libraries
Ejemplo en la Ohio University Unirioja 2008 Poner el código en todas las plantillas <body> <script type=&quot;text/javascript&quot;> var gaJsHost = ((&quot;https:&quot; == document.location.protocol) ? &quot; https://ssl .&quot; : &quot; http://www. &quot;); document.write(unescape(&quot;%3Cscript src='&quot; + gaJsHost + &quot; google-analytics.com/ga.js ' type='text/javascript'%3E%3C/script%3E&quot;)); </script> <script type=&quot;text/javascript&quot;> var pageTracker = _gat._getTracker(&quot;UA-xxxxxx-x&quot;); pageTracker._initData(); pageTracker._trackPageview(); </script>  </body>
Para comenzar Unirioja 2008 Rebekah Kilzer - Ohio State University Libraries
Evolución temporal Unirioja 2008 Rebekah Kilzer - Ohio State University Libraries
Comparativas Unirioja 2008
Site Search Unirioja 2008 ¿Cuánto usan mi buscador interno los usuarios?  ¿Qué palabras clave buscan?  ¿Dónde se comienza a buscar?  ¿Cómo buscan los diferentes grupos de usuarios dentro de mi sitio web?  ¿Qué beneficios se obtienen de los usuarios que buscan en mi sitio web?  ¿Están los usuarios satisfechos con lo que encuentran?
Site Search Unirioja 2008 ¿Cómo se configura? “ Introduzca el &quot;Parámetro de consulta&quot; en el campo que se proporciona. “ Por ejemplo, en Milennium, sería “search”.  http://bibliotecas.obrasocialcajamadrid.es/search*spi/Y?SEARCH=tolkien&SORT=D&submit=buscar
Site Search Unirioja 2008
Clicktracking Unirioja 2008 Site Overlay
Cuellos de botella Unirioja 2008
Google Adwords Unirioja 2008 Dendogramas  Escalamiento multidimensional Concepto buscado Resultados naturales (sin publicidad) Google AdWords (CPC)
Google Adwords Unirioja 2008
Google Adwords Unirioja 2008
Google Adwords Unirioja 2008
Business Intelligence Cubo de datos con log de visitas Coordenadas XYZ: páginas, usuarios, tiempo Permite segmentar por X, por Y, o por Z Permite realizar estimaciones y simulaciones a futuro Mezclado con search log: Unirioja 2008 X  Usuario > Z Tiempo > Y  Páginas > “ ¿Cuántos usuarios mayores de 30 años varones de Madrid buscaron “pañales” a las 12 de la noche de ayer y no encontraron contenido satisfactorio?”
Grafos co-ocurrencias Unirioja 2008 Webcam Altea Calpe spain Beach
LO QUE YA SABEMOS Unirioja 2008
Sabemos que… El operador booleano más aceptado es AND Los usuarios raramente cambian opciones marcadas por defecto (búsqueda avanzada) La mitad de consultas reformuladas se construyen a partir del texto anterior El interfaz puede modificar la conducta de búsqueda  (Nielsen, Jones, Cunningham y McNab) Unirioja 2008
Sabemos que… A mayor conocimiento de una materia, más palabras en una query (Allen) Los expertos en una temática se fijan más en el contenido de las respuestas (Marchionini) A mayor nivel cultural, mayor tendencia a utilizar los enlaces, organizados jerárquica o alfabéticamente.  A menor capacidad de absorción informativa, mayor uso del buscador. (Kralisch, Berendt, Rice, Mc Creadie y Chang) Unirioja 2008
Internacionalización Los usuarios nativos utilizan en mayor medida los contenidos organizados jerárquicamente.  Los no nativos usan en general más el buscador y los enlaces organizados alfabéticamente. (Kralisch y Berendt)  Unirioja 2008
Search log externo vs. interno Unirioja 2008 Search log externo Search log interno analog.cx = /
Número de palabras ¿Mi buscador interno está preparado para gestionar búsquedas de 1 sola palabra (conceptos) o de varias palabras (más específicas)? Unirioja 2008 bbc.co.uk
En qué respuesta se clica más CTR (Clickthrough Rate) en resultados de búsqueda (sobre 9.038.794 queries): 42,1%  11,9%   8,5%  6,1%  4,9%  4,1%  3,4%  3,0%  2,8%  3,0%  Resto de la Larga Cola (ranking 11-1000) = 11.3 % de CTR. Fuga de datos AOL - SEO Black Hat  Unirioja 2008
CASOS PRACTICOS Unirioja 2008
Browsing vs. searching Verizon.com Un millón de personas lo visitan por semana 30.000-40.000 búsquedas internas al día Los usuarios intentan encontrar links (browsing) antes de usar en el buscador interno. Cuanto menor es la prominencia del link (más abajo en web), más va al buscador (Angiolillo) Unirioja 2008
Browsing vs. searching Renardus.com Un 80% de la actividad del portal se ejerce sobre diversas formas de browsing de (Koch)  Unirioja 2008
Browsing Unirioja 2008
Browsing Unirioja 2008
Best Bets Aplicación práctica de la Ley de Zipf Verizon.com: dos conjuntos de respuestas, las del algoritmo del buscador interno (Verity) y las que usaban best bets.  El subconjunto mejor aceptado por los usuarios fue el hecho a mano, los Best Bets.  Útil para SEO interno, y búsquedas muy comunes (BBC.co.uk, Martin Belam, currybetdotnet)  Unirioja 2008
Best bets Unirioja 2008
Best Bets Unirioja 2008
Colombia vs. Columbia en BBCi 16 enero 2003: el desastre del Space Shuttle “Columbia” Aumento significativo de búsquedas por “Colombia”.  Problema de deletreo. Mismo best bet momentáneo para “Columbia” y “Colombia”  Unirioja 2008
Search Analytics y AI Unirioja 2008 ¿Qué términos o palabras clave son aquellas por las que queremos ser encontrados en internet? ( Posicionamiento en buscadores ) ¿Qué términos queremos que sean encontrados dentro de nuestro sitio web? ( Findability / Arquitectura de Información )
Construcción de categorías – Top Down Unirioja 2008 Dendogramas  Escalamiento Card Sorting multidimensional Yussef Hassan
Bottom-up con Google Adwords Unirioja 2008
Const. de categorías bottom-up Unirioja 2008 Agrupar las palabras clave según afinidad temática
Seasonality / Estacionalidad Fallas (búsqueda mundial 2004 – 2006) Unirioja 2008
Seasonality / Estacionalidad Fallas (búsqueda mundial 2005) Unirioja 2008
AI Dinámica Unirioja 2008 Fallas 2006
Internacionalización Unirioja 2008
Internacionalización Unirioja 2008
Conclusiones y futuro Unirioja 2008 La RI es más que un algoritmo La interfaz lo cambia todo Diversas metodologías, conclusiones similares Existen modelos comunes de conducta  A usuarios distintos, AI distintas Cuantas más posibilidades de RI (jerárquica, facetada, alfabética, cronológica, buscador), mejor Futuro: mezclar search log + log navegación + segmentación
Unirioja 2008 ¡GRACIAS!   Jorge Serrano Cobos [email_address]

Más contenido relacionado

PPTX
Busquedasefectivasredinternet
PPT
Busquedasefectivas R E D I N T E R N E T
PDF
Buscadores semanticos Parte 1
PDF
Taller II Congreso Nacional de Enfermeria en Cirugia
PDF
Cómo mejorar la visibilidad en Google gracias a una Estrategia Social Media
PPT
La Busqueda en Portales e Intranets
PDF
Analítica web: Métricas clave para entender a nuestros usuarios
PDF
Reputación on line en buscadores. Propuesta metodológica para empresas
Busquedasefectivasredinternet
Busquedasefectivas R E D I N T E R N E T
Buscadores semanticos Parte 1
Taller II Congreso Nacional de Enfermeria en Cirugia
Cómo mejorar la visibilidad en Google gracias a una Estrategia Social Media
La Busqueda en Portales e Intranets
Analítica web: Métricas clave para entender a nuestros usuarios
Reputación on line en buscadores. Propuesta metodológica para empresas

Similar a Search Analytics (20)

PDF
Reputación online en buscadores: Propuesta metodológica para empresas. Madrid...
PPTX
Taller 2 estrategias de búsqueda
PPTX
Presentacion del blog Victor
PPTX
Herramientas de busqueda Victor
PPTX
Herramientas de busqueda
PPTX
Analitica web
PDF
Comportamiento de exploradores
PDF
1. introducción posicionamiento y términos web
PPT
Búsquedas efectivas en internet
PPTX
Estrategias de búsqueda
PPTX
Estrategias de búsqueda
PPTX
Presentacion pp terminada
PPT
La estrategia de busqueda
PDF
Mapas de navegación y benchmark Diplomado Arquitectura de Información y UX
ODP
Turismo en chile
PPT
Presentación del libro de Avinash Kaushik, en MRC de Alicante
PPTX
SharePoint 2012_Caso de éxito Telefónica
PPTX
PPTX
Metodos de búsqueda en internet kellyshito
PPT
Sigue la ruta búsquedabasesdedatos
Reputación online en buscadores: Propuesta metodológica para empresas. Madrid...
Taller 2 estrategias de búsqueda
Presentacion del blog Victor
Herramientas de busqueda Victor
Herramientas de busqueda
Analitica web
Comportamiento de exploradores
1. introducción posicionamiento y términos web
Búsquedas efectivas en internet
Estrategias de búsqueda
Estrategias de búsqueda
Presentacion pp terminada
La estrategia de busqueda
Mapas de navegación y benchmark Diplomado Arquitectura de Información y UX
Turismo en chile
Presentación del libro de Avinash Kaushik, en MRC de Alicante
SharePoint 2012_Caso de éxito Telefónica
Metodos de búsqueda en internet kellyshito
Sigue la ruta búsquedabasesdedatos
Publicidad

Más de Jorge Serrano-Cobos (19)

PPTX
Tendencias SEO 2016 Master MUGI UPV
PPTX
Salidas profesionales en Internet para alumnos de secundaria
PPTX
Big data versus better queries: Analitica web para servicios de informacion 2...
PPTX
Big data para la segmentacion de usuarios en el sector de la lectura. Jornada...
PPTX
Big Data para Bibliotecas de Salud 2015
PPTX
Online Demand Analysis through User Queries & Keywords Research
PPT
Higher Education University Websites: Improving Information Architecture & Sc...
PPTX
Cómo vivir de la Gestión de Contenidos
PPTX
University rankings strategies versus tactics
PPTX
Contenidos y redes sociales 2012
PPTX
Licenciado documentacion arquitecto de informacion 2011
PPT
Evolucion SEO Conferencia upv 2010
PPT
Opacs Biblioteca 20
PPT
Introduccion A Los Blogs Para Servicios De Informacion 2008
PPT
Introduccion Posicionamiento Buscadores Modulo 6
PPT
Introduccion Posicionamiento Buscadores Modulo 4 Y 5
PPT
Introduccion Posicionamiento Buscadores Modulo 3
PPT
Introduccion Posicionamiento Buscadores Modulo 2
PPT
Introduccion Posicionamiento Buscadores Modulo 1
Tendencias SEO 2016 Master MUGI UPV
Salidas profesionales en Internet para alumnos de secundaria
Big data versus better queries: Analitica web para servicios de informacion 2...
Big data para la segmentacion de usuarios en el sector de la lectura. Jornada...
Big Data para Bibliotecas de Salud 2015
Online Demand Analysis through User Queries & Keywords Research
Higher Education University Websites: Improving Information Architecture & Sc...
Cómo vivir de la Gestión de Contenidos
University rankings strategies versus tactics
Contenidos y redes sociales 2012
Licenciado documentacion arquitecto de informacion 2011
Evolucion SEO Conferencia upv 2010
Opacs Biblioteca 20
Introduccion A Los Blogs Para Servicios De Informacion 2008
Introduccion Posicionamiento Buscadores Modulo 6
Introduccion Posicionamiento Buscadores Modulo 4 Y 5
Introduccion Posicionamiento Buscadores Modulo 3
Introduccion Posicionamiento Buscadores Modulo 2
Introduccion Posicionamiento Buscadores Modulo 1
Publicidad

Último (20)

PDF
Guía_de_implementación_Marco_de_gobierno_y_gestión_de_TI_Universidades.pdf
PDF
MANUAL de recursos humanos para ODOO.pdf
PPTX
Tema 1 Taller de tecnologia y proceso tecnologico.pptx
PPTX
Historia Inteligencia Artificial Ana Romero.pptx
PDF
ADMINISTRACIÓN DE ARCHIVOS - TICS (SENA).pdf
DOCX
Guía 5. Test de orientación Vocacional 2.docx
PDF
Estrategia de Apoyo de Daylin Castaño (5).pdf
PDF
Final Tecno .pdfjdhdjsjdhsjshshhshshshhshhhhhhh
PDF
Teoría de estadística descriptiva y aplicaciones .pdf
PPTX
Curso de generación de energía mediante sistemas solares
PPTX
la-historia-de-la-medicina Edna Silva.pptx
PPT
Protocolos de seguridad y mecanismos encriptación
PPTX
Presentacion de Alba Curso Auditores Internos ISO 19011
PDF
0007_PPT_DefinicionesDeDataMining_201_v1-0.pdf
PDF
TRABAJO DE TECNOLOGIA.pdf...........................
PDF
informe_fichas1y2_corregido.docx (2) (1).pdf
PDF
Distribucion de frecuencia exel (1).pdf
PDF
capacitación de aire acondicionado Bgh r 410
PPTX
Reconocimiento-Automatico-de-Placas-Vehiculares-con-IA.pptx
PPTX
ccna: redes de nat ipv4 stharlling cande
Guía_de_implementación_Marco_de_gobierno_y_gestión_de_TI_Universidades.pdf
MANUAL de recursos humanos para ODOO.pdf
Tema 1 Taller de tecnologia y proceso tecnologico.pptx
Historia Inteligencia Artificial Ana Romero.pptx
ADMINISTRACIÓN DE ARCHIVOS - TICS (SENA).pdf
Guía 5. Test de orientación Vocacional 2.docx
Estrategia de Apoyo de Daylin Castaño (5).pdf
Final Tecno .pdfjdhdjsjdhsjshshhshshshhshhhhhhh
Teoría de estadística descriptiva y aplicaciones .pdf
Curso de generación de energía mediante sistemas solares
la-historia-de-la-medicina Edna Silva.pptx
Protocolos de seguridad y mecanismos encriptación
Presentacion de Alba Curso Auditores Internos ISO 19011
0007_PPT_DefinicionesDeDataMining_201_v1-0.pdf
TRABAJO DE TECNOLOGIA.pdf...........................
informe_fichas1y2_corregido.docx (2) (1).pdf
Distribucion de frecuencia exel (1).pdf
capacitación de aire acondicionado Bgh r 410
Reconocimiento-Automatico-de-Placas-Vehiculares-con-IA.pptx
ccna: redes de nat ipv4 stharlling cande

Search Analytics

  • 1. Search Analytics Unirioja 2008 Jorge Serrano-Cobos [email_address]
  • 2. Indice Unirioja 2008 El problema: conocer al usuario ¿Qué es “Information Seeking Behaviour”? Modelos Estudios Cuantitativos: Search Analytics Herramientas Aplicaciones y ejemplos reales Conclusiones y futuro
  • 3. EL PROBLEMA CONOCER AL USUARIO Unirioja 2008
  • 4. Conocer al usuario Unirioja 2008 Cómo usan Cómo encuentran Cómo buscan Information Seeking Search Analytics Findability Arquitectura información Usabilidad
  • 5. Information Seeking Behaviour Unirioja 2008 Conducta que se produce cuando un usuario interactúa con un sistema de recuperación de información específico para buscar información relevante (Wilson, 2000)
  • 7. Clásico Unirioja 2008 Documento Representación del Documento Query Necesidad de Información Matching Modelo de RI clásico: Marcia Bates
  • 8. Modelos Information Seeking Unirioja 2008 Behavioral model (Ellis, 1987) Berrypicking model (Bates, 1989) Information Search Process (Kulthau, 1991) Marchionini (1995) Information Foraging Theory (Pirolly, 2000)
  • 9. Pirolli, 2000 Unirioja 2008 Information Foraging Theory : Los usuarios prefieren una organización del contenido que minimice la cantidad de tiempo y de esfuerzo de atención invertidas en obtener información. Information Scent: La percepción del usuario al juzgar enlaces u otros elementos de navegación debe ser óptima para que el tiempo de decisión y esfuerzo de elección sean mínimos .
  • 11. Conocer al usuario Encuestas Card sorting Thinking aloud Observación etnográfica Cognitive Walkthrough Personas … Unirioja 2008
  • 12. Estudios cualitativos Usabilidad: Método de evaluación que tiene como objetivo general la identificación y resolución de deficiencias de uso existentes en un sistema interactivo. (Jesse James Garrett) Unirioja 2008
  • 13. Usabilidad Conceptos relacionados: Diseño centrado en el usuario Diseño de interacción (HCI) Diseño iterativo Prototipado, diseño de interacción, wireframes, tests de usuarios Unirioja 2008
  • 15. Tests de usuarios Unirioja 2008 Conocemos los pasos que los usuarios dan para encontrar información Centrado en la navegación Se usan pocos usuarios Sirve para pre y rediseñar navegación Cubre buscador + “browsing” (information seeking) Aplicable a la arquitectura de información macro y micro.
  • 16. Tests de usuarios Al usuario se le propone preguntas / tareas Se monitorizan las tareas Se observan coincidencias Task # 4 Can you find a journal article on diabetes? Unirioja 2008
  • 18. Estudios cuantitativos del usuario Search Analytics Unirioja 2008
  • 19. Search Analytics Unirioja 2008 Las búsquedas (queries) son oro: son datos reales que nos muestran exactamente qué están buscando los usuarios en sus propias palabras. (Rosenfeld & Wiggins 2006)
  • 20. Search Analytics Unirioja 2008 Se centra en el archivo log del buscador + log navegación Informa: del lenguaje usado (“labelling” o etiquetado) de quién y cuándo lo ha buscado (bajo registro) del contenido encontrado, y del no encontrado. Conceptos relacionados Categorías (+ buscado) > Subcategorías (- buscado) Categorías (- palabras) > Subcategorías (+ palabras)
  • 21. Ventajas Unirioja 2008 Sistema no intrusivo para el usuario Sistema a priori barato Aporta datos reales Datos exhaustivos (de todos los usuarios del sitio que usan el buscador) Los datos son del propio contexto del sitio
  • 22. Key Performance Indicators (KPI´s) Unirioja 2008 resolvo.com Establecer objetivos Recolección de datos Predicción Análisis Acciones como respuesta
  • 23. Algunos indicadores Unirioja 2008 Nº de búsquedas por período en el año Top de búsquedas Top temáticas (clusters del Top búsquedas) Top de 0 respuestas Top de pocas respuestas Patrones de movimiento: expresiones o búsquedas más o menos frecuentes (seasonality, trends) Top de páginas más visitadas tras consultas y a través de qué búsquedas Correlación de datos con cambios en diseño A/B, etc.
  • 24. Estudios posibles Unirioja 2008 Sinónimos y conceptos relacionados Variantes idiomáticas, jergas y equivalentes multilingües Determinación de “best bets” Falta de contenido (“Nº de respuestas: 0”) Relevancia por retroalimentación Análisis sincrónicos y diacrónicos (evolución temporal)
  • 25. ¿Cuándo y cómo se estudia? Prediseño Post diseño Externo Interno Unirioja 2008 ADWORDS TRENDS SEARCH LOG GOOGLE ANALYTICS BUSINESS INTELLIGENCE ESTUDIOS CUALITATIVOS
  • 27. Punto de partida Unirioja 2008 Las búsquedas siguen una distribución según Zipf, con búsquedas más comunes lourosenfeld.com
  • 29. Google Analytics Unirioja 2008 Rebekah Kilzer - Ohio State University Libraries
  • 30. Ejemplo en la Ohio University Unirioja 2008 Poner el código en todas las plantillas <body> <script type=&quot;text/javascript&quot;> var gaJsHost = ((&quot;https:&quot; == document.location.protocol) ? &quot; https://ssl .&quot; : &quot; http://www. &quot;); document.write(unescape(&quot;%3Cscript src='&quot; + gaJsHost + &quot; google-analytics.com/ga.js ' type='text/javascript'%3E%3C/script%3E&quot;)); </script> <script type=&quot;text/javascript&quot;> var pageTracker = _gat._getTracker(&quot;UA-xxxxxx-x&quot;); pageTracker._initData(); pageTracker._trackPageview(); </script> </body>
  • 31. Para comenzar Unirioja 2008 Rebekah Kilzer - Ohio State University Libraries
  • 32. Evolución temporal Unirioja 2008 Rebekah Kilzer - Ohio State University Libraries
  • 34. Site Search Unirioja 2008 ¿Cuánto usan mi buscador interno los usuarios? ¿Qué palabras clave buscan? ¿Dónde se comienza a buscar? ¿Cómo buscan los diferentes grupos de usuarios dentro de mi sitio web? ¿Qué beneficios se obtienen de los usuarios que buscan en mi sitio web? ¿Están los usuarios satisfechos con lo que encuentran?
  • 35. Site Search Unirioja 2008 ¿Cómo se configura? “ Introduzca el &quot;Parámetro de consulta&quot; en el campo que se proporciona. “ Por ejemplo, en Milennium, sería “search”. http://bibliotecas.obrasocialcajamadrid.es/search*spi/Y?SEARCH=tolkien&SORT=D&submit=buscar
  • 38. Cuellos de botella Unirioja 2008
  • 39. Google Adwords Unirioja 2008 Dendogramas Escalamiento multidimensional Concepto buscado Resultados naturales (sin publicidad) Google AdWords (CPC)
  • 43. Business Intelligence Cubo de datos con log de visitas Coordenadas XYZ: páginas, usuarios, tiempo Permite segmentar por X, por Y, o por Z Permite realizar estimaciones y simulaciones a futuro Mezclado con search log: Unirioja 2008 X Usuario > Z Tiempo > Y Páginas > “ ¿Cuántos usuarios mayores de 30 años varones de Madrid buscaron “pañales” a las 12 de la noche de ayer y no encontraron contenido satisfactorio?”
  • 44. Grafos co-ocurrencias Unirioja 2008 Webcam Altea Calpe spain Beach
  • 45. LO QUE YA SABEMOS Unirioja 2008
  • 46. Sabemos que… El operador booleano más aceptado es AND Los usuarios raramente cambian opciones marcadas por defecto (búsqueda avanzada) La mitad de consultas reformuladas se construyen a partir del texto anterior El interfaz puede modificar la conducta de búsqueda (Nielsen, Jones, Cunningham y McNab) Unirioja 2008
  • 47. Sabemos que… A mayor conocimiento de una materia, más palabras en una query (Allen) Los expertos en una temática se fijan más en el contenido de las respuestas (Marchionini) A mayor nivel cultural, mayor tendencia a utilizar los enlaces, organizados jerárquica o alfabéticamente. A menor capacidad de absorción informativa, mayor uso del buscador. (Kralisch, Berendt, Rice, Mc Creadie y Chang) Unirioja 2008
  • 48. Internacionalización Los usuarios nativos utilizan en mayor medida los contenidos organizados jerárquicamente. Los no nativos usan en general más el buscador y los enlaces organizados alfabéticamente. (Kralisch y Berendt) Unirioja 2008
  • 49. Search log externo vs. interno Unirioja 2008 Search log externo Search log interno analog.cx = /
  • 50. Número de palabras ¿Mi buscador interno está preparado para gestionar búsquedas de 1 sola palabra (conceptos) o de varias palabras (más específicas)? Unirioja 2008 bbc.co.uk
  • 51. En qué respuesta se clica más CTR (Clickthrough Rate) en resultados de búsqueda (sobre 9.038.794 queries): 42,1% 11,9% 8,5% 6,1% 4,9% 4,1% 3,4% 3,0% 2,8% 3,0% Resto de la Larga Cola (ranking 11-1000) = 11.3 % de CTR. Fuga de datos AOL - SEO Black Hat Unirioja 2008
  • 53. Browsing vs. searching Verizon.com Un millón de personas lo visitan por semana 30.000-40.000 búsquedas internas al día Los usuarios intentan encontrar links (browsing) antes de usar en el buscador interno. Cuanto menor es la prominencia del link (más abajo en web), más va al buscador (Angiolillo) Unirioja 2008
  • 54. Browsing vs. searching Renardus.com Un 80% de la actividad del portal se ejerce sobre diversas formas de browsing de (Koch) Unirioja 2008
  • 57. Best Bets Aplicación práctica de la Ley de Zipf Verizon.com: dos conjuntos de respuestas, las del algoritmo del buscador interno (Verity) y las que usaban best bets. El subconjunto mejor aceptado por los usuarios fue el hecho a mano, los Best Bets. Útil para SEO interno, y búsquedas muy comunes (BBC.co.uk, Martin Belam, currybetdotnet) Unirioja 2008
  • 60. Colombia vs. Columbia en BBCi 16 enero 2003: el desastre del Space Shuttle “Columbia” Aumento significativo de búsquedas por “Colombia”. Problema de deletreo. Mismo best bet momentáneo para “Columbia” y “Colombia” Unirioja 2008
  • 61. Search Analytics y AI Unirioja 2008 ¿Qué términos o palabras clave son aquellas por las que queremos ser encontrados en internet? ( Posicionamiento en buscadores ) ¿Qué términos queremos que sean encontrados dentro de nuestro sitio web? ( Findability / Arquitectura de Información )
  • 62. Construcción de categorías – Top Down Unirioja 2008 Dendogramas Escalamiento Card Sorting multidimensional Yussef Hassan
  • 63. Bottom-up con Google Adwords Unirioja 2008
  • 64. Const. de categorías bottom-up Unirioja 2008 Agrupar las palabras clave según afinidad temática
  • 65. Seasonality / Estacionalidad Fallas (búsqueda mundial 2004 – 2006) Unirioja 2008
  • 66. Seasonality / Estacionalidad Fallas (búsqueda mundial 2005) Unirioja 2008
  • 67. AI Dinámica Unirioja 2008 Fallas 2006
  • 70. Conclusiones y futuro Unirioja 2008 La RI es más que un algoritmo La interfaz lo cambia todo Diversas metodologías, conclusiones similares Existen modelos comunes de conducta A usuarios distintos, AI distintas Cuantas más posibilidades de RI (jerárquica, facetada, alfabética, cronológica, buscador), mejor Futuro: mezclar search log + log navegación + segmentación
  • 71. Unirioja 2008 ¡GRACIAS! Jorge Serrano Cobos [email_address]