domingo, 22 de noviembre de 2015

Curación de contenidos




Ejemplo de curación de contenidos mediante la herramienta Scoop.it, una vez seleccionado el ámbito de la actualidad tecnológica (noticias y actualidad, gadgets y dispositivos, robótica, etc.):


El arte de preguntar

Para conseguir éxito y rapidez en las búsquedas, contamos con tres tipos de palabras claves: 

  • de campo temático: nombres de las disciplinas y los términos imprescindibles que no pueden dejar de estar mencionadas en un documento que habla del tema de nuestra pregunta. 
  • de problema específico: frases breves que mencionan el asunto o su núcleo problemático más específico.  En realidad, no son palabras claves, sino frases específicas o expresiones claves, segmentos de texto insertos en un contexto que intentamos rescatar. Por eso es aconsejable incluir expresiones “en uso” que tengan que ver con el lenguaje que utilizamos habitualmente.
  • de referencias autorales: nombres de autores que se encuentran directamente relacionados con el problema, y que son considerados clásicos o referentes importantes en la materia. Sirven para identificar apellidos en listas bibliográficas que no siempre incluyen el nombre del autor, por lo tanto, es conveniente incluir sólo apellidos.

ejemplo práctico: ¿Cómo puedo acceder a formación gratuita en Internet?

- palabras clave de campo temático: formacion cursos gratis internet

- palabras clave de problema específico: plataforma, online, a distancia, MOOC

- palabras clave de referencias autorales: Universidad


Búsqueda inicial en Google Academics



Aparecen 3.800 resultados. Realizamos una búsqueda más refinada:




Aparecen 9 resultados, y la búsqueda nos permite llegar a Miríada X ;-) 





Web superficial y Web profunda



Los buscadores tradicionales sólo ofrecen acceso a una pequeña parte de la información que se encuentra en línea (web superficial).

El resto (web profunda) es un amplio banco de información ubicado en catálogos, revistas digitales, blogs, entradas a diccionarios y contenido de sitios que demanden autentificarse (gratuitamente o no) y otros tipos de contenido que no aparecen entre los resultados de búsqueda convencional.

La Web Superficial o visible comprende todos aquellos sitios cuya información puede ser indexada por los robots de los buscadores convencionales y recuperada casi en su totalidad mediante una consulta en sus formularios de búsqueda. Comprenden aproximadamente el 4% de Internet. Son sitios:
  • de libre acceso 
  • cuya información no está contenida en bases de datos 
  • que no requieren registro para acceder a la información. 
  • formados habitualmente por web estáticas (URL fija y accesibles desde otro enlace).


La Web Profunda o invisible contiene toda la información disponible en Internet que no se recupera interrogando a los buscadores convencionales (generalmente información almacenada y accesible mediante bases de datos). Comprende aproximadamente el 96% de Internet.

Parte de la información es "invisible" a los robots de los buscadores convencionales, ya que los resultados se generan en la contestación a una pregunta directa mediante páginas dinámicas (ASP, PHP, etc.) es decir páginas que no tienen una URL fija y que se construyen en el mismo instante (temporales) desapareciendo una vez cerrada la consulta. 




Sherman y Price identifican cuatro tipos de contenidos invisibles en la Web: 


  • Web opaca (compuesta por archivos que no encuentran los buscadores por economía y/o frecuencia de indización, número de resultados visibles, URL desconectadas,...) 
  • Web privada (por lo general, documentos excluidos deliberadamente por falta de utilidad, para lo que se protegen con contraseñas, o contienen robots.txt o noindex para evitar indización parcial o total,...)
  • Web propietaria (páginas en las que hay que registrarse para acceder a contenido).  
  • Web realmente invisible o no indizable (sitios que no pueden ser indizados por limitaciones técnicas de los buscadores, programas ejecutables y archivos comprimidos, páginas dinámicas,...).
Algunos recursos de la web profunda: 






miércoles, 11 de noviembre de 2015

Búsqueda avanzada en Internet



La búsqueda avanzada posee unas características adicionales a la búsqueda simple, soportadas por los motores de búsqueda, y para ello se cuenta con cuadros de texto, casillas de verificación y otros elementos que, en la práctica, son filtros que permiten refinar los resultados de la búsqueda en cuestión.

Para la búsqueda avanzada de sitios web, además de la mera introducción de términos, existen otras opciones para buscar páginas con determinados contenidos: 

Todas las palabras, una frase exacta, Cualquiera de una serie de palabras, Ninguna de las palabras, Valores entre un determinado intervalo, etc. 

También hay opciones con determinados filtros (Idioma, Región, Última actualización, sitio o dominio, tipo de archivo, etc.)



En cuanto a la búsqueda avanzada y específica de imágenes, se realiza utilizando palabras clave asociadas a la imagen que se pretende buscar, y ofrecen diferentes opciones: con todas las palabras, con exactamente una palabra o frase, con cualquiera con ninguna de las palabras, etc., así como también otro tipo de filtros:tamaño de imagen, proporción, colores, tipo, región, etc.)


Para mejorar resultados de búsquedas deben seleccionarse las palabras clave correctas. Las herramientas permiten relacionar dos o más palabras claves y frases mediante operadores para ampliar la búsqueda, reducirla o reorientarla según los resultados parciales obtenidos.

Las herramientas de búsqueda utilizan una sintaxis específica y su propio conjunto de operadores (algunos lógicos o booleanos) que indican qué relación debe existir entre los términos ingresados como los casos de: Y (AND, +), O (OR), NO (NOT, -)

  • <AND> (también <Y>, <+palabra>, <espacio en blanco>): búsqueda de todos los términos indicados, independientemente del orden. Ej: pintores AND asturianos (o también pintores Y asturianos, pintores +asturianos, pintores asturianos).
  • <OR>: busca alguno de los términos indicados excluyendo al resto. Ej: futbolistas OR atletas.
  • <NOT> (también <-palabra>): excluye los términos que lo acompañan. Ej: NOT cantantes (ó también -cantantes)

Algunos símbolos funcionan como operadores:
  • <*palabra> comodín que sustituye cadena de caracteres, ej: pint*
  • <?> sustituye en la búsqueda a ún sólo carácter, ej: niñ?
  • <”entrecomillado”> búsqueda de frase exacta, ej: “cerraduras de seguridad”
  • <@nombre> búsqueda de etiquetas sociales, ej: @luisjrf
  • <#palabra> búsqueda de tendencias, ej: #futbol
  • <..> búsqueda entre intervalos (fechas, medidas, precios), ej: PC $300..$500

Y también se dispone de otros operadores especiales que funcionan como filtros, y que son expresiones a añadir a las búsquedas para restringir resultados (para su correcta utilización no debe existir espacio entre el operador, los dos puntos y el término de búsqueda). Algunos de estos son:

  • define:palabra (facilita una definición, ej: define:triciclo).
  • site:dominio (facilita resultados dentro de sitios, ej: gasol site:www.marca.es).
  • link:sitio (facilita páginas que apuntan a algún sitio, ej: link:www.uniovi.es).
  • related:sitio (facilita sitios similares, ej: related:bombinesyseguridad.es).
  • allintitle:título (facilita búsquedas por título, ej: allintitle:”reposteria casera”).
  • info:sitio (facilita información sobre un sitio determinado, ej: info:www.as.com).


lunes, 9 de noviembre de 2015

Herramientas de búsqueda



De acuerdo a la planificación del MOOC "Encontrando tesoros en la Red", publico la tercera entrada, referida a las herramientas de búsqueda en Internet.  A este respecto, en el foro he realizado alguna actualización de información respecto a enlaces o determinadas herramientas que ya han dejado de existir como tales.

Por un lado contamos con los buscadores, las herramientas más utilizadas por el usuario medio, que se ocupan de indexar automáticamente sitios web, como los casos de Google, bing ó Yahoo

Por otra parte, se encuentran a disposición los metabuscadores, herramientas que ofrecen resultados desde puntos de vista diferentes, como los casos de Zoo, iBoogie, fazzle ó Ixquick.

Los directorios, por su parte, son útiles herramientas que organizan manualmente la información por categorías, como los casos de Portal-SEO ó excite

Las guías son recursos enormemente importantes, para cuestiones especializadas, pues suelen estar elaboradas por especialistas y entidades académicas. Finalmente, algunos software especializados complementan la labor de búsqueda de contenidos especificos por Internet, como el caso del tristemente ya sin soporte, Copernic Agent.  

El esquema de dichas herramientas, se puede visualizar en el correspondiente muro colaborativo realizado con padlet, herramienta que no parece ofrecer una usabilidad coherente y sobre la que he solicitado ayuda en el foro (aquí y aquí) y que como en varios días no ha llegado, lo incrusto tal cual.









viernes, 6 de noviembre de 2015

Infoxicacion


Infoxicación es un término que se refiere a la sobrecarga de información y la angustiosa sensación que produce la imposibilidad de abarcarla en su totalidad. Su introducción se atribuye a Alfons Cornellá en 1996 como fusión de las palabras información e intoxicación, y que tiene como antecedente la "sobrecarga informativa" acuñada anteriormente por Alvin Toffler  ("Future Shock", 1970).

La sobreinformación afecta al rendimiento de las personas en cuanto a que la cantidad de información, unido a las contradicciones contenidas en la misma, y a todo el "ruido" que producen datos incompletos, de dudosa calidad, etc., dificultan su procesamiento y elaboración en tiempo y forma adecuadas.

Para combatir este hecho y conseguir una mejora de la productividad existen numerosas técnicas y herramientas, como por ejemplo:
  • Filtros de correo electrónico, para depurar y aclarar las bandejas de entrada
  • Lectores de fuentes RSS para acudir directamente a los sitios de interés
  • Bloqueadores en navegadores para combatir el spam (barras emergentes, pop-ups, etc.)
  • Utilización de navegación anónima
  • "Datamining" o rastreadores de información, para encontrar y clasificar con mayor facilidad la información concreta que se busca.

Algunos enlaces de interés sobre la temática:






Interés y expectativas



Bienvenido a este blog abierto exclusivamente para su uso dentro de la actividad formativa correspondiente al MOOC "Encontrando tesoros en la Red" de Miríada X.

Mis intereses e inquietudes abarcan bastantes campos. Uno de ellos es la tecnología, y me parece interesante profundizar en el campo de la búsqueda de recursos en Internet.