Miguel Monreal Ordiñana

Archive for junio 2008

Mi idea era limpiar HTML mal formado y pasarlo a XHTML, eso lo he conseguido con JTidy (aún con la poca documentación existente ;( ).

Una vez conseguido y pasar de un codigo HTML horrible tal que así:

<P ALIGN="LEFT">
<FONT FACE="Verdana" SIZE="10" COLOR="#0B333C" LETTERSPACING="0" KERNING="0">
Lorem ipsum dolor
</FONT>
</P>

A XHTML (mucho mejor):

<p style="text-align:left;font-size:10px;font-family:Verdana;color:#0B333C">
Lorem ipsum dolor
</p>

Quería hacer desaparecer el atributo style (y demás posibles atributos) por completo y dejar los <p> limpios. Quizá haya otras maneras, pero se me ocurrió hacerlo con expresiones regulares. Estuve echando un ojo a este tutorial (y al JavaDoc) y este es el código Java necesario:

// Cadena original
String              s = "Lorem ipsum dolor";
// Patron
String        pattern = "<p.*?>";
// Cadena por la que sustituir el patron
String       replace  = "<p>";

// Compilar el patron ignorando si esta en mayusculas o minusculas
Pattern p = Pattern.compile(pattern, Pattern.CASE_INSENSITIVE);
Matcher matcher = p.matcher(s);
System.out.println("Antes:" + s);

// Sustituimos todas las ocurrencias
s = matcher.replaceAll(replace);
System.out.println("Despues:" + s);

Antes:

<p style="text-align:left;font-size:10px;font-family:Verdana;color:#0B333C">
Lorem ipsum dolor
</p>

Despues:

<p>
Lorem ipsum dolor
</p>
Anuncios

Durante los días 20 y 21 de Mayo se celebró en Madrid el primer SMX (Search Marketing Expo) en Madrid. Mi compañero Ricardo desglosa muy bien el primer y segundo día de SMX Madrid 08

La experiencia en global fue buena, pero en un evento etiquetado como avanzado te dejan un poco chafado fallos ya ocurridos en otros congresos SEO:

  • Empezar como si estuvieras en primero: Es posible que te estés haciendo mal algo fundamental, pero no es lo común en una feria avanzada a la que acude gente que ya empieza a llevar tiempo en esto del SEO y que están al cargo de webs potentes. No me parece mal dar un repaso, pero insisto, rápido.
  • Charlas de autobombo/publicitarias: No me sirve que traigas a una empresa para que explique como ha resuelto un “problema concreto” si no me dice con qué herramientas, con que mediciones y de qué manera (con pelos y señales). Tampoco me vale una resolver algo que salta a los ojos que este mal (web entera en flash, con menús en javascript, etc), al menos no en la parte de pago de una feria como el SMX.
  • “No voy a contestar porque tengo un contrato de privacidad”, esta es para nota. Viene en relación con lo anterior. Normalmente no te van a decir nunca como se resolvió realmente un problema porque hay mucha competencia, sobretodo en sectores como viajes. No interesa, es mi tesooooro. Es inadminisible que un panelista diga eso en su ponencia.
  • Ya no vale solamente con traer a alguien de Google o Yahoo. La mayoria ya hemos visto/tocado/hablado con gente de Google/Yahoo. Si no viene a contar algo que no haya o pueda leer en el blog oficial respectivo, no me vale.
  • Talleres prácticos “interruptus”. Siempre pasa igual, se organiza un taller práctico y nunca se termina ni se sacan conclusiones.
  • Charlas de relleno. Por muy interesante que sea la historia de Google o la manera de trabajar no quiero oirla en un congreso. Lo del 20% del tiempo está muy bien pero ya se dijo en 2006.
  • Falta de recursos aportados, herramientas, links, blogs, datos justificados y contrastados, estadísticas, experiencias y “trucos” concretos, métodos de trabajo, equipos ideales de SEO, perfiles interesantes… En fin todo aquello que investigarlo y averiguarlo por tu parte te quitaría un tiempo precioso, realmente es eso lo que espero y deseo de un congreso

Por terminar también destacar las cosas buenas, que las hubo. Siempre aprendes algo nuevo (quizá no todo lo que esperabas), juzgas más desde fuera tu trabajo y sobretodo conoces en persona y hablas con gente muy interesante.

Por lo tanto espero acudir al próximo SMX España