Tratamiento de textos en SQL Server, un repaso a todo lo que se puede hacer con la plataforma de datos de MS con textos, y su aplicación a diferentes escenarios (y sus combinaciones)
– FullText
– FullText Semantics (a partir de 2012)
– DQS
– Fuzzy Lookup y Fuzzy Grouping en SSIS
– Funciones de búsqueda difusa en MDS
– Q&A en Power BI
– Otras opciones de tratamiento de textos (¿minería?, sistemas basados en metadatos, Big Data, …)



#SQSummit @pausempere SQL Server y Textos Del char(1) al análisis semántico DPS – Business Intelligence psempere@solidq.com MAP 2012 Pau Sempere Sánchez
Objetivos Repasar las opciones de tratamiento de textos que ofrece SQL Server Predicar con el ejemplo
Agenda Similitud de textos –Fonética –Sintáctica Análisis semántico
Agenda Similitud de textos –Fonética –Sintáctica Análisis semántico
Similitud de texto SOUNDEX Huella fonética Código de 4 caracteres DIFFERENCE Diferencias fonéticas Escala de 0 a 4
DEMO 6 SOUNDEX
Agenda Similitud de textos –Fonética –Sintáctica Análisis semántico
Similitud de texto HERRAMIENTAS • SSIS • Fuzzy Grouping • Fuzzy Lookup • DQS • Consultas personalizadas
Similitud de texto Levenshtein Jaro-Winkler Jaccard CommonSubstring Función en la BD de MDS  SUMMIT 2014SUMMIT 2013SUMMIT 2013
Similitud de texto ¡RUIDO! Artículos Preposiciones Palabras comunes dentro del dominio
¿Llamar a SSIS con una query? DATA SOURCE DATA STREAMING DESTINATION OLEDB PROVIDER FOR SSIS LINKED SERVER SQL QUERY SSIS PACKAGE
DEMO 12 Buscador Online
CONJUNTO DE REFERENCIA NUEVOS ELEMENTOS MDSDQS Buscador Fuzzy Lookup Similarity MDS
Agenda Similitud de textos –Fonética –Sintáctica Análisis semántico
Análisis Semántico FULL-TEXT Clausulas propias: –CONTAINS / CONTAINSTABLE • NEAR • ISABOUT (WEIGHT) • FORMSOF
Análisis Semántico FULL-TEXT Clausulas propias: –FREETEXT / FREETEXTABLE
Análisis Semántico • Wordbreakers • Stoplists (ruido) • Stemmers • Tesauros personalizados
Análisis Semántico FileTable • Carpeta/tabla • FileStream • Versionado de ficheros • Indexable FullText FILESTREAM FILETABLE ACCESO TRANSACCIONAL ACCESO WINDOWS BD Carpetas y ficheros Acceso FileStream BLOBS F U L L T E X T S E M A N T I C S
DEMO 19 Eligiendo lecturas con Full-Text
Análisis Semántico FULL-TEXT Semantics • Semántica y contexto • Instalación adicional • BD propia • Filter packs FILESTREAM FILETABLE ACCESO TRANSACCIONAL ACCESO WINDOWS BD Carpetas y ficheros Acceso FileStream BLOBS F U L L T E X T S E M A N T I C S
DEMO 23 Full-Text Semantics
Conclusiones • La fonética no es suficiente • Gestión avanzada de similitud • Fuzzy Lookup • Similarity MDS • Queries full-text para búsqueda avanzada • Gestión documental con FileTables y Semantics
2525 Power BI para usuarios de negocio 25 Curso online Clases virtuales presenciales 14, 15, 16, 21, 22 y 23 de Julio De 16 a 20 h Máster en BI 4ª Edición (Inicio Octubre 2014) – Clases presenciales virtuales – 450 horas (60 ECTS) – SolidQ – UPM – Clases + trabajo práctico + proyecto – Beca de hasta 1.300 € para los primeros inscritos. Máster en Big Data & Analytics 1ª Edición (Inicio Octubre 2014) – Clases presenciales virtuales – 1 año (60 ECTS) UMA – Clases + trabajo práctico + proyecto Información e inscripción: http://university.solidq.com / ibinfo@solidq.com
Si quieres disfrutar de las mejores sesiones de nuestros mentores de España y Latino América, ésta es tu oportunidad. http://summit.solidq.com Síguenos: 26 @pausempere DPS – Business Intelligence Pau Sempere Sánchez