Colabore con el blog Estadistica

martes, 2 de junio de 2009

Funciones Sas para variables de Texto

Sas es un potentísimo software de análisis estadístico pero además de sus virtudes analíticas presenta una serie de funciones orientadas a la manipulación y depuración o limpieza de variables.

En esta ocasión vamos a nombrar sólo unas pocas, las que personalmente más utilizo cuando me encuentro en las bases de datos teléfonos mal grabados, direcciones de emails, nombres de personas en mayúsculas y minúsculas, etc, y tenemos que hacer una labor de limpieza para homogeneizar todo lo posible estos datos.

Compbl (cadena): Elimina blancos de la cadena.
Compress (cadena, ‘car’): elimina de la cadena los caracteres específicados en car.
Upcase (cadena): convierte en mayúsculas la cadena.
Lowcase (cadena): convierte en minúsculas la cadena.
Tranwrd (cadena, ‘lo que quiero substituir’, ‘por lo que quiero substituir’): sustituye en la cadena todas las ocurrencias de origen por el destino.
Substr (cadena, a1, a2): devuelve una extracción de la variable de texto cadena que comienza en la posición a1 y tiene una longitud de a2.
Ejemplo: tenemos un campo denominado TELEFONO donde observamos datos de esta manera: 91-77*777 77-7
data BBDD; set BBDD;
TELEFONO =Compbl (TELEFONO) /*--> 91-77*77777-7*/
TELEFONO =Compress (TELEFONO,'-','*') /*--> 9177777777 */
run;

¿Quieres ayudarnos a mantener vivo el blog?