miércoles, 1 de febrero de 2017

PSPP definir editar variables

Definir variables o atributos, es un paso importante para el manejo de los datos, pero no es algo definitivo, porque podemos cambiar los atributos de las variables al momento que se requiera, sin perder o alterar los datos ya capturados.







Las variables se definen en la vista de variables, ya sea desde el menú Vista-Variables o directamente en la pestaña inferior Vista de Variables

Nombre: Acepta letras mayúsculas y minúsculas haciendo diferencia entre ambas, acepta números, no acepta espacios ni caracteres especiales, los espacios se pueden cambiar por guión bajo, no acepta el guión medio.

Tipo: Se pueden definir 8 tipos diferentes de variables, el ancho de las mismas y los decimales que se presentan, los cuales se pueden modificar, sin alterar los valores de datos ya capturados, es decir, si tengo un valor capturado con cinco decimales y la variable se define como cero decimales, al modificar este atributo, se mostrarán los decimales al nuevo número definido. El ancho y los decimales definidos en esta opción, se pueden modificar en las dos siguientes columnas.

 
Etiqueta: nos permite escribir una descripción mas amplia sobre el nombre y concepto de la variable que se está definiendo.

Etiqueta de valor: Nos permite relacionar un valor numérico con una característica o descripción, es decir, al capturar un dato correspondiente a la variable como un valor numérico, este se relaciona con una característica previamente definida en esta opción.
En el campo valor se escribe el número correspondiente a la etiqueta y en etiqueta de Valor escribimos la descripción que corresponde al valor anterior y se añade, repitiendo para cada valor que se tenga contemplado.


 
Valores perdidos: Son datos no disponibles al momento de la captura de información y si no se desean contemplar, se deja Sin valores perdidos. Si se desea considerarlos dentro de las estadísticas, se asigna un valor, por ejemplo 999, y ese valor entrará por defecto y no quedará el dato vacío, pudiéndose definir por un intervalo de valores.

 
 
Columna: Es el ancho de la columna que se presenta en la Vista de Datos
Alineación: Es el como se presenta el dato en la Vista de Datos.

Medida: Nominal u Ordinal si son variables cualitativas o factores. Escala si son valores numéricos, no importa continuos o discretos.

Rol: Entrada si es un dato que se debe escribir, objetivo si es el resultado de un cálculo, pudiendo ser ambas opciones a la vez. Por defecto y lo mas común es Entrada.



martes, 3 de enero de 2017

PSPP software para manejo de datos estadísticos

Todo el 2016 dejé muy abandonado mi blog y no escribí nada. Este inicio de año empiezo con un tema que espero, les sea útil e interesante: "PSPP software para manejo de datos estadísticos"
PSPP es la alternativa libre al costoso SPSS de IBM.

No espero generar un tutorial o manual  de uso, espero les sea útil como una referencia rápida y se den una idea básica de su uso; lo cual lo haré en varas entregas parciales. Para mayor y precisa información lea el manual de PSPP en inglés, aún no se ha traducido al español.

PSPP es un programa de análisis estadístico, multiplataforma, disponible tanto en 32 como en 64 bits; está escrito en el lenguaje de programación C. Usa la biblioteca científica GNU para sus rutinas matemáticas, y plotutils para la generación de gráficos. Las bibliotecas usadas por PSPP pueden ser accedidas vía programación.

A PSPP principalmente se ingresa desde consola, pero cuenta con una interfaz gráfica, PSPPIRE, que proporciona funcionalidades básicas cómo: análisis de frecuencias, elaboración de tablas cruzadas, pruebas de hipótesis mediante comparación de medias; regresión lineal y cálculo de los coeficientes de la recta, fiabilidad, reordenamiento de datos, pruebas no paramétricas, factor de análisis, elaboración de gráficos de barras, circulares e histogramas en la versión 0.8.4 y adicionalmente, diagrama de caja o de puntos de dispersión en la versión 0.10,  entre otras características

Los formatos o reportes de salida (reportes de resultado) pueden ser guardados: en formato ODT, ASCII, PDF, PostScript o HTML Los gráficos estadísticos: histogramas, Gráfico circulares y gráficos de Distribución Normal, entre otros, se conservan si se guarda el reporte en PDF

Una de la diferencias entre la versión 0.8.4 y la 0.10.2 es la posibilidad de que la última permite generar gráficos independientemente de realizar algún análisis estadístico.

Se puede aprovechar todo el potencial que ofrece PSPP desde consola y utilizando su sintaxis (también es posible utilizar la sintaxis desde la interfaz gráfica), pero esa funcionalidad no la abordaré, solo lo básico para utilizarlo en un curso de introducción a la estadística descriptiva e inferencial.


  
Instalación de PSPP:



Para cualquier sistema operativo, descargar el archivo adecuado de la última versión, del sitio oficial https://www.gnu.org/software/pspp/get.html



Para GNU/Linux lo recomendable es instalarlo desde los repositorios oficiales de la distribución, lo que nos garantiza estabilidad. En su defecto, o si desea la última versión, descargarlo del mismo sitio anterior.

Desde consola: sudo apt-get install pspp y damos clave de administrador o root.
Desde synaptic, dar clave de administrador o root,  buscar pspp, marcar para instalar y aplicar cambios para instalar.  


Abrir programa y moverse por las opciones del menú
Normalmente por defeto se instala y genera un acceso directo desde el menú de aplicaciones-> Educación -> GNU PSPP. Para abrir desde consola psppire


En el menú tenemos Archivo-Editar-Vista-Datos-etc



Archivo

La primera opción es Nuevo, significa que vamos a definir las variables y luego capturaremos los datos directamente en pantalla, como lo haríamos en un hoja de cálculo.

Abrir, nos permite visualizar los datos guardados con anterioridad en PSPP o bien de archivos generados en SPSS de IBM. En ambos programas se generan archivos.SAV. No hay problema alguno de compatibilidad si son generados en PSPP o en SPSS. 

Importar Datos. Esta opción del menú da Archivo, a mi parecer es muy importante, ya que es la que nos permite "traer" los datos generados en otras aplicaciones o guardados en otro formato que no sea de archivos.SAV

Guardar, Guardar Como y Renombrar  Archivo de Datos, son opciones para el guardado de la información.

Las siguientes tres opciones nos muestra información de los Datos y Archivos de Datos utilizados.


Editar.

Antes de ver las opciones de este menú, hay que aclarar que un variable es aquella característica o características que estamos estudiando, caso es el conjunto de variables estudiadas de un individuo en particular, por ejemplo variables: sexo, edad, peso y talla; casos, niño1 con todas sus variables, niño2 con todas sus variables , etc., Si lo comparamos con una hoja electrónica, las variables las encontramos en columnas y cada renglón es un caso (un niño en el ejemplo).

Insertar Variable. Nos permite incluir una variable nueva en el lugar indicado.

Insertar Caso. Nos permite agregar el el lugar deseado un nuevo caso para ingresar los datos o valores correspondientes a las variables del mismo.

Ir a la Variable. Nos despliega una ventana para seleccionar el nombre de la variables a la cual queremos visualizar o dirigirnos.

Ir al Caso. Abre una ventana para que se indique el número de caso al cual ir.

Copiar, cortar y pegar nos permite manipular los valores de los casos, permitiendo hacerlo por unidad o una serie de datos. 


Eliminar Variables. Borrar variables no deseadas y sus valores correspondientes en todos los casos.

Eliminar Casos. Borra información de uno o mas casos seleccionados NO la variable.

Buscar. Nos permite buscar por variable o valor dentro de las mismas.


Vista.


Barra de Estado. Muestra u oculta la barra de información que se ubica al pie de la ventana.


Fuentes. Nos permite cambiar la tipografía, estilo y tamaño de las letras utilizadas en variables y datos.

Líneas Divisorias. Oculta o muestra las líneas (cuadrícula) que separa las variables y los datos. 

Etiquetas de valor. Oculta o muestra el valor de la variable o la etiqueta definida para la misma. 


Vista de datos. Muestra el área de captura de los valores de los casos estudiados.


Vista de variables. Muestra el área donde se definen las variables y sus las características de cada variable. Aquí es donde se definen las variables, su tipo y demás características.

Otra manera de permutar entre la Vista de Datos y la Vista de Variables, es haciendo click en la pestaña correspondiente, localizadas al pie de la ventana del lado izquierdo.


Una vez definidas las variables, se procede a la captura de los valores obtenidos del instrumento de investigación o cuestionario.