Cómo Interpret Summary Statistics In Stata Forex

Bienvenido al Instituto de Investigación y Educación Digital Stata FAQ ¿Cómo puedo obtener estadísticas descriptivas y el resumen de cinco números en una línea Stata proporciona el comando de resumen que le permite ver la media y la desviación estándar, pero no proporciona el número cinco Resumen (min, q25, mediana, q75, máximo). Puede utilizar la opción detail, pero luego obtendrá una página de salida para cada variable. Si desea obtener la media, la desviación estándar y el resumen de cinco números en una línea, entonces desea obtener el comando univar. El comando univar fue escrito por John R. Gleason y aparece en el Stata Technical Bulletin 51. Puede descargar univar desde Stata escribiendo findit univar (consulte Cómo puedo utilizar el comando findit para buscar programas y obtener ayuda adicional para obtener más información Sobre el uso de findit). Vamos a ilustrar el uso del comando univar usando la escuela secundaria y más allá del archivo de datos que usamos en nuestras clases de Stata. Aquí ves la salida que obtienes de resumir. Aquí está la salida que puede obtener de univar. Si incluye la opción vlabel, también incluye las etiquetas de la variable en la tabla. La opción boxplot muestra un mini boxplot por encima de cada variable. Aquí usamos la opción by (female) para mostrar tablas separadamente para machos y hembras. Podemos usar las opciones by (female) y onehdr para obtener una tabla con una cabecera que puede ser un poco más fácil de leer. Aquí pedimos un boxplot para la variable write y pedimos que los boxplots sean trazados usando la misma escala (a través de onescal) para poder comparar significativamente el boxplot de machos y hembras. Usted puede ver que la mediana del boxplot es más alta para las hembras. (Si hubiéramos omitido la opción onescal, cada boxplot estaría en su propia escala). Para obtener más información Para obtener más información, consulte la ayuda o el manual de referencia sobre el resumen. El contenido de este sitio web no debe ser interpretado como un endoso de cualquier sitio web, libro o producto de software en particular por la Universidad de California. Bienvenido al Instituto de Investigación y Educación Digital Stata Learning Module Información descriptiva y estadísticas Comandos para mostrar información descriptiva y estadísticas descriptivas sobre archivos de datos. Obtención de una descripción general de su archivo El comando sysuse carga un dataset de formato Stata especificado que se envió con Stata. Aquí utilizaremos el archivo de datos automático. El comando describe muestra información básica sobre un archivo de datos Stata. Como puede ver, nos indica el número de observaciones en el archivo, el número de variables, los nombres de las variables y más. El comando codebook es una gran herramienta para obtener una visión general rápida de las variables en el archivo de datos. Produce una clase de libro de códigos electrónicos del archivo de datos. Echa un vistazo a lo que produce a continuación. Otro comando útil para obtener una vista rápida de un archivo de datos es el comando inspeccionar. Esto es lo que produce el comando de inspección para el archivo de datos automático. El comando list es útil para ver todo o un rango de observaciones. Aquí miramos hacer, precio, mpg, rep78 y extranjero para las primeras 10 observaciones. Creación de tablas El comando tabulate es útil para obtener tablas de frecuencia. A continuación, hacemos una tabla para rep78 y una tabla para extranjeros. El comando también se puede acortar a la pestaña. El comando tab1 se puede usar como atajo para solicitar tablas para una serie de variables (en lugar de escribir el comando tabulate una y otra vez para cada variable de interés). Podemos usar la opción de trazado para hacer una gráfica para mostrar visualmente los valores tabulados. También podemos hacer tablas de referencias cruzadas usando tabulate. Veamos el historial de reparaciones desglosado por automóviles nacionales e internacionales. Con la opción de columna, podemos solicitar porcentajes de columna. Tenga en cuenta que alrededor de 86 de los coches extranjeros recibió una calificación de 4 o 5. Sólo unos 23 de los coches nacionales fueron muy bien calificados. Podemos usar la opción nofreq para suprimir las frecuencias, y sólo enfocarnos en los porcentajes. Tenga en cuenta que el orden de las opciones no importa. Sólo recuerde que las opciones deben venir después de la coma. Generación de estadísticas de resumen con resumen Para estadísticas de resumen, podemos utilizar el comando summary. Permite generar algunas estadísticas de resumen en mpg. Podemos usar la opción detail del comando summarize para obtener estadísticas de resumen más detalladas. Para obtener estos valores por separado para extranjeros y nacionales, podríamos usar el prefijo extranjero: como se muestra a continuación. Tenga en cuenta que primero tuvimos que ordenar los datos antes de usarlos por. Esta no es la manera más eficiente de hacer esto. Otra forma, que no requiere que los datos sean ordenados, es mediante la opción summarize () como parte del comando tabulate. Resumen Proporcione información sobre el archivo de datos actual, incluyendo el número de variables y observaciones y una lista de las variables en un archivo de datos. Produce el libro de códigos como información para el archivo de datos actual. Proporcione una descripción rápida del archivo de datos. Enumerar las variables make y mpg. Hacer una tabla de mpg. Hacer una tabla de dos vías de rep78 por extranjeros. Producir estadísticas resumen de mpg y el precio. Producir estadísticas de resumen para mpg por separado para los coches nacionales y extranjeros. Producir estadísticas de resumen para mpg por extranjeros (antes de ordenar no es necesario). El contenido de este sitio web no debe ser interpretado como un endoso de ningún sitio web, libro o producto de software en particular por la Universidad de California. Estadísticas de resumen en Stata Una vez que tenga un conjunto de datos listo para analizar1. El primer paso de cualquier buen proyecto empírico debe ser crear estadísticas de resumen. Las estadísticas de resumen son una manera de explorar su conjunto de datos, encontrar patrones y quizás incluso refinar su pregunta de interés. En este taller, aprenderá a usar Stata para crear estadísticas de resumen básicas, tabulaciones cruzadas y tablas cada vez más ricas de estadísticas resumidas. Este taller está diseñado para enseñarle sintaxis, en lugar de apuntar y hacer clic en comandos. La principal ventaja de escribir un archivo-do es que siempre se puede reutilizar la mayoría de ellos en diferentes proyectos, con sólo unos pocos ajustes si se utiliza Stata por punto y haga clic en comandos, se condenará a empezar desde cero cada vez. Utilizaremos un conjunto de datos de la Encuesta de Salud de la Comunidad Canadiense (CCHS). Usted puede encontrarlo en la ruta de inserción de carpeta aquí, el conjunto de datos es U: STAFFJLStatasummarystatsprojectsummstats. dta, un subconjunto de CCHS I creado y limpiado un poco (recodificar para hacer binario 0-1). Antes de empezar, veamos la descripción de cada variable2: Una tabulación simple siempre debe ser la primera puñalada en sus datos. El comando tabulate devuelve una tabla de distribución de frecuencia y de acumulación en el visor Stata. Digamos que usted quiere saber la proporción de encuestados en la muestra que alguna vez recibió una vacuna contra la gripe: Tenga en cuenta que puede combinar el comando tabulate con el prefijo by (o bysort) para ver la tabulación de subgrupos en su conjunto de datos. El prefijo bysort es una combinación de by y sort que podría dividirse de manera equivalente en dos comandos, pero es generalmente más sencillo de usar bysort Stata primero clasificará los datos y luego devolverá la información por categoría. Por ejemplo, aquí vamos a ver si los patrones de vacunas contra la gripe parecen diferentes para cada provincia: Si sólo está interesado en un subgrupo, también puede usar el calificador if con el comando tabulate. Aquí, digamos que queremos saber la frecuencia de vacunas contra la gripe en la muestra para Ontario: Por último, puede utilizar el comando tabulate para hacer una tabulación cruzada simple usando variables categóricas. Digamos que usted quiere saber cuántas de las mujeres de la muestra fumado más de 100 cigarrillos en su vida: Una vez que haya tabulado sus datos, puede empezar a buscar estadísticas de resumen de la frecuencia. El resumen de comandos devuelve la media, desviación estándar, mínimo, máximo y frecuencia. El ejemplo se construye de la misma manera que el ejemplo de tabulación. En primer lugar, examinamos las estadísticas resumidas de toda la muestra y luego examinamos las estadísticas de las submuestras (cada provincia). El uso del calificador if devuelve las estadísticas de resumen de un subgrupo específico. En estos ejemplos nos hemos centrado en dividir la muestra por provincia, pero puede utilizarse cualquier variable categórica. En los ejemplos siguientes, veremos a hombres y mujeres, fumadores y no fumadores, físicamente activos o no. La manera en que miras tus datos depende del tipo de preguntas que quieras hacer, más clara será tu análisis. Esta combinación de comandos le permite crear tablas de estadísticas de un solo sentido y bidireccionales simples en Stata. La primera parte del comando (tabular) dividirá sus datos de acuerdo con una variable categórica (aquí usaremos sexo). La segunda parte dará estadísticas de resumen para otra variable (preferiblemente cuantitativa). Vamos a decir que quiere saber cómo (si) hombres y mujeres difieren en su consumo diario de frutas y hortalizas: Esta tabla nos dará la media, la desviación estándar y la frecuencia del consumo diario de frutas y hortalizas para hombres y mujeres en la muestra : Si desea saber si hombres y mujeres de diferentes provincias tienen diferentes patrones en su consumo diario promedio de frutas y hortalizas, puede utilizar el comando bysort de nuevo para hacer la misma consulta provincia por provincia: Tenga en cuenta que también puede utilizar el if Calificador aquí (como lo hicimos en el tabular y resumir comandos) para mirar, por ejemplo, una provincia only3. También puede utilizar el comando tabulate, summarize () para crear una tabla rápida de estadísticas de cuatro vías. Por ejemplo, si desea examinar los patrones de consumo diario de frutas y verduras para hombres y mujeres con diferentes hábitos de fumar, podría crear una tabla para eso: El resultado parece mostrar un cierto patrón: los fumadores parecen comer menos fruta y Verduras que no fumadoras, y las mujeres parecen comer más frutas y verduras que los hombres, en promedio4. El comando tabstat muestra estadísticas resumidas de una serie de variables numéricas en una tabla, posiblemente desglosada por (condicionada por) otra variable. Sin la opción by (), tabstat es una alternativa útil para resumir porque le permite especificar la lista de estadísticas que se mostrarán. Con la opción by (), tabstat se asemeja a la tabulación utilizada con su opción summarize () en que ambas estadísticas de informe de varlist para los diferentes valores de varname. El comando tabstat permite una mayor flexibilidad en términos de las estadísticas presentadas y el formato de la tabla. La primera línea devolverá las estadísticas (media, desviación estándar y frecuencia) para 4 variables (HWTGHTM HWTGWTK HWTGBMI PACFD) para toda la muestra. La ventana de resultados se ve así: La segunda línea le dice a Stata que haga lo mismo, pero para dividir la muestra entre el macho y la hembra. Éste es el resultado: Observe cómo también conseguimos el total, así que si usted está interesado en las muestras de la fractura y el total, ninguna necesidad de hacer ambos por separado. Finalmente, la tercera línea de mando, con el prefijo bysort, hará lo mismo turno para cada provincia, y dividirá cada sub-muestra en macho y hembra. Los resultados están en el mismo formato, sin embargo esto devuelve la submuestra (es decir, provinciales) total para hombres y mujeres combinados, pero no el total general para todas las provincias: Tenga en cuenta que usted elige las estadísticas que se informan en la tabla. Las estadísticas disponibles se listan en la ayuda tabstat: El comando table calcula y muestra tablas de estadísticas. Al igual que en tabstat, puede seleccionar las estadísticas que desea reportar, pero también puede elegir la variable para la que desea que se informen las estadísticas, así como las variables que desea que la información se multiplique. La estructura de la sintaxis es simple, pero tiene una mirada más cercana: Esto hará que una tabla con PACFD sea la variable de fila (pero sólo si el valor de PACFD no es. d5), DHHSEX como la variable superrow y el contenido de cada celda Será la media, la desviación estándar y la frecuencia de la variable FVCDTOT: ¿Podemos hacerlo mejor Sí, podemos. Se pueden especificar hasta cuatro variables en el by (), por lo que con las tres variables de fila, columna y supercolumna, se pueden mostrar tablas de siete vías. No haremos una tabla de siete direcciones hoy, pero veamos una tabla de cuatro direcciones con superrow (una tabla de cinco vías, si te gustaría): La sintaxis es la misma, sólo se ve más complicado. Tabla rowvar colvar supercolvar si en peso, options6 En nuestro ejemplo, la variable de fila es de nuevo PACDFD, la variable de columna es SMK01B. Estamos usando el calificador if para restringir a la observación para la cual los valores de las variables de fila y columna son 0 o 1, el contenido de las células es de nuevo la media, la desviación estándar y la frecuencia de la variable FVCDTOT, y tenemos DHHSEX como un Superrow variable. La manera de leer esta tabla es simple: una mujer encuestada que no realiza más de 15 minutos de actividad diaria y nunca ha fumado un cigarrillo entero come en promedio 5.1 unidades de frutas y verduras diariamente. Ahora, un florecimiento final Una tabla de cuatro vías con supercolumna y superrolla Aquí está el comando: tabla PACFD SMK01B FLU160 si ((PACFD. d) amp (SMK01B0SMK01B1) amp (FLU1600FLU1601)), c (media FVCDTOT sd FVCDTOT n FVCDTOT) por (DHHSEX) Ahora, usted puede preguntarse, ¿realmente necesito hacer todo eso sólo para mirar las estadísticas de resumen? La respuesta variará en función de su nivel de sofisticación, su pregunta de investigación o su programa de investigación de supervisor. Para algunos, tabular, resumir Y tal vez tabular, resume () será más que suficiente. Para otros, tabstat y table pueden ser herramientas muy útiles. Le animamos a jugar con los datos ya obtener un conocimiento íntimo de su conjunto de datos antes de realizar un análisis estadístico más formal. Hay muchas buenas fuentes interenet para lecturas suplementarias sobre la creación de estadísticas de resumen en Stata. Sea específico cuando ingrese una consulta en un motor de búsqueda y debe encontrar mucho asesoramiento escrito por el usuario. 1 Véanse las guías de obtención de datos de ltodesigt, limpieza de datos en Stata 2 Observará unos comandos administrativos antes del comando describe (aquí abreviado en des) 3 La sintaxis sería simplemente: ficha DHHSEX si GEOGPRV35, suma (FVCDTOT) 4 No podemos Extraer inferencia de mirar los medios que tendríamos que probar si cualquiera de estos medios es estadísticamente diferente de los demás. Sin embargo, mirar estas estadísticas de resumen es un buen comienzo para investigar patrones en los datos. 5 En este conjunto de datos. D es un código de datos que falta 6 Escriba la tabla de ayuda en la ventana de comandos de Stata para una presentación detallada de las características de este comando.

Forex piojo

Search This Blog

Cómo Interpret Summary Statistics In Stata Forex

Comments

Post a Comment

Popular posts from this blog

Forex Difference Between Buy And Sell

Good Night Top 10 Sms Forex

Forex No Deposit Bonus 50 $ 2015