Ad01

Ad02

lunes, 23 de junio de 2014

TALLER DE DISEÑO EXPERIMENTAL

TALLER DE DISEÑO EXPERIMENTAL


1.     Se desea saber cuál es la mejor manera de obtener menos perdidas en la extracción de pulpa de guanábana usando dos equipos diferentes, una despulpadora industrial y otra comercial usada en cocina. Usando 1000 g de muestra sin importar  su variedad.

Tabla 1. Porcentaje de pérdida al extraer pulpa de guanábana por cada 1000 g de
Muestra
Industrial (% perdida)
Comercial (% perdida)
25
20
27
19
28
21
25
18
26
22
27
23
29
21
24
20
25
25
27
20
30
20

a.    Encontrar si los datos se ajustan a una distribución normal, comprobarlo de manera gráfica y a través de algunos análisis realizados en el cuadro resumen.
b.    Encontrar  con un 95% de confianza, el  intervalo  para la diferencia de medias suponiendo varianzas iguales.
c.    ¿Existen diferencias significativas entre la  despulpadora industrial y la comercial? ¿Si existe cómo lo justifica?
d.    De igual manera, comprobar si se puede considerar que las varianzas en ambas despulpadoras son iguales.








Respuestas:

a.     
Tabla 2. Cuadro resumen del ejercicio 1

COMERCIAL
INDUSTRIAL
Recuento
11
11
Promedio
20,8182
26,6364
Desviación Estándar
1,94001
1,85864
Coeficiente de Variación
9,31882%
6,97783%
Mínimo
18,0
24,0
Máximo
25,0
30,0
Rango
7,0
6,0
Sesgo Estandarizado
1,23741
0,57257
Curtosis Estandarizada
0,738638
-0,400545


Figura 1. Grafico de probabilidad normal, maquina comercial

El gráfico anterior muestra la distribución de los datos sobre la perdida de la extracción de la pulpa de  guanábana de la maquina comercial, estos datos no se encuentran dispersos, además se ajustan en un línea recta, se concluye que los datos fueron distribuidos normalmente.
También se puede afirmar lo anterior con la curtosis, el cuadro resumen arrojó un valor de , de esta manera se puede inferir que los datos se distribuyeron normalmente porque el resultado está dentro del rango de la curtosis.


Figura 2. Grafico de probabilidad normal, maquina industrial

El gráfico anterior muestra la distribución de los datos sobre la perdida de la extracción de la pulpa de guanábana de la maquina industrial, estos datos no se encuentran dispersos, además se ajustan en un línea recta, se concluye que los datos fueron distribuidos normalmente.
También se puede afirmar lo anterior con la curtosis, el cuadro resumen arrojó un valor de , de esta manera se puede inferir que los datos se distribuyeron normalmente porque el resultado está dentro del rango de la curtosis.

b.    Se consideran que las varianzas de las maquinas industrial y comercial tienen una diferencia estadísticamente significativa con un nivel de confianza del 95% porque el valor-P arrojó un resultado de .
Además también se puede inferir que estas dos muestras no son iguales porque en el intervalo de la diferencia de medias, , no se encuentra el número 1.

c.    El vapor-P arrojó como resultado  con un nivel de confianza del 95%, esto indica que no hay diferencia significativa entre la maquina comercial y la maquina industrial porque el valor-P está por encima de 0.05.

d.    Se puede concluir que las varianzas de ambas despulpadoras son iguales porque  el valor-P de las desviaciones estándar arrojó un valor de  

2.     Se hidrolizó con ácido sulfúrico a concentraciones de 0.5, 0.1 y 2.0 Molar raíces de arracacha con el fin de obtener azúcares reductores, se requiere evaluar si el factor concentración de ácido sulfúrico influye o no sobre los nabos de arracacha. ¿Qué concentración produce mayores rendimientos?

Tabla 3. Incidencia del ácido sulfúrico en arracacha sobre los carbohidratos reductores


control
0,50 M
1,00 M
2,00 M
mg CH R./g muestra seca
mg CH R./g muestra seca
mg CH R./g muestra seca
mg CH R./g muestra seca
Nabos de arracacha
179,3676
177,9267
349,6964
290,5843
186,7018
167,2168
347,0978
266,4300
185,7573
180,4464
330,2142
250,0794
170,2363
195,6402
350,0219
264,9436
206,5446
198,2475
325,2568
285,3818
196,5413
207,7217
328,0558
247,8498
195,2729
207,0118
332,3540
247,1066
200,7716
205,3062
311,3961
284,6386
191,2475
207,0118
290,9946
266,0584


a.    Verificar los supuestos de un ANOVA
b.    Presentar el cuadro resumen
c.    ¿Existe una diferencia estadísticamente significativa entre la media de azúcares reductores entre un nivel de ácido sulfúrico y otro, con un nivel del 95,0% de confianza? ¿Cuál es la hipótesis planteada para este caso?
d.    ¿Con cuál concentración se obtuvo mayor rendimiento? ¿cómo lo puede comprobar?







Respuestas:


a.     
Figura 3. Grafico de probabilidad normal del ejercicio 2

El gráfico anterior muestra la distribución de los datos del rendimiento de una concentración de ácido sulfúrico  sobre nabos de arracacha, estos datos no se encuentran dispersos, además se ajustan en un línea recta, se concluye que los datos fueron distribuidos normalmente.

Figura 4. Grafico de homocedasticidad del ejercicio 2


La gráfica anterior muestra que hay homocedasticidad porque los datos no forman un embudo, esto quiere decir que las varianzas son iguales.


Figura 5. Grafico de independencia de residuos del ejercicio 2

La grafica anterior muestra que los datos se encuentran dispersos, se concluye que hubo aleatorización.

b.     
Tabla 4. Cuadro resumen del ejercicio 2
Fuente
Suma de Cuadrados
Gl
Cuadrado Medio
Razón-F
Valor-P
Entre grupos
118863,
3
39620,9
157,19
0,0000
Intra grupos
8065,91
32
252,06


Total (Corr.)
126928,
35




El valor-P evalúa si el rendimiento de  los nabos de arracacha es igual cuando se aplica diferentes concentraciones de acido sulfurico, el cuadro resumen ANOVA arrojó que el valor-P es igual a 0 con un nivel de confianza del 95%, esto quiere decir que hay diferencias significativas cuando se utilizan diferentes concentraciones de acido sulfurico.

c.     
Tabla 5. Grupos homogéneos del ejercicio 2
CONCENTRACIÓN
Casos
Media
Grupos Homogéneos
0
9
190,271
X
0,5
9
194,059
X
2
9
267,008
   X
1
9
329,454
      X

Tabla 6. Grupos homogéneos del ejercicio 2
Contraste
Sig.
Diferencia
+/- Límites
0 - 0,5

-3,78758
20,2807
0 - 1
 *
-139,183
20,2807
0 - 2
 *
-76,7368
20,2807
0,5 - 1
 *
-135,395
20,2807
0,5 - 2
 *
-72,9493
20,2807
1 - 2
 *
62,4461
20,2807

Las tablas muestran que existe una diferencia estadísticamente significativa entre los grupos que se les ha aplicado una diferente concentración, el grupo que se le aplicó una concentración de 0 Molar (control) y el grupo de 0.5 molar son homogéneos, a diferencia de los grupos de 1 Molar y 2 Molar.
Asimismo en la tabla 6 se comparan cada uno de los grupos con los demás, indicando que todas las comparaciones presentan una diferencia significativa con excepción de la comparación del grupo de 0 Molar (control) y el grupo 0.5 Molar.
La hipótesis para este caso es que todas las medias de cada uno de los grupos de rendimiento obtenido con las diferentes concentraciones son iguales.





   
Figura 6. Grafico del rendimiento según la concentración

La grafica anterior muestra el rendimiento de las diferentes concentraciones sobre nabos de arracachas, esta figura indica que con una concentración de 1 molar el rendimiento es el mejor.

3.     La distribución del tamaño en Kb de los ficheros que resultan al digitalizar imágenes con un determinado programa puede suponerse normal. La empresa que comercializa dicho programa ha diseñado una versión del mismo (versión B), con un interfaz más atractivo para el cliente.
Se realizó un experimento digitalizando 15 imágenes que había en ese momento en el laboratorio con las dos versiones del programa A y B, obteniéndose los siguientes resultados:

Tabla 7. Distribución del tamaño en Kb de los ficheros en dos versiones
Imagen
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Versión A
640
666
786
895
664
675
745
488
634
678
694
654
688
679
657
Versión B
588
570
664
783
566
567
769
390
547
570
586
526
573
549
603

a.    ¿Qué método utilizaríamos ahora para analizar los resultados obtenidos? ¿Por qué?
b.    ¿Qué conclusiones obtendríamos? ¿Qué versión del programa produce un tamaño menor de fichero al digitalizar una imagen? (Utilizar α=0,10)



Respuestas:

a.    Se utiliza el método de comparación de muestras pareadas porque se compara 15 imágenes con dos versiones de digitalización diferentes, A y B.

b.    El valor-P tiene un valor de , se concluye que hay diferencias estadísticamente significativas entre los resultados de digitalización de las imágenes de las versiones A y B.
La versión que produce un tamaño menor de fichero es la versión A con un promedio de , a comparación de la versión B con un promedio de .


4.    Varios investigadores desean saber si es posible concluir que dos poblaciones de niños difieren respecto a la edad promedio en la cual pueden caminar por sí solos. Los investigadores obtuvieron los siguientes datos (edades en meses).


Tabla 8. Edad de los niños de dos poblaciones para caminar
Muestra en la población A
9.5
10.5
9
9.75
10
13
10
13.5
10
9.5
10
9.75
Muestra en la población B
12.5
9.5
13.5
13.75
12
13.75
12.5
9.5
12
13.5
12
12


Respuesta:

El valor-P tiene un valor de , se concluye que hay diferencias estadísticamente significativas entre la edad cuando los niños comienzan a caminar comparando las poblaciones A y B.
Los niños de la población A comienzan a caminar más temprano, con un promedio de  meses, que los niños de la población B, con un promedio de  meses.


5.     Un investigador cree que las personas que fuman, tienden a fumar más durante periodos de tensión. En un grupo de 18 estudiantes seleccionados aleatoriamente, compara el número de cigarrillos que fuman regularmente, con el número de cigarrillos que fuman durante las 24 horas antes de un examen de Estadística. Pruebe la hipótesis apropiada con un nivel de  confianza del 95%. Recuerde verificar los supuestos. Informe sus resultados al investigador.





Tabla 9. Cantidad de cigarrillos fumados por estudiantes en un tiempo normal y en un tiempo de tensión
ESTUDIANTE
No REGULAR DE CIGARRILLOS DIARIOS
No DE CIGARRILLOS ANTES DEL EXÁMEN
1
9
13
2
16
15
3
23
23
4
12
17
5
30
32
6
8
16
7
14
18
8
21
23
9
11
15
10
14
14
11
10
16
12
11
13
13
13
19
14
6
12
15
11
13
16
17
11
17
36
41
18
32
40


Respuestas:


Figura 7. Grafico de probabilidad normal del ejercicio 5
Los datos sobre el número de cigarrillos que fuman 18 estudiantes regularmente o antes de un examen se encuentran distribuidos normalmente porque los se ajustan a una línea recta.
El valor-P tiene un valor de , se concluye que hay diferencias estadísticamente significativas entre el número de cigarrillos que un grupo de estudiantes fuma regularmente y antes del parcial de estadística.
Los estudiantes fuman una mayor cantidad de cigarrillos cuando tienen que presentar el parcial de estadística, con un promedio de 20 cigarrillos, en cambio cuando ellos no tienen que presentar ningún parcial ellos fuman regularmente 16 cigarrillos.


6.    En el proceso de fermentación del maracuyá para obtención de vino, existen cambios en las propiedades químicas, entre ellas el pH y los grados Brix. Por tanto, se quiere identificar si hay diferencias significativas a través del tiempo de éstas características.

Tabla 10. Datos del pH de la fermentación del maracuyá durante diferentes tiempos
FRUTA DE MARACUYÁ
  Tiempo
pH
0
2,71
0
2,75
0
2,78
4
3,01
4
2,98
4
3,1
7
2,97
7
2,94
7
2,91
10
3,18
10
3,12
10
3,12
15
3,13
15
3,14
15
3,08
22
3,19
22
3,16
22
3,14
28
3,18
28
3,23
28
3,18


a.    Verificar los supuestos de un ANOVA
b.    Presentar el cuadro resumen
c.    Existe una diferencia estadísticamente significativa a través del tiempo  en esta propiedad química con un nivel de confianza del 95%? ¿Cuál es la hipótesis planteada para este caso?

Respuestas:


a.     
Figura 8. Grafico de probabilidad normal del ejercicio 6
El gráfico anterior muestra la distribución de los datos del cambio del pH de la fermentación del maracuyá, estos datos no se encuentran dispersos, además se ajustan en un línea recta, se concluye que los datos fueron distribuidos normalmente.

Figura 9. Grafico de homocedasticidad del ejercicio 6

La gráfica anterior muestra que hay homocedasticidad porque los datos no forman un embudo, esto quiere decir que las varianzas son iguales


Figura 10. Grafico de independencia de residuos del ejercicio 6

La grafica anterior muestra que los datos se encuentran dispersos, se concluye que hubo aleatorización.

b.
 Tabla 11. Cuadro resumen del ejercicio 6
Fuente
Suma de Cuadrados
Gl
Cuadrado Medio
Razón-F
Valor-P
Entre grupos
0,454114
6
0,0756857
54,43
0,0000
Intra grupos
0,0194667
14
0,00139048


Total (Corr.)
0,473581
20




El cuadro resumen ANOVA arrojó que el valor-P es igual a 0 con un nivel de confianza del 95%, esto quiere decir que hay diferencias significativas cuando el pH varia dependiendo del tiempo.

c.
Tabla 12. Grupos homogéneos del ejercicio 6
tiempo
Casos
Media
Grupos Homogéneos
0
3
2,74667
X
7
3
2,94
  X
4
3
3,03
    X
15
3
3,11667
     X
10
3
3,14
     XX
22
3
3,16333
     XX
28
3
3,19667
       X

Tabla 13. Grupos homogéneos del ejercicio 6
Contraste
Sig.
Diferencia
+/- Límites
0 - 4
 *
-0,283333
0,0653012
0 - 7
 *
-0,193333
0,0653012
0 - 10
 *
-0,393333
0,0653012
0 - 15
 *
-0,37
0,0653012
0 - 22
 *
-0,416667
0,0653012
0 - 28
 *
-0,45
0,0653012
4 - 7
 *
0,09
0,0653012
4 - 10
 *
-0,11
0,0653012
4 - 15
 *
-0,0866667
0,0653012
4 - 22
 *
-0,133333
0,0653012
4 - 28
 *
-0,166667
0,0653012
7 - 10
 *
-0,2
0,0653012
7 - 15
 *
-0,176667
0,0653012
7 - 22
 *
-0,223333
0,0653012
7 - 28
 *
-0,256667
0,0653012
10 - 15

0,0233333
0,0653012
10 - 22

-0,0233333
0,0653012
10 - 28

-0,0566667
0,0653012
15 - 22

-0,0466667
0,0653012
15 - 28
 *
-0,08
0,0653012
22 - 28

-0,0333333
0,0653012

Las tablas muestran que existe una diferencia estadísticamente significativa del pH de la fermentación del maracuyá durante diferentes tiempos. Hay solamente dos grupos homogéneos, el que comprende los tiempos de 15, 10 y 22 y el de los tiempos 10, 22 y 28.
Asimismo en la tabla 12 se comparan cada uno de los grupos con los demás, indicando que las comparaciones que presentan un color rojo tienen una diferencia significativa.
La hipótesis para este caso es que el pH se mantenga igual en los diferentes intervalos de tiempo.

7.     Se realizó un estudio sobre el desgaste Y de un cojinete y su relación con X1 =viscosidad del aceite  y X2 =carga. Se obtuvieron los siguientes datos

Tabla 14. Datos del desgaste de un cojinete causado por la viscosidad del aceite y  la carga
Y
X1
X2
193
1.6
851
230
15.5
816
172
22
1058
91
43
1201
113
33
1357
125
40
1115


a.    Ajustar un modelo de regresión lineal múltiple a los datos.
b.    Probar la significación de la regresión.
c.    Calcular el estadístico t para cada parámetro del modelo. ¿Qué conclusiones pueden sacarse?

Respuestas:

a.    El modelo ajustado de regresión lineal para el desgaste de un cojinete que depende de la viscosidad del aceite y la carga es:

b.    El valor-P es , esto quiere decir que no hay una relación estadísticamente significativa entre las variables con un nivel de confianza del 95%.


c.     
Tabla 15. Estadístico T para cada parámetro


Error
Estadístico

Parámetro
Estimación
Estándar
T
Valor-P
CONSTANTE
350.994
74.7531
4.69538
0.0183
Vis. Aceite
-1.27199
1.16914
-1.08797
0.3562
Carga
-0.153904
0.0895297
-1.71903
0.1841

El estadístico T sirve para determinar cualquier parámetro de la distribución, en este caso es de importancia porque ayuda a calcular el valor-P para cada parámetro. 

8.    Se dan dos dietas distintas a dos grupos de cerdos asignados aleatoriamente a esas dietas. Las ganancias en peso en determinado tiempo se anotan a continuación:

Tabla 16. Ganancias en peso de dos grupos de cerdos alimentados con dos dietas diferentes
Dieta A
31
34
29
26
32
35
38
34
30
29
32
31
Dieta B
26
24
28
29
30
29
32
26
31
29
32
28

a.    Determine si hay diferencia en la ganancia de peso de los dos grupos de cerdos
b.    Determine si los datos pueden considerarse distribuidos normalmente.
c.    Establezca si se puede afirmar que las varianzas para ambas dietas son iguales con un nivel de confianza del 95%.

Respuestas:

a.    El vapor-P arrojó como resultado  con un nivel de confianza del 95%, esto indica que hay diferencias estadísticamente significativas entre  las dos dietas para la ganancia de peso de los dos grupos de cerdos.



b.     
Figura 11. Grafico de probabilidad normal para la dieta A


Figura 12. Grafico de probabilidad normal para la dieta B


Las figuras anteriores muestran la distribución de los datos de las ganancias en peso de dos grupos de cerdos usando las dietas A y B. Estos datos no se encuentran dispersos, además se ajustan en un línea recta, se concluye que los datos fueron distribuidos normalmente para cada dieta.
c.    El intervalo de confianza para la razón de varianzas con un nivel de confianza del 95% es , puesto que este intervalo contiene el valor de 1, se concluye que no hay diferencias estadísticamente significativas entre las desviaciones estándar de la ganancia de peso de los dos grupos de cerdos.


9.     Comparamos 4 tratamientos clínicos (A, B, C, D) asignando al azar 15 sujetos a los mismos. Las puntuaciones de los sujetos en la VD (un cuestionario de escala de 0 a 150 puntos) fueron:

Tabla 17. Puntuaciones de cuatro tratamientos clínicos
A
42
0
63

B
45
64
33
29
C
44
82
64
74
D
109
120
116
97


a.    Compara si las varianzas de los 4 grupos son similares
b.    Analiza si hay diferencias entre los grupos
c.    ¿Cuál es el grupo que rinde mejor? ¿Y el peor?

Respuestas:

a.    Puesto que el valor-P es  de acuerdo a la varianza, se concluye que las desviaciones estándar para los cuatro tratamientos son las mismas, con un nivel del 95.0% de confianza.
b.    El valor-P es  según las medias de los grupos, esto quiere decir que existe una diferencia estadísticamente significativa entre la media de la puntuación de un tratamiento y otro, con un nivel del 95.0% de confianza
c.     

Figura 13. Puntuación de los diferentes tratamientos

El mejor tratamiento clínico fue el D, que obtuvo la más alta puntuación, y el que menos calificación tuvo o el peor tratamiento fue el A, con un nivel de confianza del 95%
10.  Comparamos dos muestras aleatorias de 10 hombres y de 10 mujeres de edades comprendidas entre los 18 a 22 años en un ítem que mide su autoestima (escala de 0 a 10 puntos).

a.     ¿Podemos afirmar que ambas muestras difieren significativamente en autoestima?
b.     ¿Podemos afirmar que la autoestima de los hombres es significativamente mayor que la de las mujeres?

Tabla 18. Autoestima según el género
Hombres
8
7
6
8
7
5
6
4
9
9
Mujeres
8
6
5
6
5
4
4
4
6
4

Respuestas:

a.    El valor-P es  con un nivel de confianza del 95.0%, este valor quiere decir que hay diferencias estadísticamente significativas entre las medias del autoestima de los hombres y las mujeres. 

b.    La autoestima de los hombres es mayor que la de las mujeres, el promedio de autoestima de los hombres es 6.9 y el de las mujeres 5.2.

2 comentarios:

Ad3