TALLER DE DISEÑO EXPERIMENTAL
1. Se desea saber cuál es la mejor manera de
obtener menos perdidas en la extracción de pulpa de guanábana usando dos
equipos diferentes, una despulpadora industrial y otra comercial usada en
cocina. Usando 1000 g de muestra sin importar
su variedad.
Tabla 1. Porcentaje de pérdida al extraer pulpa de guanábana por cada 1000 g de
Muestra
Industrial (% perdida)
|
Comercial (% perdida)
|
25
|
20
|
27
|
19
|
28
|
21
|
25
|
18
|
26
|
22
|
27
|
23
|
29
|
21
|
24
|
20
|
25
|
25
|
27
|
20
|
30
|
20
|
a. Encontrar
si los datos se ajustan a una distribución normal, comprobarlo de manera
gráfica y a través de algunos análisis realizados en el cuadro resumen.
b. Encontrar con un 95% de
confianza, el intervalo para la diferencia de medias suponiendo
varianzas iguales.
c. ¿Existen
diferencias significativas entre la despulpadora
industrial y la comercial? ¿Si existe cómo lo justifica?
d. De
igual manera, comprobar si se puede considerar que las varianzas en ambas
despulpadoras son iguales.
Respuestas:
a.
Tabla 2. Cuadro
resumen del ejercicio 1
COMERCIAL
|
INDUSTRIAL
|
|
Recuento
|
11
|
11
|
Promedio
|
20,8182
|
26,6364
|
Desviación Estándar
|
1,94001
|
1,85864
|
Coeficiente de
Variación
|
9,31882%
|
6,97783%
|
Mínimo
|
18,0
|
24,0
|
Máximo
|
25,0
|
30,0
|
Rango
|
7,0
|
6,0
|
Sesgo Estandarizado
|
1,23741
|
0,57257
|
Curtosis
Estandarizada
|
0,738638
|
-0,400545
|
Figura 1. Grafico de probabilidad normal, maquina
comercial
El gráfico anterior muestra la distribución
de los datos sobre la perdida de la extracción de la pulpa de guanábana de la maquina comercial, estos
datos no se encuentran dispersos, además se ajustan en un línea recta, se
concluye que los datos fueron distribuidos normalmente.
También se puede afirmar lo anterior con la
curtosis, el cuadro resumen arrojó un valor de
, de esta manera se puede
inferir que los datos se distribuyeron normalmente porque el resultado está
dentro del rango de la curtosis.
Figura 2. Grafico de probabilidad normal, maquina industrial
El gráfico anterior muestra la distribución
de los datos sobre la perdida de la extracción de la pulpa de guanábana de la
maquina industrial, estos datos no se encuentran dispersos, además se ajustan
en un línea recta, se concluye que los datos fueron distribuidos normalmente.
También se puede afirmar lo anterior con la
curtosis, el cuadro resumen arrojó un valor de
, de
esta manera se puede inferir que los datos se distribuyeron normalmente porque
el resultado está dentro del rango de la curtosis.
b. Se
consideran que las varianzas de las maquinas industrial y comercial tienen una
diferencia estadísticamente significativa con un nivel de confianza del 95%
porque el valor-P arrojó un resultado de
.
Además
también se puede inferir que estas dos muestras no son iguales porque en el
intervalo de la diferencia de medias,
, no se
encuentra el número 1.
c. El
vapor-P arrojó como resultado
con un nivel de confianza del 95%, esto indica
que no hay diferencia significativa entre la maquina comercial y la maquina
industrial porque el valor-P está por encima de 0.05.
d.
Se puede concluir que las varianzas de ambas
despulpadoras son iguales porque el valor-P
de las desviaciones estándar arrojó
un valor de
2.
Se
hidrolizó con ácido sulfúrico a concentraciones de 0.5, 0.1 y 2.0 Molar raíces
de arracacha con el fin de obtener azúcares reductores, se requiere evaluar si
el factor concentración de ácido sulfúrico influye o no sobre los nabos de
arracacha. ¿Qué concentración produce mayores rendimientos?
Tabla 3. Incidencia
del ácido sulfúrico en arracacha sobre los carbohidratos reductores
control
|
0,50 M
|
1,00 M
|
2,00 M
|
|
mg CH R./g muestra seca
|
mg CH R./g muestra seca
|
mg CH R./g muestra seca
|
mg CH R./g muestra seca
|
|
Nabos de arracacha
|
179,3676
|
177,9267
|
349,6964
|
290,5843
|
186,7018
|
167,2168
|
347,0978
|
266,4300
|
|
185,7573
|
180,4464
|
330,2142
|
250,0794
|
|
170,2363
|
195,6402
|
350,0219
|
264,9436
|
|
206,5446
|
198,2475
|
325,2568
|
285,3818
|
|
196,5413
|
207,7217
|
328,0558
|
247,8498
|
|
195,2729
|
207,0118
|
332,3540
|
247,1066
|
|
200,7716
|
205,3062
|
311,3961
|
284,6386
|
|
191,2475
|
207,0118
|
290,9946
|
266,0584
|
a.
Verificar los supuestos de un ANOVA
b.
Presentar el cuadro resumen
c.
¿Existe una diferencia estadísticamente
significativa entre la media de azúcares reductores entre un nivel de ácido sulfúrico
y otro, con un nivel del 95,0% de confianza? ¿Cuál es la hipótesis planteada
para este caso?
d.
¿Con cuál concentración se obtuvo mayor
rendimiento? ¿cómo lo puede comprobar?
Respuestas:
a.
Figura 3. Grafico de probabilidad normal del ejercicio
2
El
gráfico anterior muestra la distribución de los datos del rendimiento de una
concentración de ácido sulfúrico sobre
nabos de arracacha, estos datos no se encuentran dispersos, además se ajustan
en un línea recta, se concluye que los datos fueron distribuidos normalmente.
Figura 4. Grafico de homocedasticidad del ejercicio 2
La
gráfica anterior muestra que hay homocedasticidad porque los datos no forman un
embudo, esto quiere decir que las varianzas son iguales.
Figura 5. Grafico de independencia de residuos del
ejercicio 2
La
grafica anterior muestra que los datos se encuentran dispersos, se concluye que
hubo aleatorización.
b.
Tabla 4. Cuadro
resumen del ejercicio 2
Fuente
|
Suma de Cuadrados
|
Gl
|
Cuadrado Medio
|
Razón-F
|
Valor-P
|
Entre grupos
|
118863,
|
3
|
39620,9
|
157,19
|
0,0000
|
Intra grupos
|
8065,91
|
32
|
252,06
|
||
Total (Corr.)
|
126928,
|
35
|
El valor-P evalúa si el rendimiento
de los nabos
de arracacha es igual
cuando se aplica diferentes concentraciones de acido sulfurico, el cuadro
resumen ANOVA arrojó que el valor-P es igual a 0 con un nivel de confianza del
95%, esto quiere decir que hay diferencias significativas cuando se utilizan
diferentes concentraciones de acido sulfurico.
c.
Tabla 5. Grupos
homogéneos del ejercicio 2
CONCENTRACIÓN
|
Casos
|
Media
|
Grupos Homogéneos
|
0
|
9
|
190,271
|
X
|
0,5
|
9
|
194,059
|
X
|
2
|
9
|
267,008
|
X
|
1
|
9
|
329,454
|
X
|
Tabla 6. Grupos
homogéneos del ejercicio 2
Contraste
|
Sig.
|
Diferencia
|
+/- Límites
|
0 - 0,5
|
-3,78758
|
20,2807
|
|
0 - 1
|
*
|
-139,183
|
20,2807
|
0 - 2
|
*
|
-76,7368
|
20,2807
|
0,5 - 1
|
*
|
-135,395
|
20,2807
|
0,5 - 2
|
*
|
-72,9493
|
20,2807
|
1 - 2
|
*
|
62,4461
|
20,2807
|
Las tablas muestran
que existe una diferencia estadísticamente significativa entre los grupos que
se les ha aplicado una diferente concentración, el grupo que se le aplicó una
concentración de 0 Molar (control) y el grupo de 0.5 molar son homogéneos, a
diferencia de los grupos de 1 Molar y 2 Molar.
Asimismo en la tabla 6
se comparan cada uno de los grupos con los demás, indicando que todas las
comparaciones presentan una diferencia significativa con excepción de la
comparación del grupo de 0 Molar (control) y el grupo 0.5 Molar.
La hipótesis para
este caso es que todas las medias de cada uno de los grupos de rendimiento
obtenido con las diferentes concentraciones son iguales.
Figura 6. Grafico del rendimiento según la
concentración
La
grafica anterior muestra el rendimiento de las diferentes concentraciones sobre
nabos de arracachas, esta figura indica que con una concentración de 1 molar el
rendimiento es el mejor.
3.
La
distribución del tamaño en Kb de los ficheros que resultan al digitalizar
imágenes con un determinado programa puede suponerse normal. La empresa que
comercializa dicho programa ha diseñado una versión del mismo (versión B), con
un interfaz más atractivo para el cliente.
Se realizó
un experimento digitalizando 15 imágenes que había en ese momento en el
laboratorio con las dos versiones del programa A y B, obteniéndose los
siguientes resultados:
Tabla 7. Distribución
del tamaño en Kb de los ficheros en dos versiones
Imagen
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
11
|
12
|
13
|
14
|
15
|
Versión A
|
640
|
666
|
786
|
895
|
664
|
675
|
745
|
488
|
634
|
678
|
694
|
654
|
688
|
679
|
657
|
Versión B
|
588
|
570
|
664
|
783
|
566
|
567
|
769
|
390
|
547
|
570
|
586
|
526
|
573
|
549
|
603
|
a.
¿Qué método utilizaríamos ahora para analizar
los resultados obtenidos? ¿Por qué?
b.
¿Qué conclusiones obtendríamos? ¿Qué versión
del programa produce un tamaño menor de fichero al digitalizar una imagen?
(Utilizar α=0,10)
Respuestas:
a.
Se utiliza el método de comparación de
muestras pareadas porque se compara 15 imágenes con dos versiones de
digitalización diferentes, A y B.
b.
El valor-P tiene un valor de
, se concluye que hay diferencias estadísticamente
significativas entre los resultados de digitalización de las imágenes de las
versiones A y B.
La versión
que produce un tamaño menor de fichero es la versión A con un promedio de
, a comparación de la versión B con un promedio de
.
4.
Varios
investigadores desean saber si es posible concluir que dos poblaciones de niños
difieren respecto a la edad promedio en la cual pueden caminar por sí solos.
Los investigadores obtuvieron los siguientes datos (edades en meses).
Tabla 8. Edad de los niños de
dos poblaciones para caminar
Muestra en la población
A
|
9.5
|
10.5
|
9
|
9.75
|
10
|
13
|
10
|
13.5
|
10
|
9.5
|
10
|
9.75
|
Muestra en la población
B
|
12.5
|
9.5
|
13.5
|
13.75
|
12
|
13.75
|
12.5
|
9.5
|
12
|
13.5
|
12
|
12
|
Respuesta:
El valor-P tiene un valor de
, se concluye que hay diferencias
estadísticamente significativas entre la edad cuando los niños comienzan a
caminar comparando las poblaciones A y B.
Los niños de la población A comienzan a
caminar más temprano, con un promedio de
meses,
que los niños de la población B, con un promedio de
meses.
5.
Un
investigador cree que las personas que fuman, tienden a fumar más durante
periodos de tensión. En un grupo de 18 estudiantes seleccionados
aleatoriamente, compara el número de cigarrillos que fuman regularmente, con el
número de cigarrillos que fuman durante las 24 horas antes de un examen de
Estadística. Pruebe la hipótesis apropiada con un nivel de confianza del 95%. Recuerde verificar los
supuestos. Informe sus resultados al investigador.
Tabla
9. Cantidad
de cigarrillos fumados por estudiantes en un tiempo normal y en un tiempo de
tensión
ESTUDIANTE
|
No REGULAR DE CIGARRILLOS DIARIOS
|
No DE CIGARRILLOS ANTES DEL EXÁMEN
|
|
1
|
9
|
13
|
|
2
|
16
|
15
|
|
3
|
23
|
23
|
|
4
|
12
|
17
|
|
5
|
30
|
32
|
|
6
|
8
|
16
|
|
7
|
14
|
18
|
|
8
|
21
|
23
|
|
9
|
11
|
15
|
|
10
|
14
|
14
|
|
11
|
10
|
16
|
|
12
|
11
|
13
|
|
13
|
13
|
19
|
|
14
|
6
|
12
|
|
15
|
11
|
13
|
|
16
|
17
|
11
|
|
17
|
36
|
41
|
|
18
|
32
|
40
|
Respuestas:
Figura 7. Grafico de probabilidad normal del ejercicio 5
Los
datos sobre el número de cigarrillos que fuman 18 estudiantes regularmente o
antes de un examen se encuentran distribuidos normalmente porque los se ajustan
a una línea recta.
El valor-P tiene un valor de
, se concluye que hay diferencias
estadísticamente significativas entre el número de cigarrillos que un grupo de
estudiantes fuma regularmente y antes del parcial de estadística.
Los estudiantes fuman una mayor cantidad de
cigarrillos cuando tienen que presentar el parcial de estadística, con un
promedio de 20 cigarrillos, en cambio cuando ellos no tienen que presentar
ningún parcial ellos fuman regularmente 16 cigarrillos.
6. En
el proceso de fermentación del maracuyá para obtención de vino, existen cambios
en las propiedades químicas, entre ellas el pH y los grados Brix. Por tanto, se
quiere identificar si hay diferencias significativas a través del tiempo de
éstas características.
Tabla 10. Datos
del pH de la fermentación del maracuyá durante diferentes tiempos
FRUTA DE
MARACUYÁ
|
|
Tiempo
|
pH
|
0
|
2,71
|
0
|
2,75
|
0
|
2,78
|
4
|
3,01
|
4
|
2,98
|
4
|
3,1
|
7
|
2,97
|
7
|
2,94
|
7
|
2,91
|
10
|
3,18
|
10
|
3,12
|
10
|
3,12
|
15
|
3,13
|
15
|
3,14
|
15
|
3,08
|
22
|
3,19
|
22
|
3,16
|
22
|
3,14
|
28
|
3,18
|
28
|
3,23
|
28
|
3,18
|
a.
Verificar los supuestos de un ANOVA
b.
Presentar el cuadro resumen
c.
Existe una diferencia estadísticamente
significativa a través del tiempo en
esta propiedad química con un nivel de confianza del 95%? ¿Cuál es la hipótesis
planteada para este caso?
Respuestas:
a.
Figura 8. Grafico de probabilidad normal del ejercicio
6
El
gráfico anterior muestra la distribución de los datos del cambio del pH de la
fermentación del maracuyá, estos datos no se encuentran dispersos, además se
ajustan en un línea recta, se concluye que los datos fueron distribuidos
normalmente.
Figura 9. Grafico de homocedasticidad del ejercicio 6
La
gráfica anterior muestra que hay homocedasticidad porque los datos no forman un
embudo, esto quiere decir que las varianzas son iguales
Figura 10. Grafico de independencia de residuos del
ejercicio 6
La
grafica anterior muestra que los datos se encuentran dispersos, se concluye que
hubo aleatorización.
b.
Tabla 11. Cuadro resumen del
ejercicio 6
Fuente
|
Suma de Cuadrados
|
Gl
|
Cuadrado Medio
|
Razón-F
|
Valor-P
|
Entre grupos
|
0,454114
|
6
|
0,0756857
|
54,43
|
0,0000
|
Intra grupos
|
0,0194667
|
14
|
0,00139048
|
||
Total (Corr.)
|
0,473581
|
20
|
El cuadro resumen ANOVA arrojó que
el valor-P es igual a 0 con un nivel de confianza del 95%, esto quiere decir
que hay diferencias significativas cuando el pH varia dependiendo del tiempo.
c.
Tabla 12. Grupos
homogéneos del ejercicio 6
tiempo
|
Casos
|
Media
|
Grupos Homogéneos
|
0
|
3
|
2,74667
|
X
|
7
|
3
|
2,94
|
X
|
4
|
3
|
3,03
|
X
|
15
|
3
|
3,11667
|
X
|
10
|
3
|
3,14
|
XX
|
22
|
3
|
3,16333
|
XX
|
28
|
3
|
3,19667
|
X
|
Tabla 13. Grupos
homogéneos del ejercicio 6
Contraste
|
Sig.
|
Diferencia
|
+/- Límites
|
0 - 4
|
*
|
-0,283333
|
0,0653012
|
0 - 7
|
*
|
-0,193333
|
0,0653012
|
0 - 10
|
*
|
-0,393333
|
0,0653012
|
0 - 15
|
*
|
-0,37
|
0,0653012
|
0 - 22
|
*
|
-0,416667
|
0,0653012
|
0 - 28
|
*
|
-0,45
|
0,0653012
|
4 - 7
|
*
|
0,09
|
0,0653012
|
4 - 10
|
*
|
-0,11
|
0,0653012
|
4 - 15
|
*
|
-0,0866667
|
0,0653012
|
4 - 22
|
*
|
-0,133333
|
0,0653012
|
4 - 28
|
*
|
-0,166667
|
0,0653012
|
7 - 10
|
*
|
-0,2
|
0,0653012
|
7 - 15
|
*
|
-0,176667
|
0,0653012
|
7 - 22
|
*
|
-0,223333
|
0,0653012
|
7 - 28
|
*
|
-0,256667
|
0,0653012
|
10 - 15
|
0,0233333
|
0,0653012
|
|
10 - 22
|
-0,0233333
|
0,0653012
|
|
10 - 28
|
-0,0566667
|
0,0653012
|
|
15 - 22
|
-0,0466667
|
0,0653012
|
|
15 - 28
|
*
|
-0,08
|
0,0653012
|
22 - 28
|
-0,0333333
|
0,0653012
|
Las tablas muestran
que existe una diferencia estadísticamente significativa del pH de la
fermentación del maracuyá durante diferentes tiempos. Hay solamente dos grupos
homogéneos, el que comprende los tiempos de 15, 10 y 22 y el de los tiempos 10,
22 y 28.
Asimismo en la tabla
12 se comparan cada uno de los grupos con los demás, indicando que las
comparaciones que presentan un color rojo tienen una diferencia significativa.
La hipótesis para
este caso es que el pH se mantenga igual en los diferentes intervalos de tiempo.
7.
Se
realizó un estudio sobre el desgaste Y de un cojinete y su relación con
X1 =viscosidad del aceite y X2 =carga. Se obtuvieron los
siguientes datos
Tabla 14. Datos del
desgaste de un cojinete causado por la viscosidad del aceite y la carga
Y
|
X1
|
X2
|
193
|
1.6
|
851
|
230
|
15.5
|
816
|
172
|
22
|
1058
|
91
|
43
|
1201
|
113
|
33
|
1357
|
125
|
40
|
1115
|
a.
Ajustar un modelo de regresión lineal
múltiple a los datos.
b.
Probar la significación de la regresión.
c.
Calcular el estadístico t para cada
parámetro del modelo. ¿Qué conclusiones pueden sacarse?
Respuestas:
a.
El modelo ajustado de regresión lineal para
el desgaste de un cojinete que depende de la viscosidad del aceite y la carga
es:
b.
El valor-P es
, esto quiere decir que no hay una relación
estadísticamente significativa entre las variables con un nivel de confianza
del 95%.
c.
Tabla 15. Estadístico
T para cada parámetro
Error
|
Estadístico
|
|||
Parámetro
|
Estimación
|
Estándar
|
T
|
Valor-P
|
CONSTANTE
|
350.994
|
74.7531
|
4.69538
|
0.0183
|
Vis. Aceite
|
-1.27199
|
1.16914
|
-1.08797
|
0.3562
|
Carga
|
-0.153904
|
0.0895297
|
-1.71903
|
0.1841
|
El estadístico T sirve para determinar cualquier
parámetro de la distribución, en este caso es de importancia porque ayuda a
calcular el valor-P para cada parámetro.
8. Se dan dos dietas distintas a dos grupos de cerdos
asignados aleatoriamente a esas dietas. Las ganancias en peso en determinado
tiempo se anotan a continuación:
Tabla 16. Ganancias en peso de
dos grupos de cerdos alimentados con dos dietas diferentes
Dieta A
|
31
|
34
|
29
|
26
|
32
|
35
|
38
|
34
|
30
|
29
|
32
|
31
|
Dieta B
|
26
|
24
|
28
|
29
|
30
|
29
|
32
|
26
|
31
|
29
|
32
|
28
|
a. Determine si hay diferencia en la ganancia de peso de los dos grupos de
cerdos
b. Determine si los datos pueden considerarse distribuidos normalmente.
c. Establezca si se puede afirmar que las varianzas para ambas dietas son
iguales con un nivel de confianza del 95%.
Respuestas:
a. El vapor-P
arrojó como resultado
con un nivel de confianza del 95%, esto
indica que hay diferencias estadísticamente significativas entre las
dos dietas para la ganancia de peso de los dos grupos de cerdos.
b.
Figura 11. Grafico de probabilidad normal para la dieta
A
Figura 12. Grafico de probabilidad normal para la dieta
B
Las figuras anteriores muestran la
distribución de los datos de las ganancias en peso de dos grupos de cerdos usando
las dietas A y B. Estos datos no se encuentran dispersos, además se ajustan en
un línea recta, se concluye que los datos fueron distribuidos normalmente para
cada dieta.
c.
El intervalo
de confianza para la razón de varianzas con un nivel de confianza del 95% es
, puesto que este intervalo contiene el valor
de 1, se concluye que no hay diferencias estadísticamente significativas entre
las desviaciones estándar de la ganancia de peso de los dos grupos de cerdos.
9. Comparamos 4 tratamientos clínicos (A, B, C,
D) asignando al azar 15 sujetos a los mismos. Las puntuaciones de los sujetos
en la VD (un cuestionario de escala de 0 a 150 puntos) fueron:
Tabla 17. Puntuaciones de
cuatro tratamientos clínicos
A
|
42
|
0
|
63
|
|
B
|
45
|
64
|
33
|
29
|
C
|
44
|
82
|
64
|
74
|
D
|
109
|
120
|
116
|
97
|
a. Compara
si las varianzas de los 4 grupos son similares
b. Analiza
si hay diferencias entre los grupos
c. ¿Cuál es
el grupo que rinde mejor? ¿Y el peor?
Respuestas:
a. Puesto que el valor-P es
de acuerdo a la varianza, se concluye que las
desviaciones estándar para los cuatro tratamientos son las mismas, con un nivel
del 95.0% de confianza.
b. El valor-P es
según las medias de los grupos, esto quiere
decir que existe una diferencia estadísticamente significativa entre la media de
la puntuación de un tratamiento y otro, con un nivel del 95.0% de confianza
Figura 13. Puntuación de los diferentes tratamientos
El mejor tratamiento clínico fue el D, que
obtuvo la más alta puntuación, y el que menos calificación tuvo o el peor
tratamiento fue el A, con un nivel de confianza del 95%
10. Comparamos dos muestras aleatorias de 10
hombres y de 10 mujeres de edades comprendidas entre los 18 a 22 años en un
ítem que mide su autoestima (escala de 0 a 10 puntos).
a.
¿Podemos afirmar que ambas muestras
difieren significativamente en autoestima?
b.
¿Podemos afirmar que la autoestima de
los hombres es significativamente mayor que la de las mujeres?
Tabla 18. Autoestima según el
género
Hombres
|
8
|
7
|
6
|
8
|
7
|
5
|
6
|
4
|
9
|
9
|
Mujeres
|
8
|
6
|
5
|
6
|
5
|
4
|
4
|
4
|
6
|
4
|
Respuestas:
a. El valor-P
es
con un nivel
de confianza del 95.0%, este valor quiere decir que hay
diferencias estadísticamente significativas entre las
medias del autoestima de los hombres y las mujeres.
b. La autoestima de los hombres es mayor que la de las
mujeres, el promedio de autoestima de los hombres es 6.9 y el de las mujeres
5.2.
no se ve el valor de P :(
ResponderBorrarpodrian ayudarme con el ejercicio 4 porfa
ResponderBorrar