El almacenamiento en entornos virtuales: La capacidad NO es la clave
Hola amig@s:
El artículo de hoy no va a ser un paso a paso que explique cómo realizar una tarea concreta. En esta ocasión intentaré que reflexionéis si las decisiones que tomáis para diseñar vuestro almacenamiento son las adecuadas.

A día de hoy aún resulta difícil hacerle ver a la compañía que va a explotar su infraestructura virtual la importancia del almacenamiento. En gran medida la culpa es de la persona que diseña (el comercial NO diseña) la solución a implantar. ¿Por qué digo esto?
Vendemos el almacenamiento como si de un contenedor de GRAN tamaño se tratase: cuánto más PETABYTES le venda más contento estará, ya que más máquinas virtuales puede alojar.
El primer paso que demos ha de ser el de transmitir a la compañía la importancia que ha adquirido el almacenamiento en una infraestructura virtual, ya que todas sus máquinas virtuales se alojarán ahí. En una infraestructura descentralizada de servidores físicos en la cual cada uno tiene su propio almacenamiento un fallo SÓLO afecta a ese servidor, pero en el caso de una infraestructura virtual si el almacenamiento falla la compañía se queda PARADA.
Ahora que todas las partes son conscientes de la criticidad de este componente, nuestro diseño debe cumplir con los requisitos de disponibilidad que la compañía nos marque. De todos modos debemos evitar los puntos únicos de fallo, de nada sirve vender HA si luego tenemos una sola fuente de alimentación. En estos requisitos de disponibilidad podemos contemplar las siguientes técnicas:
- Redundar las SPs (controladoras de almacenamiento) y las fuentes de alimentación.
- Usar RAIDs que proporcionen redundancia: RAID 1/10/5/6.
- Usar discos Hot Spare (discos de reserva) para tener una mayor ventana de reemplazo.
- Usar sitios secundarios para replicación (si el presupuesto lo permite).
Teniendo en mente las opciones anteriores, el siguiente paso es calcular el RENDIMIENTO que ha de cumplir nuestro almacenamiento para soportar las IOPs de las máquinas virtuales. En servidores de bases de datos SQL, Oracle y de correo Exchange 2003/2007 así como entornos VDIs este aspecto es fundamental para contar con el éxito asegurado en el diseño.
En la misma infraestructura descentralizada de la cual hablábamos anteriormente cada servidor podía tener como mínimo un RAID1, el cual proporciona unas 270 IOPs. Cuando se necesitaba más rendimiento se montaba otro servidor y esta era la forma de escalar. Las IOPs no van en concordancia con la capacidad del disco, sino con la latencia media de rotación y el tiempo medio de búsqueda tanto para lectura como escritura. Para entender mejor que rendimiento y capacidad no van de la mano vamos a poner un ejemplo.
Imaginad que tenéis 3 servidores físicos y que cada uno cuenta con 150GB en RAID1. Queremos convertir la infraestructura física a virtual y la cuenta más rápida sería: 3 SERVIDORES x 150GB CADA UNO = 450GB EN TOTAL. Por lo que pensaríamos que con 2 HDs de 600GB en RAID1 ya tenemos almacenamiento suficiente para alojar los 3 servidores.
Como habréis observado hemos obviado por completo las IOPs en nuestros cálculos. Tal vez pueda parecer absurdo el que se nos olvide o no las tengamos en cuenta, pero ... ¿cuántos habéis hecho el mismo cálculo que acabamos de hacer? Es importante que siempre tengáis ese valor en cuenta. Para conseguir el mismo número de IOPs que el entorno físico (810 IOPs) necesitaríamos 6 HDs y para igualar el almacenamiento que fueran de 173GB.
A continuación se muestra una tabla con las IOPs de disco aproximadas, así como las penalizaciones de los diferentes RAIDs y cómo calcularlos:


Para calcular la penalización del RAID hay que sumar la capacidad RAW IOPs de todos los discos y dividirla por la suma de la penalización por el porcentaje de escritura con el porcentaje de lectura.
RAW IOPs / [(PENALIZACIÓN x (%ESCRITURA/100)) + (%LECTURA/100)]
Por ejemplo un RAID1 de 2 HDs 15K a 70% lectura y 30% escritura sería:
180+180 / [(2 x (30/100)) + (70/100)] = 360 / (0,6 + 0,7) = 277
En resumen, como habréis podido comprobar el cálculo de las IOPs es un factor muy importante a la hora de diseñar nuestra red SAN para nuestra infraestructura virtual. Se puede conseguir un mayor número de IOPs con menos discos o viceversa, por lo que siempre es importante realizar estos cálculos para asegurar el rendimiento y escalabilidad de la solución sobre todo en diseños de VDI.
Google+








enviando...
Un post muy completo. Nosotros también hemos hablado de esto en nuestro technosite.
Te paso un post en el que explicamos una solución de almacenamiento realmente útil.
http://www.netgeartechnosite.com/?p=164
¡Esperamos tu visita y opinión como experto!
Un saludo
Hola Netgear:
Muchas gracias por el comentario. No dudes que hoy me pasaré por vuestro artículo y os dejaré feedback.
Un saludo.
Querido amigo, muy buen post, claro y al grano.
Si puedo aportar algo, me gustaria enfatizar algo que ya apuntas ya que estamos de reflexión, y esto es importante. Curiosamente si tenemos mas discos pequeños que grandes, el rendimiento será mayor tan sólo por el numero de brazos que están atacando los cilindros (disperasamos el trabajo). Aqui de nuevo no es importante la capacidad total sino “como esta cocinado el pastel”. También es importante usar los RAID que nos aconseje el fabricante segun bandejas y depende si vamos a usar esos volumenes para Servidores de un acceso mas secuencial o un acceso aleatorio.
Otro tema es el acceso a nuestra SAN.
* Tenemos un acceso DAS (Direct Attachment), pues sobre todo que la controladora sea “potente” y que tenga doble acceso.
* Si tenemos iSCSI, por favor, cuidado con los switches de acceso a SAN. No me pongan switches de 200€. Cuidado con el throughput, las vlan y la gestion es quizas secundario.
* Fibra. He visto alguna instalacion donde por poner FC han puesto un solo HBA en los hosts/cabina y un solo Switch de FC (claro, es muy caro). Evitemos los SPOF (Single Point Of Failure).
@ Netgear Mi experiencia con este ReadyNAS es buena y me ha funciona bien y a buen rendimiento, pero en su segmento de NAS para SOHO o SMB.
Un saludo
Buenas tardes caballero:
Todo un halago cuando esas palabras llegan de un profesional de pies a cabeza como tú.
Totalmente de acuerdo en todo lo que expones. Ahora veremos con casi total certeza proliferar los discos SSD en los array y tal vez sin necesidad alguna. Ocurrirá como con FC, le vendo esto al cliente porque no voy a tener problemas de rendimiento; y a lo mejor el cliente con iSCSI o NFS va que se mata y le estamos haciendo que se gaste un dinero innecesario por no hacer un buen análisis de su infraestructura.
Sobre el SPOF lo he visto cientos de veces. Le vendieron al cliente la panacea con la FO y luego ves lugares donde se obvian los switches FC porque son muy caros o le pusieron 2 Gbps que para el caso iSCSI sigue plantando cara. Buscan tener redundancia pero siempre se olvidan de sacar fuera del CPD una copia asíncrona de su almacenamiento, con lo fácil que resulta hoy en día con productos como Veeam con su Replication incluido y que puede salvar en más de una ocasión.
Saludos.
P,habernos matao ;)