miércoles, 20 de julio de 2016

De la intuición a la estructura de datos, entrevista con Arup Nanda, DBA de Oracle

Nanda ha sido DBA de Oracle por 22 años. Al inicio trabajó en SQL Forms logrando las mejores calificaciones pero con el tiempo se ocupó también de acreditar y ofrecer pláticas a la comunidad. A la fecha es un gurú tecnológico de Oracle. Ha realizado más de 300 presentaciones en alrededor de 22 países, ha publicado más de 500 artículos y tiene su propio blog. Es autor de seis libros. En 2003 fue reconocido como el DBA del año por Oracle Magazine y en 2012 obtuvo un premio a la excelencia también de Oracle.

Nanda estuvo recientemente en México, y pudimos entrevistarlo en exclusiva para develop Network, aquí su visión tecnológica:

Ignacio Gallegos (IG).— ¿Cuál es el panorama mundial actual para bases de datos?

Arup Nanda (AN).— Las bases de datos continuarán existiendo porque se han vuelto el punto medular de cualquier empresa. Éstas crecerán puesto que el concepto en general está cambiando de la intuición a las organizaciones basadas en las estructuras de datos. Ahora contamos con datos de todo tipo para permitirnos tomar decisiones basados en algo concreto y ese es un gran cambio en el proceso de toma de decisiones en todo el mundo. 

IG.— Hablando del Big Data, ¿cuál es el futuro de las empresas latinoamericanas?

AN.— Pienso que el principal problema para entrar al mundo del Big Data es que la gente no entiende qué es a ciencia cierta.

El Big Data se refiere a grandes cantidades de datos cuyo problema no es la cantidad, sino la variedad de datos que no se puede conocer sino hasta que se generan, por ejemplo: si vamos a recibir los datos del personal, sabemos de antemano que vendrá un nombre, un salario, un identificador, etc. Pero en el Big Data no lo sabemos. Si hablamos de entradas de blog, publicaciones de Facebook o Twitter, no sabemos qué clase de información tendremos, así que debemos crear una estructura en la cual no sea rechazada por la propia base de datos. 

La segunda cuestión es la rapidez, este tipo de respuestas deben ser muy rápidas porque se generan a la misma velocidad, y si esperamos al proceso de estructuración de datos, a la mañana siguiente tendremos más datos que almacenar. 

“El primer problema a solucionar es entender que el Big Data se trata de un ente completamente diferente a las bases de datos tradicionales.”

Pienso que las empresas latinoamericanas tienen una gran ventaja que es el hecho de que comparten el idioma, excepto por Brasil, y eso les da una enorme ventaja para procesar datos. La barrera del idioma se vuelve un enorme obstáculo. Aquellas empresas que tengan a quien conozca el Big Data y domine el idioma español tendrán una enorme ventaja.

IG.— La semana pasada leía un artículo acerca del Small Data. Al parecer aún no comprendemos bien lo que es el Big Data, y ya estamos hablando de Small Data…

AN.— En realidad no existe el Small Data, ese es un término que se ha usado para referirse a una muestra de datos que eventualmente será Big Data; es como cuando tienes que descargar muchos tráilers en tu bodega y decides descargar todo, colocarlo en un sólo lugar para luego analizarlo y saber a qué almacén pertenece. El problema es que esto constituye un problema en sí, pues la gente no sabe bien a bien qué es el Big Data y trata de crear una subclasificación para poderlo manejar. Pero como con cualquier otra tecnología, el Big Data es muy reciente y necesita tiempo para madurar y perfeccionarse.

IG.— Hace 10 años hablábamos de inteligencia de negocios pero no todas las empresas lo necesitaban. De manera similar, ¿el Big Data es para todos?

AN.— Por supuesto que no es para todos. Es muy importante entender para qué es el Big Data y para qué no es. Pensemos en el mercado bursátil. ¿Tendríamos un enfoque de Big Data? No, porque por definición, el Big Data no tiene una estructura particular en ningún punto en el tiempo aunque eventualmente se vuelve consistente. Por ejemplo: tratas de conocer cuánta gente le ha dado ‘me gusta’ a una publicación. Si eres una compañía, probablemente tengas millones de seguidores por lo que necesitarás correr un proceso en lote para saber exactamente cuántos ‘me gusta’ y ‘no me gusta’ tienes, si interrumpes el proceso a la mitad vas a tener información errónea, por el contrario, regresando al ejemplo del mercado bursátil, siempre tienes datos objetivos en una muestra parcial. Esa es la principal diferencia entre las bases relacionales y las bases para Big Data.

IG.— ¿Entonces el Big Data no es más complicado que lo que leemos todos los días?

AN.— Totalmente. Si lo piensa, el concepto en sí ha estado presente desde hace mucho. Básicamente es tener múltiples computadoras, leer la información en paralelo y presentarla de manera conjunta; podemos decir que no es un concepto revolucionario. 

El Internet de las cosas, ¿un reto de almacenamiento o procesamiento?

Al preguntarle acerca del reto en almacenamiento que requieren los equipos en la era del Internet de las cosas, nos explica cuál es el panorama real:

“Oracle tiene varias soluciones, pero el verdadero reto es qué clase de almacenamiento se requiere en cada caso porque en la mayoría no se requiere procesamiento sino almacenamiento, lo cual puede resultar más barato. La propuesta de Oracle es contar con un arquitecto que tenga bien claro el problema para decidir el curso de acción, específicamente que conozca la naturaleza del problema porque si esto no se tiene claro, muy fácilmente se puede volver una situación innecesariamente compleja.”

La Nube, un desafío de seguridad y desempeño

IG.— Finalmente, ¿qué sigue para la Nube de Oracle?

AN.— Las empresas no quieren invertir en la infraestructura requerida para manejar toda su información, por lo que la Nube continuará existiendo, lo cual nos enfrenta a dos retos. El primero, el desempeño, pues la naturaleza de la Nube es que la información esté diseminada en varias computadoras; el segundo, la seguridad, si un proveedor de servicios de Nube no se hiciera responsables por esta seguridad, nadie contrataría sus servicios. 
jighInfo-Oracle