RESOLVIENDO PROBLEMAS DE BIG DATA
RESOLVIENDO PROBLEMAS DE BIG DATA
ISBN 978-607-538-480-1
Autores:
Francisco Mochón Morcillo
Juan Carlos Gonzálvez
Alejandro Baldominos Gómez
Teófilo Redondo Pastor
Argelia Berenice Urbina Nájera
Rosa María Cantón Croda
Damián Emilio Gibaja Romero
Clara Ramón Lozano
Edición 2020, en Rústica
176 páginas
Idioma: Español
17x23 cm.
Nivel: Intermedio - Avanzado
Área: Computación
Subárea: Nuevas tecnologías
En este libro, se introduce al lector en el uso de algunas de estas herramientas. No se trabajará con volúmenes de datos especialmente grandes, ya que se emplearán herramientas que disponen de una capa gratuita, es decir, que el lector no deberá incurrir en costes, y generalmente esta capa gratuita impone una limitación en el tamaño de los datos a usar o en el tiempo de procesamiento.
No es el objetivo de este libro proporcionar un profundo conocimiento sobre Big Data, sino por el contrario dotar al lector de un cierto bagaje que le permita identificar algunos problemas frecuentes en Big Data, y proceder a su resolución. Es por tanto, un recurso ideal para aquellas personas que no deseen ejercer una profesión técnica especializada en el manejo de datos, sino adquirir cierta capacitación para comunicarse con un equipo técnico y así prototipar soluciones simplificadas a problemas reales.
Autor/es
Alejandro Baldominos es Doctor en Ciencia y Tecnología Informática por la Universidad Carlos III de Madrid (España), donde trabaja como investigador en el grupo de computación evolutiva, redes de neuronas e inteligencia artificial (EVANNAI). Su trayectoria investigadora está centrada en las aplicaciones de inteligencia artificial, habiendo publicado diversos artículos en revistas de reconocido prestigio y conferencias internacionales. En el año 2016, completó una estancia de investigación en el Computer Science and Artificial Intelligence Lab del MIT. Además, ha impartido docencia en diferentes asignaturas relacionadas con la programación de ordenadores, la ciencia de datos y la inteligencia artificial
Juan Carlos Gonzálvez Cabañas es Licenciado en Ciencias Químicas por la Universidad Autónoma de Madrid (UAM) y posee un MBA por el Instituto de Empresa (IE) Business School. Ha desempeñado distintos cargos directivos en empresas de ámbito internacional, en los sectores TMT (tecnología, media y telecomunicaciones) y entretenimiento (Internet, Juegos y Animación). Ha liderado y participado en la elaboración, diseño, desarrollo e implantación de productos y servicios de base tecnológica en los que uno de sus principales activos son los datos y su tratamiento inteligente para el negocio.
Francisco Mochón. Doctor en Economía por la Universidad Autónoma de Madrid y PhD en Economía por Indiana University (Becado Fulbright). Actualmente es catedrático de Análisis Económico de la UNED. Ha sido asesor del Ministerio de Economía y Hacienda de España, Director General de Política Financiera de la Junta de Andalucía, CEO de la empresa de investigación ESECA y Director General de Finanzas (CFO) del Grupo Telefónica. Ha sido Presidente del Consejo Social de la Universidad de Málaga y miembro del comité asesor de la U-TAD. Es patrono de la Fundación de software libre (FIDESOL). Ha publicado numerosos artículos de investigación y es autor de más de cincuenta libros sobre economía, finanzas y negocios. Desde hace unos años su investigación se ha centrado en dos campos: la economía digital y la economía de la felicidad en el entorno empresarial; habiendo publicado diverso artículos y libros en ambos campos. Ha sido el director del curso MOOC "Felicidad y Práctica empresarial".
Teófilo Redondo (Master en Lingüística Computacional – 1986, por la Universidad Complutense de Madrid - UCM) es consultor especializado en gestión de la Innovación en Ayming Consulting. Anteriormente fue Coordinador Tecnológico de Proyectos de Investigación en Zed Worldwide; Arquitecto de Tecnología y de Proyectos de Innovación en la Universidad Internacional de La Rioja (UNIR), donde también desarrolló actividad docente en el Master eLearning y Redes Sociales. Previamente desarrolló su carrera profesional en IBM cubriendo áreas como Computación en la Nube y Arquitecturas para Big Data, Soluciones de Arquitectura Empresarial (SAP, Oracle Solutions, Dassault Systemes) y Arquitecto SOA. Comenzó en la División de Investigación de IBM, en el Centro Científico UAM-IBM, con varios proyectos de Traducción Automática. Fue Visiting Scholar en la Universidad de Stanford (1987 – Linguistic Institute).
Argelia Berenice Urbina Nájera. Tiene el grado de Doctora en Planeación Estratégica y Dirección de Tecnología por la Universidad Popular Autónoma del Estado de Puebla (UPAEP), el grado de Maestra en Ciencias en Ingeniería de la Computación por la Universidad Autónoma de Tlaxcala, el grado de Maestra en Ciencias de la Educación por el Instituto de Estudios Universitarios y la Licenciatura en Ciencias de la Computación por la Benemérita Universidad Autónoma de Puebla. Pertenece al Sistema Nacional de Investigadores en el nivel Candidato. Sus líneas de investigación se enfocan en la tecnología educativa y la aplicación de aprendizaje automático en el ámbito educativo, salud y negocios. Actualmente es Profesora de Tiempo Completo de la Maestría en Ciencia de Datos e Inteligencia de Negocios ofertada por UPAEP.
Rosa María Cantón Croda. Doctora en Ciencias Computacionales por el Tecnológico de Monterrey, Ciudad de México, Maestra en Tecnologías de Información y Licenciada en Sistemas Computacionales Administrativos, ambas por el Tecnológico de Monterrey, Campus Monterrey. Ha desempeñado puesto como Controladora de Gestión de Procesos y Gerente de Sistemas en empresas de diversos giros. Cuenta con una amplia experiencia en el ámbito académico tanto en el Tecnológico de Monterrey, la Universidad Tecmilenio y actualmente, Decana de Posgrados de Ingenierías y Negocios en UPAEP. Ha escrito para congresos nacionales e internacionales, así como artículos en revistas arbitradas, capítulos de libro, reportes técnicos para diversas empresas en el área de Sistemas de Información y ha sido parte del comité de revisores de congresos. Tiene una amplia experiencia docente en el área de Bases de Datos, Administración de Proyectos y Sistemas de Información, labor por la que ha sido reconocida en varias ocasiones. Está certifica en PMBoK por Itera, en Psicología Positiva por la Universidad Tecmilenio, en Aprendizaje Basado en Proyectos por la Universidad de Aalborg en Dinamarca y en Ciencia de Datos por la Universidad de California en San Diego. Actualmente su línea de investigación es Ciencia de Datos e Inteligencia de Negocios.
Damián Emilio Gibaja Romero, es licenciado en Matemáticas por la Universidad Autónoma del Estado de México, Maestro y Doctor en Economía por El Colegio de México. Realizó estancias de investigación en la Universidad de Glasgow y en la Escuela de Economía de París. Ha participado en congresos nacionales e internacionales como la 25th Summer School in Economic Theory en la Universidad Hebrea de Jerusalén. La International Federation Operational Research Conference organizado por la Universidad de Quebec, y las Jornadas Latinoamericanas de Teoría de Económica en el Centro de Investigación en Matemáticas. Ha impartido clases en El Colegio de México y el Centro de Investigación y Docencia Económicas. Su línea de investigación es en Teoría Microeconómica, Diseño de Mecanismos (matching), Economía Matemática y Teoría de Juegos. Forma parte del claustro de profesores de los posgrados en Ingenierías y Negocios, donde actualmente se desempeña como director académico de matemáticas. Ha publicado artículos sobre la existencia y unicidad de soluciones en problemas estratégicos, y su aplicación en el diseño de mecanismos para la búsqueda de soluciones eficientes y justas.
Clara Ramón Lozano es Ingeniera Biomédica por la Universidad Carlos III de Madrid (España), y actualmente está cursando un Máster en Ingeniería Biomecánica por l'École Polytechnique (Francia). Es fundadora de CEEIBIS, el Consejo Estatal de Estudiantes de Ingeniería Biomédica e Ingeniería de la Salud, y ha publicado artículos en revistas científicas de prestigio y conferencias internacionales, algunos de ellos orientados a la aplicación de inteligencia artificial al dominio biomédico. En 2017 fue premiada en el Certamen Universitario Arquímedes por su trayectoria de joven investigadora.
Contenido
Capítulo 1
La generalización del Big Data en las organizaciones 1
1.1 Introducción 1
1.2 Los datos y la toma de decisiones 1
1.3 ¿Qué es Big Data? 1
1.4 Fuentes de Big Data 1
1.5 Big Data, una forma inteligente de desvelar el conocimiento oculto tras los datos 1
1.6 ¿Quién utiliza Big Data? 1
1.7 El ciclo de vida de los datos 1
1.8 ¿En qué se diferencian las organizaciones que utilizan Big Data? 1
1.9 Big Data y las tecnologías de la información 1
1.10 Reflexiones finales y casos de uso 1
Capítulo 2
Analizando los datos de navegación en un entorno e-commerce usando BigQuery 1
2.1 Introducción 1
2.2 Primeros pasos con BigQuery 1
2.3 Analizando datos procedentes de Google Analytics con BigQuery 1
Capítulo 3
Prediciendo los ingresos anuales de ciudadanos estadounidenses utilizando BigML 1
3.1 Introducción 1
3.2 Funcionamiento del Aprendizaje Supervisado 1
3.3 Aprendizaje Supervisado con BigML 1
3.4 Preparación del conjunto de Datos 1
3.5 Evaluación del modelo 1
3.6 Predicción de nuevas instancias 1
Capítulo 4
Detectando anomalías clínicas sobre diabetes con BigML 1
4.1 Introducción 1
4.2 Conjunto de datos y problema 1
4.3 Filtrado de los datos 1
4.4 Creación del modelo de detección de anomalías 1
4.5 Estimación de anomalías 1
Capítulo 5
Visualización de datos – técnicas y tendencias 1
5.1 Introducción 1
5.2 Tipos de visualización 1
5.3 Visualización de datos: tipos más comunes de presentación 1
5.4 Herramientas 1
5.5 Exploración y representación del conjunto de datos (dataset) 1
Capítulo 6
Visualización de datos acerca de la industria del software en el mercado de México 1
6.1 Introducción 1
6.2 Fundamentos y herramientas de visualización 1
6.3 Diseño de informes 1
6.4 Cuadro de mandos y KPI
6.5 Geolocalización 1
6.6 Anexo: Guía de herramientas para visualización de la industria del software en México 1
Capítulo 7
Visualización del consumo de carne con Google Data Studio 1
7.1 Introducción 1
7.2 Conjunto de datos 1
7.3 Google Data Studio 1
7.4 Conexión con la fuente de datos 1
7.5 Creación de un gráfico geográfico 1
7.6 Creación de filtros interactivos 1
7.7 Visualización del informe 1
7.8 Estilos de gráficos 1
7.9 Informes avanzados 1
Reflexiones finales 1
Novedades en Editoriales Libro%
Motivos
Motivos es el único libro en prosa de José María Eguren. Es una recopilación...
Cuadernos de Vorónezh
Este libro es un milagro, y también el último escrito por Ósip Mandelstam, uno de los...
Nomadismo por mi país
Nomadismo por mi país es el diario de los talleres de poesía de Cecilia Pavón...
Presentación de Rodolfo Fogwill. Una monografía
Presentación de Rodolfo Fogwill. Una monografía es un enorme trabajo crítico...