Survey
* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project
* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project
MIS TEMA - 4 BASE DE DATOS SICI-3211 22/05/2017 Dr. Nelliud D. Torres Batista http://classes.uleth.ca/201401/mgt3061a/ 1 Objetivos del Capítulo • Definición de Base de Datos • Componentes de un Sistema Manejador de Bases de Datos (DBMS) • Modelos de Bases de Datos • Diseño de Base de Datos • Data Warehouse / Data Mart / Data Minning 22/05/2017 2 Definición de Base de Datos 22/05/2017 Pag: 43 3 MBNA Managing data and information • Usualmente las organizaciones generan muchos datos constantemente • ¿Cómo una organización organiza todos sus datos y la información que genera? – Base de Datos – Una Colección de archivos integrados y relacionados entre si. Ejemplos: • • • • Ebay Proquest Facebook Gmail 4 What is Database Technology ? • Una colección de datos relacionados organizado de tal forma que los hace valioso y útil. • Permite a las organizaciones recuperar (retrieve), almacenar (store) y analizar la información fácilmente. • Es vital para el éxito de una organización para ejecutar operación es y tomar decisiones. 3-5 The Hierarchy of Data 6 Types of Data in a Database • Datos Internos (Internal data) – Son los datos que se colectan (generan) dentro de la misma organización • Datos Externos (External data) – Posibles fuentes de datos externos: • • • • • • • Competitors, customers, and suppliers Distribution networks Economic Government regulations Labor and population statistics Tax records functional information systems Databases • Las Bases de Datos son componentes críticos de los Sistemas de Información. – Cualquier tipo de análisis que se hace en una organización, se basa en datos disponibles de la base de datos. • Database Management System (DBMS) – Conjunto de programas que permiten crear, almacenar, mantener y acceder archivos de la base de datos • Esto ofrece una ventaja sobre los antiguos sistemas de archivos (flat files). • Enfoque Tradicional Vs Enfoque de Base de Datos The Traditional Approach Payroll Grades Student Tuition Grades Student Tuition Parking Parking The Traditional Approach to Data Management - Archivos Secuenciales, 9 Relativos e Indexados The Database Approach Payroll Grades Payroll Grades Tuition Database management system Tuition Parking Parking The Database Approach to Data Management - Combina automáticamente el uso de los archivos secuenciales, indexados y 10 relativos. Advantages of the Database Approach 3-11 Advantages of the Database Approach (Cont.) 3-12 Componentes de un Sistema Manejador de Bases de Datos (DBMS) 22/05/2017 Pag: 50 13 Exhibit 3.2 Interaction between the user, DBMC, and Database Components of a DBMS • • • • • Database engine Data definition Data manipulation Application generation Data administration • En los próximos slides explicamos cada uno de estos conceptos. Database Engine • Es el corazón del software del DBMS • Responsable del almacenamiento , manipulación y recuperación de los datos • Convierte consultas (requests) de los usuarios en su equivalente físico. • En otra palabras capacita al os usuarios a poder examinar los datos de una forma fácil y rápida. Data Definition • Crea y mantiene el diccionario de datos de la base de datos • Define la estructura de archivos en una base de datos – Adding fields – Deleting fields – Changing field size – Changing data type Data Manipulation • Es el encargado de añadir, eliminar, modificar y recuperar records de una Base de Datos. • Query language – Structured Query Language (SQL) • Standard fourth-generation query language • Se utiliza en muchos DBMS packages • Utiliza un enunciado (statement) SELECT – Query by example (QBE) • Construye enunciados a través de una forma • Utiliza una interfaz gráfica Application Generation • Herramienta que permite diseñar elementos de una aplicación basándose en una Base de Datos – Data entry screens – Interactive menus – Interfaces with other programming languages • Muchas de estas aplicaciones son fáciles y rápidas para el diseño y creación de aplicaciones. • Se utilizan mucho para crear prototipos. Data Administration • Se utiliza para: – Backup and recovery (resguardo y recuperación) – Security – Change management • Create, read, update, and delete (CRUD) • Tablas y atributos • Database administrator (DBA) – Posición que se responsabiliza en administrar la base de datos. – Esto incluye crear cuentas, accesos a la base de datos, modificar las tablas y/o atributos, etc. – Se puede administrar a nivel Individual o por departamento Modelos de Base de Datos 22/05/2017 Pag: 47 21 GENERACIONES • First-generation – Hierarchical and Network • Second generation – Relational • Third generation – Object-Relational – Object-Oriented Modelo Jerárquico (Hierarchical) • Las Bases de Datos tienen sus raíces en los años 60. • En aquel tiempo no había un sistema capaz de manejar grandes B cantidades de datos que el proyecto iba a generar. F • Su estructura lógica básica se visualiza como un árbol (tree) al revés. A C D G H E Modelo Jerárquico • La estructura del modelo jerárquico contiene niveles o segmentos. • Mantiene un conjunto de relaciones de uno a muchos entre un segmento padre y sus segmentos hijos. – Cada padre puede tener muchos hijos. – Cada hijo sólo puede tener un padre. Modelo Jerárquico (Diagrama) Modelo de Red (NetWork) • Creado para: – Representar relaciones de datos complejas más efectivamente que puedan manejar diseñados en estructuras jerárquicas. H – Mejora el rendimiento de la Base de Datos. – Impuso un estándar. D A E B F G C Modelo de Red (Diagrama) Modelo Relacional • Desarrollado por E. F. Codd (IBM) en 1970. • Se consideró ingenioso, pero poco práctico en el 1970. • Conceptualmente es un modelo simple. Empleado • Las computadoras de esa Id época carecían de la Nombre capacidad para poder Depto implementar ese modelo. Tipo • Hoy día no aplican estas limitaciones. Departamento Numero Descripción Edificio Tipo Clasificación Descripción Status Asalariado El Modelo Entidad-Relación • Herramienta ampliamente aceptada y adaptada a formato gráfico para el diseño de la Base de Datos. • Fue introducido por Chen en 1976 • Representación gráfica de entidades y sus relaciones en una estructura de Base de Datos. • Esto simplifica el diseño de la Base de Datos. • Este sigue siendo el estándar en el Diseño y manejo de las Bases de Datos actuales. Modelo Relacional (Diagrama) Primary Key (PK) La relación se establece relacionando el campo clave (PK) de una tabla con el campo foráneo (FK) en la otra tabla. Foreing Key (FK) The Relational Model • Relational model – Uses a two-dimensional table of rows and columns of data • Data dictionary – Field name – Field data type – Default value – Validation rule The Relational Model Example 3-32 The Relational Model • Data retrieval – Select – Project – Join – Intersection – Union – Difference The Relational Model Modelo Orientado a Objetos • Se modela tanto los datos como sus relaciones en una estructura sencilla conocida como objeto. • Object-Oriented data model (OODM) es la base para el object-oriented database management system (OODBMS) • OODM se conoce como el modelo de datos semántico (semantic data model) OTROS MODELOS • Extended Relational Data Model (ERDM) – Modelos de datos semánticos desarrollados en respuesta a la creciente complejidad de las aplicaciones. – Con frecuencia se les conoce como (Object/relational database management system ORDBMS) – Su principal propósito es para aplicaciones de negocios. RESUMEN DE LOS MODELOS Bases de Datos Orientados al Web • Proveen una ventaja competitiva a la compañía y la expone a nivel global. • Se utilizan en el comercio electrónico. • Algunos ejemplos de compañías que trabajan electrónicamente por Internet son Ebay y Amazon, etc. • Las redes sociales no podrían existir sin el componente de las Bases de Datos. • Las aplicaciones Web tienen mucho auge y es un tema importante que no se puede ignorar dentro del campo de las Bases de Datos. EVOLUCIÓN DE LAS BASES DE DATOS Diseño de Base de Datos 22/05/2017 Pag: 46 40 Logical Database Design • Physical view – Detalla cómo los datos se almacenan y se recuperan de una medio físico • Logical view – Muestra la forma en que la información se le muestra a los usuarios – Enfoca en cómo los datos están organizados y como se recuperan – Puede haber más de una forma lógica de ver los datos Logical Database Design (cont’d.) • Data model – Determina como los datos se crean, representan y organizan. – Incluye: • Data structure • Operations • Integrity rules BASE DE DATOS - Componentes • Entidades – Algo importante que deseamos almacenar. Por ejemplo: Una persona, evento, lugar, categoría o cualquier otra cosa que se le pueda nombrar. • Atributos – Datos que describen a la entidad y por lo tanto necesitamos almacenarlas. • Relaciones – Define como las entidades se relacionan entre si. ENTIDADES ENTIDADES Una ENTIDAD representa una persona, lugar, objeto , evento o concepto dentro del ambiente de Sistemas de información. Por lo tanto a cada entidad se le asigna un nombre propio. Deseamos guardar datos dentro de una entidad. A continuación mostramos ejemplos de entidades. EJEMPLO DE ENTIDADES • PERSONA: ESTUDIANTE, EMPLEADO, PACIENTE • LUGAR: ALMACEN, WAREHOUSE, ESTADO, PUEBLO • OBJETO: MAQUINA, EDIFICIO, AUTOMOVIL, LIBRO • EVENTO: VENTA, MATRICULA, RENOVACION, QUEJA, COBRO, PAGO, TRASLADO, TAREA, TRANSFERENCIA, ASIGNACION, CONTACTO • CONCEPTO: CUENTA, CURSO, CENTRO DE TRABAJO UNA ENTIDAD • DEBE SER: – Un objeto que tenga muchas instancias en la Base de Datos. – Un objeto que se componga de múltiples atributos. – Un objeto que se pueda diseñar y representar (model). • NO DEBE SER: – Un usuario del sistema de Base de Datos – Un resultado (output) de la Base de Datos (ejemplo: un reporte) ATRIBUTOS ATRIBUTOS • Attribute – Propiedad o característica de una entidad o de un tipo de relación. El conjunto de atributos de una entidad se le conoce también como una instancia. • Tipos de atributos: (se discuten más adelante) – Required versus Optional Attributes – Simple versus Composite Attribute – Single-Valued versus Multivalued Attribute – Stored versus Derived Attributes – Identifier Attributes EJEMPLOS DE ATRIBUTOS • • • • • • ENTIDAD CLIENTE número nombre dirección teléfono crédito e-mail • • • • • • • ENTIDAD ESTUDIANTE número nombre edad genero departamento igs escuela procedencia ATRIBUTOS - Required versus Optional • Required attribute - Necesita tener un valor por cada instancia que tenga la entidad. – Ej: nombre, género, seguro social, etc. • Optional attribute - No es necesario que toda instancia de una entidad tenga un valor en ese atributo en particular. – Ej: teléfono, celular, etc. ATRIBUTOS - Identifier Attributes • Identifier - Atributo (o combinación de atributos) que distingue cada instancia de la entidad haciéndola única. Debe ser un atributo cuyo valor nunca se repita. • Simple identifier - Su valor no está sub-dividido en más de un atributo. – Ej: Seguro social, número de empleado • Composite identifier - Un identifier que tiene valores de más de un atributo. – Ej: numero de cliente + número de orden Características de los Identifiers (Primary Key) • No cambia de valor. • No puede ser Nulo (null). • No pueden ser “inteligentes”. Por ejemplo no pueden tener valores que puedan cambiar como una dirección, nombre, edad o algún código que represente un valor que sea variable. • Se debe tratar de utilizar identifiers simples (de un solo atributo) siempre que se pueda. • A los identifiers se les conoce también como UID (Unique Identifier) o Primary Key. Ejemplos de UID CLIENTE numero nombre seguro social direccion teléfono credito e-mail ESTADIO (PARQUE) id nombre direccion telefono capacidad sillas capacidad carros El número del cliente es muy buen candidato para un UID ya que su valor es único. El seguro social también podría ser un buen candidato para un UID. (ojo ) En el caso de un estadio, necesitamos crear un atributo artificial que posea un valor único para que identifique cada instancia de la entidad. RELACIONES LAS RELACIONES • Son asociaciones bidireccionales (en ambas direcciones) e imprescindibles entre dos o tres entidades o entre una entidad y ella misma. • La relación entre las entidades tiene lo que se conoce como grado o Degree. DEGREE OF RELATIONSHIPS • Indica el número de tipos de entidades que participan en la relación –Unary Relationship - Entre la misma entidad. –Binary Relationship - Entre dos entidades. –Ternary Relationship - Entre tres entidades. DEGREE OF RELATIONSHIPS One entity related to another of the same entity type Entities of two different types related to each other Entities of three different types related to each other OTRO EJEMPLO DEL GRADO DE RELACIONES TIPOS DE RELACIONES • One-to-One (uno a uno) – Cada entidad en la relación va a tener exactamente una relación en sus instancias. • One-to-Many (uno a muchos) – La entidad de una parte tiene relación con muchas instancias de la otra entidad, pero cada instancia de la otra entidad sólo puede tener relación con una instancia de la primera entidad. • Many-to-Many (muchos a muchos) – En ambas entidades en la relación, existen relaciones de muchos a muchos. UNO A UNO - EJEMPLOS EMPLEADO emp_numero_pk emp_nombre emp_fecha_naci miento posee 1 ESTACIONAMI ENTO estár asignado est_numero 1 est_descripcion emp_numero_fk UNO A MUCHOS - EJEMPLOS DEPARTAMENTO habitado por dep_id_pk dep_localización dep_descripción 1 EMPLEADO emp_numero_p estar asignado k M emp_nombre emp_seguro ∞ social MUCHOS A MUCHOS - EJEMPLOS ESTUDIANTE est_numero_pk est_nombre est_seguro_social CURSO tomar M ∞ tomado por M ∞ cur_código_pk cur_semestre cur_descripción Ejemplo Diseño de una Base de Datos Utilizando ACCESS Data Warehouse / Data Mart / Data Minning 22/05/2017 Pag: 54 66 Data Warehouses, Data Marts, and Data Mining • Data warehouse: Colecciona información de los negocios utilizando muchas fuentes de la empresa, no solamente la base de datos. • Data mart: Un subconjunto (subset) de un data warehouse • Data mining: Una herramienta para analizar la información con el propósito de buscar patrones en los datos que pueda servir a la empresa a obtener ventaja competitiva. Utiliza datos de un data warehouse o de un data mart. • Online Analytical Processing – Herramientas gráficas hechas por sofware que proveen un análisis complejo de los datos que se almacenan en una base de datos. 67 Data Warehouses • Data warehouse – Colección de datos que se utiliza para dar apoyo a la toma de decisiones gerenciales y para generar BI (business intelligence). • Los datos en un DW (Data Warehouse) se almacena utilizando la misma tecnología del modelo relacional de bases de datos. • Un DW puede almacenar y comparar multidimensional data. • De ahí viene el concepto de hypercubers que permite analizar tres tipos de datos. Ejemplo: Ventas, Tiendas, Meses (Dinero vs Lugar demográfico vs Tiempo) Exhibit 3.9 A Data Warehouse Configuration Exhibit 3.10 • Data warehouses are not transactionoriented. • Data warehouses support online analytical processing (OLAP). Slicing and Dicing Data Business Intelligence • Business Intelligence (BI) – Colección de Herramientas que le permite a la gerencia tomar las mejores decisiones en la toma de decisiones. – Utiliza los Data warehouse, Data minning, Base de datos, Programación Web, interfaces gráficas y otras herramientas que facilitan mostrar datos y conceptos complejos de una forma simple a la gerencia. – Más adelante se va a explicar este concepto con más detalles BI in Action: Law Enforcement • Ejemplo de un uso actual de Business intelligence (BI) – Used in law enforcement as well as in the business world • Richmond, Virginia – System generates BI reports that help pinpoint crime patterns – Allocate manpower to days and locations where crime likely to occur A not so perfect match A not so perfect match • With the increasing power of Data mining techniques, comes ever increasing and reaching uses of this powerful technology. • 1. What are the benefits of DNA databases? • 2. What problems do DNA databases pose? • 3. Who should be included in a national DNA database? Should it be limited to convicted felons? • 4. Who should be able to use DNA databases? FIN 22/05/2017 74