(Parte 1 de 10)

Tópicos Abordados:

Ä Conceito sobre Banco de Dados e SGBD’s Arquiteturas Modelos de Dados Tipos de Softwares Gerenciadores de B. D.

AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

Introdução03
1.0 – Banco de Dados04
2.0 – Sistema Gerenciador de Banco de Dados04
2.1 – Modelo de Dados05
2.2 – Tipos de Arquiteturas07
2.3 – Capacidades do SGBD08
3.0 – Arquiteturas de Banco de Dados09
3.1 – Aspectos Relevantes10
3.2 – Vantagens dos Bancos de Dados1
3.3 – Linguagens de Base de Dados12
4.0 – O que é Modelo de Dados?12
4.1 – Modelo Entidade Relacionamento12
4.2 – Entidades e Atributos12
4.2.1 – Tipos de Atributos13
4.3 – Relacionamentos15
4.4 – Entidade Fraca19
4.5 – Modelo de Entidade Relacionamento Extendido20
4.5.1 – Especialização e Generalização20
4.6 – Operações2
5.0 – Tipos de Sistemas Gerenciadores de Banco de Dados23
5.1 – dBase23
5.2 – MySQL25
5.3 – PostgreSQL29
5.4 – Oracle31
5.5 - Microsoft SQL Server31
5.6 - Microsoft Access32
5.7 - Data Warehouse34
5.7.1 – Metadado37
5.7.2 - Data Mart38
5.7.3 - Data Mining43
6.0 – Alguns Conceitos Importantes51
7.0 - Conclusão5
8.0 - Bibliografia56

SUMÁRIO AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

Saber o significado de um Banco de Dados e que o SGBD é um sistema que o gerencia não é saber o bastante, pois estamos falando de um grande volume de dados, ou seja, informações que precisam ser armazenadas, acessadas, atualizadas por um indefinido espaço de tempo, dando aos seus usuários agilidade e qualidade de resposta no cruzamento das informações.

Esse armazenamento e gerenciamento surgiram para deixar de lado os primitivos sistemas de arquivos que não conseguiam controlar os inúmeros processos e usuários que faziam uso de seus pequenos recursos.

Atualmente os bancos de dados não impõem limites de armazenamento, em alguns casos não necessita de muito hardware, nos proporciona segurança e até tem capacidade de nos disponibilizar múltiplas visões dos dados.

Esses sistemas gerenciadores de arquivos seja ele “free” (gratuito) ou não, ambos tem capacidade de nos trazer ferramentas necessárias para o gerenciamento de qualquer tipo de informações armazenadas, independente de sua representação ou modelo pelo qual as informações estão estruturadas.

AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

1.0 – Banco de Dados

O que é um Banco de Dados?

O termo Banco de Dados foi criado para indicar coleções organizadas de dados armazenados em computadores digitais; utilizando um conceito, Banco de Dados ou Bases de Dados são conjuntos de dados integrados com uma estrutura que organizam informações. Sendo essas informações utilizadas normalmente para um mesmo fim. Um banco de dados é usualmente mantido e acessado por meio de um software conhecido como SGBD.

Estritamente falado, o termo Banco de Dados deve ser aplicado apenas aos dados, enquanto o termo Sistema Gerenciador de Bancos de Dados deve ser aplicado ao software com a capacidade de manipular bancos de dados de forma geral. Porém, é comum misturar os dois conceitos.

2.0 – Sistema Gerenciador de Banco de Dados

O que éum SGBD?

Um sistema Gerenciador de Banco de Dados ou Sistema Gestor de Base de Dados

(SGBD), é um conjunto de programas responsáveis pelo gerenciamento de uma base de dados. È um sistema extremamente complexo, responsável pela persistência, organização e recuperação dos dados.

Historicamente, o primeiro Sistema Gerenciador de Banco de Dados comercial surgiu no final de 1960 com base nos primitivos sistemas de arquivos disponíveis na época, os quais não controlavam o acesso concorrente por vários usuários ou processos. Os SGBDs evoluíram desses sistemas de arquivos de armazenamento em disco, criando novas estruturas de dados com o objetivo de armazenar informações.

Com o tempo, os SGBD’s passaram a utilizar diferentes formas de representação, ou modelos de dados, para descrever a estrutura das informações contidas em seus bancos de dados.

AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

2.1 - Os modelos de dados mais utilizados pelos SGBD’s são:

Modelo Hierárquico

O modelo hierárquico foi o primeiro a ser reconhecido como um modelo de dados.

Seu desenvolvimento somente foi possível devido à consolidação dos discos de armazenamento endereçáveis, pois esses discos possibilitaram a exploração de sua estrutura de endereçamento físico para viabilizar a representação hierárquica das informações. Nesse modelo de dados, os dados são estruturados em hierarquias ou árvores. Os nós das hierarquias contêm ocorrências de registros, onde cada registro é uma coleção de campos (atributos), cada um contendo apenas uma informação. O registro da hierarquia que precede a outros é o registro-pai, os outros são chamados de registros-filhos.

Modelo em Rede

O modelo em rede surgiu como uma extensão ao modelo hierárquico, eliminando o conceito de hierarquia e permitindo que um mesmo registro estivesse envolvido em várias associações.

Esse modelo permite que várias tabelas sejam usadas simultaneamente através do uso de apontadores (ou referências). Algumas colunas contêm apontadores para outras tabelas ao invés de dados. Assim, as tabelas são ligadas por referências, o que pode ser visto como uma rede.

O gerenciador Data Base Task Group (DBTG) da CODASYL (Committee on Data

Systems and Languages) estabeleceu uma norma para este modelo de banco de dados, com linguagem própria para definição e manipulação de dados. Os dados tinham uma forma limitada de independência física. A única garantia era que o sistema deveria recuperar os dados para as aplicações como se eles estivessem armazenados na maneira indicada nos esquemas. Os geradores de relatórios da CODASYL também definiram sintaxes para dois aspectos chaves dos sistemas gerenciadores de dados: concorrência e segurança. O mecanismo de segurança fornecia uma facilidade na qual parte do banco de dados (ou área) pudesse ser bloqueada para prevenir acessos simultâneos, quando necessário. A sintaxe da segurança permitia que uma senha fosse associada a cada objeto descrito no esquema. Ao contrário do Modelo Hierárquico, em que qualquer acesso aos dados passa pela raiz, o modelo em rede possibilita acesso a qualquer nó da rede sem passar pela raiz. No Modelo em Rede o sistema comercial mais divulgado é o CAIDMS da Computer Associates. O diagrama para representar os conceitos do modelo em redes consiste em dois componentes básicos: Caixas, que correspondem aos registros e Linhas, que correspondem às associações.

Modelo Relacional

O modelo relacional é uma teoria matemática desenvolvida por Edgar Frank Codd que surgiu na década de 1970, para descrever como as bases de dados devem funcionar. Porém, a implementação do modelo exigia pesquisas e só na década de 1980 eles iam começar a ganhar o mercado, se estabilizando totalmente como líder do mercado a partir da década de 1990.

AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

Embora esta teoria seja a base para o software de bases de dados relacionais, muito poucos sistemas de gestão de bases de dados seguem o modelo de forma restrita e todos têm funcionalidades que violam a teoria, desta forma variando a complexidade e o poder. A discussão se esses bancos de dados merecem ser chamados de relacional ficou esgotada com tempo, com a evolução dos bancos existente.

De acordo com a arquitetura ANSI / SPARC em três níveis, os bancos de dados relacionais possuem três camadas: um conjunto de visões compondo o nível externo; uma coleção de estruturas de dados, a saber relações, compondo o nível conceitual; um conjunto de índices ou métodos de acesso a dados armazenados, compondo o nível interno.

A teoria relacional de banco de dados define um conjunto de operações lógicas, a saber a álgebra e o cálculo relacionais. Essas operações são a base da linguagem SQL.

Um dos pontos fortes do modelo relacional de banco de dados é a possibilidade de definição de um conjunto de restrições de integridade. Estas definem os conjuntos de estados e mudanças de estado consistentes do banco de dados, determinando os valores que podem e os que não podem ser armazenados.

Diferentemente dos bancos de dados em rede, nos bancos de dados relacionais os relacionamentos entre as tabelas não são codificados explicitamente na sua definição. Em vez disso, se fazem implicitamente pela a presença de atributos chave. Como resultado, bancos de dados relacionais podem ser reorganizados e utilizados de maneira flexível e de formas não previstas pelos projetistas originais. Por causa dessa flexibilidade, muitos bancos de dados são baseados no modelo relacional, embora imperfeitamente.

O modelo relacional apareceu devido às seguintes necessidades: aumentar a independência de dados nos sistemas gerenciadores de banco de dados; prover um conjunto de funções apoiadas em álgebra relacional para armazenamento e recuperação de dados. Modelo que revelou-se ser o mais flexível e adequado ao solucionar os vários problemas que se colocam no nível da concepção e implementação da base de dados. A estrutura fundamental do modelo relacional é a relação (tabela). Uma relação é constituída por um ou mais atributos (campos) que traduzem o tipo de dados a armazenar. Cada instância do esquema (linha) é chamada de tupla (registro). O modelo relacional não tem caminhos pré-definidos para se fazer acesso aos dados como nos modelos que o precederam. O modelo relacional implementa estruturas de dados organizadas em relações. Porém, para trabalhar com essas tabelas, algumas restrições precisaram ser impostas para evitar aspectos indesejáveis, como: Repetição de informação, incapacidade de representar parte da informação e perda de informação. Essas restrições são: integridade referencial, chaves e integridade de junções de relações.

Modelo Orientado a Objetos

Os bancos de dados orientados a objeto começaram a se tornar comercialmente viáveis em meados de 1980. A motivação para seu surgimento está em função dos limites de armazenamento e representação semântica impostas no modelo relacional. Alguns exemplos são os sistemas de informações geográficas (SIG), os sistemas CAD e CAM, que são mais facilmente construídos usando tipos complexos de dados. A habilidade para criar os tipos de dados necessários é uma característica das linguagens de programação orientadas a objetos.

AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

Contudo, estes sistemas necessitam guardar representações das estruturas de dados que utilizam no armazenamento permanente. A estrutura padrão para os bancos de dados orientados a objetos foi feita pelo Object Database Management Group (ODMG).

Esse grupo é formado por representantes dos principais fabricantes de banco de dados orientados a objeto disponíveis comercialmente. Membros do grupo têm o compromisso de incorporar o padrão em seus produtos. O termo Modelo Orientado a Objetos é usado para documentar o padrão que contém a descrição geral das facilidades de um conjunto de linguagens de programação orientadas a objetos e a biblioteca de classes que pode formar a base para o Sistema de Banco de Dados. Quando os bancos de dados orientados a objetos foram introduzidos, algumas das falhas perceptíveis do modelo relacional pareceram ter sido solucionadas com esta tecnologia e acreditava-se que tais bancos de dados ganhariam grande parcela do mercado. Hoje, porém, acreditase que os Bancos de Dados Orientados a Objetos serão usados em aplicações especializadas, enquanto os sistemas relacionais continuarão a sustentar os negócios tradicionais, onde as estruturas de dados baseadas em relações são suficientes.

2.2 - Tipos de arquiteturas de SGBDs Arquitetura Centralizada

Na arquitetura centralizada, existe um computador com grande capacidade de processamento, o qual é o hospedeiro do SGBD e emuladores para os vários aplicativos. Esta arquitetura tem como principal vantagem a de permitir que muitos usuários manipulem grande volume de dados. Sua principal desvantagem está no seu alto custo, pois exige ambiente especial para mainframes e soluções centralizadas.

Arquitetura do tipo Sistemas de Computador Pessoal – PC

Os computadores pessoais trabalham em sistema stand-alone, ou seja, fazem seus processamentos sozinhos. No começo esse processamento era bastante limitado, porém, com a evolução do hardware, tem-se hoje PCs com grande capacidade de processamento. Eles utilizam o padrão Xbase e quando se trata de SGBDs, funcionam como hospedeiros e terminais. Desta maneira, possuem um único aplicativo a ser executado na máquina. A principal vantagem desta arquitetura é a simplicidade.

Arquitetura Cliente-Servidor

Na arquitetura Cliente-Servidor, o cliente executa as tarefas do aplicativo, ou seja, fornece a interface do usuário (tela, e processamento de entrada e saída). O servidor executa as consultas no DBMS e retorna os resultados ao cliente. Apesar de ser uma arquitetura bastante popular, são necessárias soluções sofisticadas de software que possibilitem: o tratamento de transações, as confirmações de transações, desfazer transações, linguagens de consultas e gatilhos (triggers). A principal vantagem desta arquitetura é a divisão do processamento entre dois sistemas, o que reduz o tráfego de dados na rede.

AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

(Parte 1 de 10)

Comentários