Baixe Apostila Informatica Cap 4 Arquitetura PCs e outras Notas de aula em PDF para Engenharia Agronômica, somente na Docsity! Capítulo 4 Arquitetura de um PC O que é a arquitetura de PCs O hardware é uma área onde nos preocupamos com todos os aspectos de um computador, chegando até o nível de portas lógicas e componentes eletrônicos em geral, correntes e tensões, glitches, overshoot e outros efeitos elétricos. Na arquitetura, nosso objeto de estudo está um nível acima. Não importa saber de forma detalhada como os circuitos são construídos, e sim, como se conectam e como funcionam. Na arquitetura de computadores apresentamos conceitos como CPU, memória, dispositivos de entrada e saída. Sempre que possível exemplificamos os conceitos usando PCs. Neste capítulo vamos estudar a arquitetura de forma mais profunda, entretanto voltada exclusivamente para PCs. Para trabalhar com montagem, manutenção e expansão de PCs não é preciso conhecer hardware de forma tão detalhada, chegando ao nível de portas lógicas, chips, correntes e tensões, mas é preciso conhecer a fundo a arquitetura dos PCs. Falaremos neste capítulo sobre processadores, memórias, chipsets, dispositivos de entrada e saída, interfaces, canais de DMA, interrupções e outros conceitos importantes. Processadores Este componente é o principal responsável pelo desempenho de um PC. Exemplos de processadores usados nos PCs são o Pentium 4, Athlon, Pentium III e Duron, além de outros, é claro. Todos os processadores usados nos PCs são descendentes do 8086, o primeiro processador de 16 bits lançado pela Intel, no final dos anos 70. Na discussão que faremos a seguir, encontraremos diversos termos técnicos relacionados com os processadores, por exemplo: 4-2 Hardware Total  Barramento de dados  Barramento de endereços  Acesso à memória  Acesso a entrada e saída Para facilitar a compreensão desses termos, apresentaremos aqui uma descrição simplificada de um processador. Esta descrição não irá reproduzir diretamente as características dos processadores usados nos PCs, mas dará ao leitor, o embasamento necessário para entendê-los. Um processador é um chip que contém o que chamamos de Unidade Central de Processamento (em inglês, Central Processing Unit, ou CPU). É responsável por buscar e executar instruções existentes na memória. Essas instruções são o que chamamos de “linguagem de máquina”. São comandos muito simples, como operações aritméticas e lógicas, leituras, gravações, comparações e movimentações de dados. Essas instruções simples, quando agrupadas, formam o que chamamos de programas. Um processador precisa realizar operações de leitura da memória. Nessas leituras o processador recebe as instruções a serem executadas e os dados a serem processados. Também é preciso realizar gravações de dados na memória, para guardar os resultados intermediários e finais do processamento. Não basta ser capaz de realizar leituras e gravações na memória. Um processador também precisa ser capaz de comunicar-se com o mundo exterior. Neste mundo exterior está o usuário que opera o computador. É preciso ler dados provenientes do teclado, mouse e outros dispositivos de entrada, bem como transferir dados para o vídeo, impressora e outros dispositivos de saída. Essas operações são chamadas de “entrada e saída”, ou E/S (em inglês, Input/Output, ou I/O). Portanto, além de processar dados, um processador deve ser capaz de realizar operações de entrada e saída, bem como realizar leituras e gravações na memória. Capítulo 4 – Arquitetura de um PC 4-5 também precisam gerar interrupções. Como existe apenas uma entrada INT, o processador opera em conjunto com um chip chamado controlador de interrupções. Este chip é encarregado de receber requisições de interrupção de vários dispositivos e enviá-las ao processador, de forma ordenada, através do sinal INT. NMI Este é um sinal de interrupção especial para ser usado em emergências. Significa Non Maskable Interrupt, ou Interrupção não mascarável. Em outras palavras, esta interrupção deve ser atendida imediatamente. Ao contrário do sinal INT, que pode ser ignorado pelo processador durante pequenos intervalos de tempo (isto se chama mascarar a interrupção), o sinal NMI é uma interrupção não mascarável. Nos PCs, o NMI é usado para informar erros de paridade na memória e outras condições catastróficas. INTA Significa Interrupt Acknowledge, ou seja, reconhecimento de interrupção. Serve para o processador indicar que aceitou uma interrupção, e que está aguardando que o dispositivo que gerou a interrupção identifique-se, para que seja realizado o atendimento adequado. VCC Esta é a entrada de corrente elétrica que alimenta os circuitos internos do processador. Processadores antigos operavam a partir de uma tensão de 5 volts. A partir de meados dos anos 90, passaram a utilizar tensões mais baixas, como 3,5 volts. Todos os processadores modernos operam com duas tensões (VCC1 e VCC2). A tensão externa é sempre de 3,3 volts (já existem modelos mais recentes que operam externamente com 2,5 volts), e é usada para alimentar os circuitos que se comunicam com o exterior do processador. A tensão interna é usada para alimentar o interior (núcleo) do processador, e é sempre mais baixa. Nos processadores recentes, a tensão interna é inferior a 2 volts. Note que cada tensão de entrada não ocupa um único pino do processador, e sim, vários pinos. Como a corrente total é relativamente alta, os processadores usam vários pinos para a entrada da tensão do núcleo (Core) e para a tensão externa (I/O). GND Significa Ground, ou Terra. Deve ser ligado ao polo negativo da fonte de alimentação. Assim como ocorre com as entradas de VCC, os processadores possuem diversos pinos de terra, para que o fornecimento de corrente seja melhor distribuído. 4-6 Hardware Total Reset Este é um sinal que está ligado ao botão Reset do painel frontal do gabinete. Ao ser ativado, o processador para tudo, e atua como se tivesse acabado de ser ligado. Este sinal é também conectado a um circuito chamado Power on Reset. Sua função é gerar, no instante em que o computador é ligado, um pulso eletrônico similar ao criado pelo pressionamento deste botão. Aproveitando os conhecimentos de eletrônica apresentados no capítulo 3, mostramos no final deste capítulo, o funcionamento de um circuito de Reset. Clock Esta entrada deve receber um sinal digital que será usado internamente para sincronizar todo o funcionamento do processador. Explicando de forma simplificada, se um processador recebe um clock de 100 milhões de ciclos por segundo, ele executará 100 milhões de operações por segundo. Figura 4.3 Diagrama de tempo de um sinal de clock. A figura 3 mostra o diagrama de tempo de um sinal de clock. Seus bits se alternam de forma periódica, entre 0 e 1. Um trecho com valor 1, seguindo por um trecho com valor 0, é o que chamamos de período do clock. O período é calculado em função do valor do clock, pela seguinte fórmula: T = 1/f Na fórmula, T é o período, dado em segundos, e f é a freqüência do clock, medida em Hz (hertz). Por exemplo, se tivermos um clock de 100 MHz (100.000.000 Hz), o período será de: T = 1/100.000.000 = 0,000 000 01s Para evitar o uso de casas decimais, toma-se o hábito de usar a unidade ns (nano-segundo, ou bilionésimo de segundo). Para fazer a conversão basta andar com a vírgula, 9 casas decimais para a direita. Portanto temos: 0,000 000 01s = 10 ns Capítulo 4 – Arquitetura de um PC 4-7 A maioria dos circuitos digitais opera a partir de uma base de tempo, um clock. São chamados de circuitos síncronos. Os processadores são circuitos síncronos, já que são comandados por sinais de clock. As transições se positivas e negativas (0 para 1 e 1 para 0) do sinal de clock indicam aos circuitos digitais que o utilizam, o momento certo de realizar suas operações. Processadores antigos (até o 486DX-50) utilizavam um único sinal de clock para suas operações internas e externas. A partir daí, e até os dias atuais, os processadores passaram a operar com dois clocks, sendo um interno e um externo. O clock interno é sempre mais alto, e é usado para sincronizar as operações de processamento. Quando falamos, por exemplo, sobre um “Pentium III/800”, estamos dizendo que o seu clock interno é de 800 MHz. O clock externo tem um valor menor, e é usado para sincronizar as operações de comunicação entre o processador, a memória, o chipset e outros circuitos externos. Não só o processador opera a partir de um clock. Vários outros circuitos e barramentos do computador têm suas operações sincronizadas por um clock. Por exemplo:  Memórias PC133 operam a partir de um clock de 133 MHz  Memórias PC100 operam a partir de um clock de 100 MHz  O barramento PCI opera a partir de um clock de 33 MHz  O barramento AGP utiliza um clock de 66 MHz  O barramento ISA utiliza um clock de 8 MHz  Placas de som fazem digitalizações em até 44 kHz A princípio, quanto maior é o clock de um processador, maior é o seu desempenho. Por exemplo, um processador de 800 MHz é seguramente mais veloz que um de 200 MHz. Os fabricantes de processadores se esforçam para criar modelos capazes de operar com clocks cada vez mais elevados. Não devemos entretanto levar ao pé da letra, a relação entre desempenho e clock. Por exemplo, em certas condições, um processador de 700 MHz pode ser mais veloz que um de 900 MHz. O motivo desta discrepância é que além do clock, existem outros fatores que influenciam no desempenho, como por exemplo:  Velocidade das memórias  Desempenho da cache L2  Arquitetura avançada 4-10 Hardware Total Pentium III, Pentium 4, Athlon e diversos outros atuais, também operam com 32 bits. Número de bits externos Para que um processador seja rápido, é preciso que ele seja capaz de manipular instruções em alta velocidade. Essas instruções são armazenadas na memória, e portanto, é preciso que a memória seja acessada em alta velocidade. Ao mesmo tempo em que executa instruções, o processador também lê e armazena dados na memória, o que é mais uma razão para que a memória seja rápida. A velocidade de transferência de dados entre o processador e a memória depende de diversos fatores, e um dos principais é o número de bits do seu barramento de dados (data bus). O barramento de dados é um conjunto de sinais digitais que ligam o processador à memória e aos dispositivos de entrada e saída de dados. Os processadores de 8 bits utilizavam um barramento de dados também com 8 bits. O processador 8086, operava com 16 bits, tanto internamente como externamente, ou seja, utilizava um barramento de dados também com 16 bits. Até então, o número de bits internos era igual ao número de bits exter- nos do processador, mas isto nem sempre ocorre. Por exemplo, o processador 8088, usado nos primeiros PCs, operava internamente com 16 bits, e externamente com apenas 8. Já com os processadores modernos (a partir do Pentium), ocorre o inverso: operam internamente com 32 bits e externamente com 64. A tabela abaixo apresenta o número interno e o número externo de bits dos processadores usados nos PCs. Processador Número interno de bits Número externo de bits 8086 16 16 8088 16 8 286 16 16 386SX 32 16 386DX 32 32 486 32 32 486DLC / SLC 32 32 Pentium, Pentium MMX 32 64 Pentium Pro 32 64 Cyrix 5x86 e AMD 5x86 32 32 Cyrix 6x86 32 64 AMD K5, K6, K6-2, K6-III 32 64 Pentium II, Pentium III 32 64 Celeron 32 64 Pentium 4 32 64 AMD Athlon, Duron 32 64 Capítulo 4 – Arquitetura de um PC 4-11 Como vemos, os processadores mais recentes operam com 32 bits internos e 64 bits externos, ou seja, barramento de dados com 64 bits. Uma nova configuração foi introduzida com o processador Intel Itanium, inaugurando a era dos processadores de 64 bits. São 64 bits internos e 64 bits externos. Capacidade de endereçamento Aqui está um fator que não está exatamente relacionado com a velocidade, e sim, com a capacidade de manipular grandes quantidades de dados. A capacidade de endereçamento nada mais é que o máximo tamanho que pode ter a memória, ou, seja, o número máximo de células de memória que um processador consegue acessar. Para acessar uma célula (ou posição) de memória, o processador precisa informar qual é o endereço desta célula. Cada célula armazena um byte. Processadores com barramento de dados de 16 bits podem acessar duas células de uma só vez. Aqueles com barramentos de dados com 32 e 64 bits podem acessar até 4 e 8 células, respectivamente. O 8086 e o 8088 possuíam barramentos de dados com 20 bits, e por isto podiam acessar 1 MB de memória. Para saber a quantidade máxima de memória que um processador pode acessar, basta saber o número de bits do seu barramento de endereços e calcular 2 elevado a esta número. Portanto: 220 bytes = 1.048.576 bytes = 1 MB 224 bytes = 16.777.216 bytes = 16 MB 232 bytes = 4.294.967.296 bytes = 4 GB Para a época do 8086 e do 8088 (em torno de 1980), a capacidade de endereçar 1 MB era considerada bem elevada. Os primeiros PCs nem mesmo chegavam a usar toda esta capacidade. Eram comuns modelos com 64 kB, 128 kB e 256 kB de memória RAM. Apenas em meados dos anos 80 começaram a ser comuns os PCs com 512 kB e 640 kB de RAM. O processador 286, com sua capacidade de endereçar até 16 MB de memória (usava um barramento de endereços com 24 bits) foi um grande avanço em relação ao 8086 e ao 8088. Mesmo no início dos anos 90, a maioria dos PCs usava entre 1 MB e 2 MB de memória, apenas uma fração da capacidade de endereçamento do 286. O 386, com seu barramento de endereços com 32 bits, possibilitava endere- çar até 4 GB de memória, uma quantidade espantosamente alta até para os dias atuais. Um PC com 256 MB de RAM, por exemplo, não chega a usar 10% da sua capacidade máxima de memória. Por isto, mesmo os processadores mais modernos, em sua maioria, ainda utilizam barramentos 4-12 Hardware Total de endereços com 32 bits. A tabela abaixo apresenta o número de bits do barramento de endereços, bem como a capacidade máxima de endereça- mento de memória para os processadores usados nos PCs: Processador Número bits de Endereço Capacidade de endereçamento 8086 20 1 MB 8088 20 1 MB 286 24 16 MB 386SX 24 16 MB 386DX 32 4 GB 486 32 4 GB 486DLC 32 4 GB 486SLC 24 16 MB Pentium e similares 32 4 GB Pentium Pro e superiores 36 64 GB Memória cache Os processadores experimentaram ao longo dos anos, grandes avanços na velocidade de processamento. Um já ultrapassado Pentium II de 300 MHz, por exemplo, é mais de 1000 vezes mais veloz que o velho 8088 usado no IBM PC XT. As memórias também experimentaram avanços significativos, porém mais modestos. No início dos anos 80, eram comuns as memórias DRAM com 250 ns de tempo de acesso. Em meados dos anos 80, este tempo de acesso chegou à casa dos 60 ns, e no final dos anos 90, aos 10 ns. Portanto essas memórias são apenas cerca de 25 vezes mais rápidas que há 20 anos atrás, enquanto os processadores são no mínimo 1000 vezes mais rápidos. O resultado disso é um grande desequilíbrio entre a velocidade do processador e a velocidade da memória. Este problema é antigo, pois já ocorria com os computadores de grande porte durante os anos 60. Com os processadores, só passou a existir tal problema a partir de 1990, aproximadamente. Antes disso os processadores, sendo mais lentos, ficavam perfeitamente sintonizados com a velocidade das memórias. As memórias, mesmo sendo relativamente lentas, ainda eram capazes de entregar dados na velocidade exigida pelos processadores. Somente quando o seu clock chegou a 25 MHz (por volta de 1990), os processadores passaram a ter seu desempenho penalizado pela baixa velocidade das memórias. A memória RAM usada em larga escala nos PCs é chamada de DRAM (Dynamic RAM, ou RAM Dinâmica). Suas principais características são:  Preço relativamente baixo Capítulo 4 – Arquitetura de um PC 4-15 Cyrix 6x86 16 kB AMD-K5 24 kB AMD K6, K6-2, K6-III 64 kB Cyrix 6x86MX, MII 64 kB Cyrix III 128 kB Pentium II, Celeron 32 kB Pentium III 32 kB Athlon, Duron 128 kB Pentium 4 20 kB Os primeiros processadores a utilizarem cache (486) tinham uma única área para dados e instruções. Novas versões do 486 e todos os processadores seguintes passaram a utilizar uma cache L1 dividida em duas áreas iguais, sendo uma para dados e uma para instruções (data cache e instruction cache). Isto tornou a cache L1 mais eficiente. Notáveis são as caches L1 dos processadores Cyrix e AMD, normalmente maiores que as de processadores Intel de mesmo poder de processamento. Por exemplo, o AMD Athlon tem 128 kB de cache L1, enquanto o Pentium III tem apenas 32 kB. Também notável é o caso da cache L1 do processador Pentium 4. Esta cache não armazena dados e instruções vindos da memória, e sim, micro-instruções já decodificadas. Isso significa que as instruções existentes na cache L1 podem ser executadas mais rapidamente. Evolução da cache Os primeiros processadores usados nos PCs não necessitavam de memória cache. A memória DRAM disponível na época era suficientemente veloz para aqueles processadores. O IBM PC XT, por exemplo, usava memórias com 250 ns de tempo de acesso, mas o seu processador operava com ciclos de 800 ns para realizar os acessos, portanto 250 ns era um tempo de acesso mais que satisfatório. Apenas computadores de grande porte, aqueles que custavam alguns milhões de dólares, utilizavam memória cache. Em 1989 surgiu o processador Intel 80486, o primeiro a utilizar cache. Com clock de 25 MHz e ciclos de 80 ns, necessitava de memórias com menor tempo de acesso, porém na época as mais rápidas eram de 100 ns, tempo muito grande para aquele processador. Os 8 kB de cache, localizadas dentro do próprio processador (cache interna) permitiam o funcionamento do processador com bom desempenho, mesmo com a memória DRAM mais lenta que o necessário. 4-16 Hardware Total Figura 4.4 Cache interna do 486. Processadores 386 produzidos pela AMD na época (1991-1993) eram concorrentes do 486, até então produzidos apenas pela Intel. Assim como ocorria no 486, os processadores 386 daquela época também necessitavam de cache para melhorar o seu desempenho. Como o 386 não tinha cache interna, foram produzidas placas de CPU 386 com cache externa, ou seja, formada por chips SRAM (RAM estática) localizados na placa de CPU. Um processador 386 de 40 MHz e 128 kB de cache externa era praticamente tão veloz quanto um 486 de 25 MHz e 8 kB de cache interna, mas a opção do 386 era muito mais barata. Figura 4.5 Cache externa de placas de CPU para 386. A cache externa realmente acelerava bastante o desempenho, e assim foram criadas placas de CPU para processadores 486, também com cache externa. Eram comuns placas para 486 com 256 kB de cache externa, além dos 8 kB de cache interna existentes no processador. Figura 4.6 Cache interna e externa. Este esquema de dupla cache (interna e externa) utilizada em processadores 486 foi mantido em processadores mais modernos, como o 586, o Pentium e Capítulo 4 – Arquitetura de um PC 4-17 todos os demais processadores para Soquete 7, com exceção do AMD K6- III, que operava com 3 caches. Os termos “cache interna” e “cache externa” caíram em desuso. Atualmente ambas as caches ficam localizadas dentro do próprio processador, portanto não faz mais sentido classificá-las como interna e externa. A cache interna é agora chamada de cache primária ou cache L1 (level 1 ou nível 1). A cache externa é agora chamada de cache secundária ou cache L2 (level 2 ou nível 2). Na época em que o Pentium e o Pentium MMX eram utilizados em computadores de uso pessoal, a Intel produzia o Pentium Pro, utilizado em aplicações de nível profissional e em servidores (1995-1997). Este foi o primeiro processador a embutir a cache L2. Em outras palavras, dentro do processador Pentium Pro encontrávamos a cache L1 e 256 kB de cache L2. Figura 4.7 Cache L2 do Pentium Pro. O Pentium Pro era construído em uma pastilha de silício (die) com dupla cavidade, ou seja, como se fossem dois chips montados em um mesmo substrato. Um deles é o núcleo do processador, o outro é a cache L2. Este método permitiu a construção de uma cache L2 bastante veloz, entretanto tinha um elevado custo de produção. O núcleo do Pentium Pro utiliza a arquitetura Intel P6, usada nos processadores seguintes (Pentium II, Celeron e Pentium III). A cache L2 entretanto nunca mais foi produzida com o sistema de dupla cavidade. O Pentium II foi lançado em 1997, utilizando um núcleo similar ao do Pentium Pro, ou seja, ele também usa a microarquitetura P6. A principal 4-20 Hardware Total Desta forma, a cache L2 acelera o desempenho da DRAM. Ao mesmo tempo, a cache L1 acelera o desempenho da cache L2. Note que na figura estão indicadas as freqüências F1, F2 e F3. F1: Velocidade na qual os dados trafegam entre a cache L1 e o núcleo F2: Velocidade na qual os dados são transferidos entre as caches L1 e L2 F3: Velocidade de transferência entre a DRAM e a cache L2 Veja como ficam essas velocidades em alguns processadores produzidos em um passado recente: Processador F1 F2 F3 Pentium-200 200 MHz 66 MHz 66 MHz AMD K6-2/300 300 MHz 100 MHz 100 MHz AMD K6-2/500 500 MHz 100 MHz 100 MHz Pentium II/400 400 MHz 200 MHz 100 MHz Em todos os casos, o clock usado na transferência de dados entre a cache L1 e o núcleo do processador é o próprio clock do núcleo. Por exemplo, em um núcleo de 500 MHz, esta transferência é feita a 500 MHz. Observe o que ocorre com os valores de F2, que representa a velocidade da cache L2. Nos processadores Pentium, K6-2 e similares, a cache L2 opera com freqüência fixa, igual à freqüência do barramento externo. Um K6-2/500 tem condições de processar dados mais rapidamente que um K6-2/300, entretanto ambos possuem caches L2 com velocidades semelhantes. Aumentar mais ainda o clock do processador e manter fixa a velocidade da cache L2 é a mesma coisa que usar em um carro de Fórmula 1, pneus de Fusca. Finalmente observe o valor de F2 para o Pentium II. Este processador possui uma cache L2 capaz de transferir dados em uma velocidade maior que a do seu barramento externo. É usado um barramento dual, um de 100 MHz para acessar a DRAM e um de 200 MHz para acessar a cache L2. No caso geral, a cache L2 do Pentium II e das primeiras versões do Pentium III (Katmai) opera com a metade da freqüência do núcleo do processador. Um Pentium III/600, por exemplo, tem cache L2 operando a 300 MHz. O aumento do valor de F2 foi uma das prioridades nos processadores lançados recentemente. Veja o que ocorre com os modelos mais novos: Processador F1 F2 F3 Pentium IIIE F F 100 MHz Pentium IIIB F F/2 133 MHz Capítulo 4 – Arquitetura de um PC 4-21 Pentium IIIEB F F 133 MHz Athlon original F F/2, F/2.5, F/3 200 MHz Athlon T-bird F F 200/266 MHz Duron F F 200 MHz Pentium 4 F F 400 MHz Na tabela usamos F para indicar a freqüência do núcleo do processador. Por exemplo, em um Pentium III/1000, F vale 1000 MHz. Observe que nos processadores mais modernos, F2 (freqüência da cache L2) é igual à freqüência do núcleo do processador. Núcleo a 1000 MHz significa cache L2 a 1000 MHz. Isto resulta em um grande aumento de desempenho, em comparação com versões mais antigas. Nas primeiras versões do Pentium III, bem como no Pentium IIIB (clock externo de 133 MHz), a cache L2 operava com a metade da freqüência do núcleo. Isto também ocorria com as primeiras versões do Athlon, onde a cache L2 operava com a metade, e até com 1/3 da freqüência do núcleo. Nas versões mais novas do Pentium III (Coppermine) e nas versões T-Bird do Athlon e Duron, a cache L2 também opera com a freqüência do núcleo. Esta é uma característica que será mantida em todos os processadores modernos: cache L2 em full speed., integrada no núcleo do processador (on-die). Finalmente observe na tabela que melhoramentos têm sido feitos na freqüência da DRAM. Novas tecnologias como DDR e RDRAM estão aos poucos sendo implantadas para tornar mais elevada a taxa de transferência dos dados que chegam da DRAM. Cache L3 Durante aproximadamente um ano (meados de 1999 a meados de 2000), a AMD produziu o processador K6-III. Foi lançado apenas nas versões de 400 e 450 MHz, mas foi logo retirado de linha, devido ao seu custo de produção relativamente alto, o que dificultava a concorrência com os processadores Intel. O K6-III tinha uma cache L2 de 256 kB full speed integrada no seu núcleo. Processador a 450 MHz, cache L2 a 450 MHz. Seu desempenho era muito bom, bem mais veloz que o K6-2 e igualando-se ao Pentium III de mesmo clock. A AMD achou melhor descontinuá-lo e dedicar sua linha de produção ao Athlon. O processador K6-III tinha no seu núcleo, caches L1 e L2. Podia ser instalado em placas de CPU para K6-2, que já tinham cache externa. Sendo assim, a cache existente na placa de CPU era de nível 3 (L3). A figura 10 mostra a relação entre as três caches do K6-III. 4-22 Hardware Total Figura 4.10 Relação entre as caches de um K6-III/400. Na figura 10 foi tomado como exemplo um K6-III de 400 MHz. Estando o núcleo operando a 400 MHz, as transferências feitas entre o processador, a cache L1 e a cache L2 (internas) são feitas na mesma freqüência. Para o modelo de 450 MHz, essas transferências são feitas a 450 MHz. Em ambos os modelos, as transferências entre a cache L2 e a L3 (externa), e entre a cache L3 e a DRAM são feitas a 100 MHz. Desempenho Todos os esforços no sentido de melhorar a tecnologia dos processadores giram em torno de um ponto chave: o desempenho, ou seja, a velocidade de processamento. Entre as técnicas implantadas visando obter maiores velocidades, podemos citar:  Aumento do clock  Aumento do número interno de bits  Aumento de número externo de bits  Redução do número de ciclos para executar cada instrução  Uso de cache L1 e L2 mais eficientes  Execução de instruções em paralelo Avanços em todas essas áreas têm possibilitado obter velocidades cada vez maiores. Para avaliar essas velocidades, é fundamental que existam métodos precisos para medir o desempenho de um processador. No tempo do PC XT, quando apenas o processador 8088 era usado, bastava indicar o seu clock, e automaticamente poderíamos ter uma idéia da sua velocidade de processamento. Por exemplo, um XT de 10 MHz era duas vezes mais veloz que um XT de 5 MHz. OBS: O primeiro PC XT não operava com 5 MHz, e sim, com 4,77 MHz. Portanto, um XT de 10 MHz era cerca de 2,09 vezes mais veloz que o XT original. Durante muitos anos, o desempenho dos processadores usados nos PCs foi estimado através de comparações com o IBM PC XT. Por exemplo, o 80286 de 6 MHz usado no IBM PC AT era cerca de 5,7 vezes mais rápido que o Capítulo 4 – Arquitetura de um PC 4-25 eficiência não é tão grande assim quando é preciso acessar grandes quantidades de memória. A cache L1 não consegue dar conta do serviço, e o desempenho cai consideravelmente. Sem a cache L2, um Pentium-166 apresenta um desempenho similar ao de um Pentium-90, apesar do seu índice de velocidade medido com o Norton SI (ou com o Checkit) permanecer inalterado. Para medir de forma mais realista o desempenho do Pentium e processadores mais avançados, é pre- ciso usar programas que são baseados na execução de uma miscelânea de instruções mais comuns nos programas mais sofisticados para o ambiente Windows. Exemplos de programas adequados são o Norton Sysinfo para Windows 9x, o Winbench e o Winstone. A tabela que se segue mostra ídices de velocidade para alguns processadores na faixa de 200 a 500 MHz. Nesses testes usamos os programas Norton Sysinfo para Windows 9x e o Winbench 99, que apresenta por sua vez dois índices: CPUMark32, para processamento não numérico, e o FPUWinMark, para processamento numérico. Observe como processadores de gerações mais novas apresentam desempenho muito superior ao de processadores mais antigos porém com o mesmo clock. Por exemplo, o Pentium II/233 tem índice CPUMark32 igual a 560, enquanto o Pentium MMX/233 tem índice de apenas 440. Processador e clock Norton CPUMark32 FPUWinMark Pentium II, 450 MHz 210 1100 2290 Pentium II, 400 MHz 190 1000 2060 Pentium II, 350 MHz 170 900 1800 Pentium II, 300 MHz 150 800 1500 Pentium II, 333 MHz 150 780 1600 Pentium II, 300 MHz 140 730 1500 Pentium II, 266 MHz 130 650 1300 Pentium II, 233 MHz 110 560 1150 Pentium MMX, 233 MHz 61 440 830 Pentium MMX, 200 MHz 55 400 750 AMD K6-2, 400 MHz 140 860 1250 AMD K6-2, 350 MHz 130 800 1100 AMD K6-2, 300 MHz 120 760 950 AMD K6, 300 MHz 110 620 930 AMD K6, 266 MHz 100 580 850 AMD K6, 233 MHz 90 550 750 AMD K6, 200 MHz 80 520 640 Celeron 300 MHz 100 610 1500 Cyrix MII PR300 85 560 520 4-26 Hardware Total 6x86MX PR266 75 540 460 6x86MX PR233 64 470 420 6x86MX PR200 60 430 390 6x86 PR200 52 420 380 Processadores mais com clocks mais elevados apresentam índices de desempenho ainda maiores. A tabela que se segue mostra os índices CPUMark32, medidos com o programa Winbench 99 versão 1.2, para alguns processadores acima de 500 MHz. Note que os índices do Winbench 99 versão 1.2 não têm relação com os índices do Winbench 99 versão 1.0, usados na tabela anterior. Processador e clock CPUMark32 (ver 1.2) Athlon 1 GHz 90 Athlon 800 MHz 72 Athlon 600 MHz 55 Pentium III 1 GHz 85 Pentium III 800 MHz 70 Pentium III 600 MHz 45 Duron 800 MHz 65 Unidade de ponto flutuante Os velhos processadores 8086 e 8088 podiam operar em conjunto com um chip auxiliar chamado 8087. Este chip era chamado de processador (ou coprocessador) matemático. Era uma espécia de processador secundário, especializado em realizar cálculos com números reais em alta velocidade. Enquanto o 8086 e o 8088 faziam apenas adição, subtração, multiplicação e divisão de números inteiros de 32 bits, o 8087 podia realizar essas mesmas operações, e ainda uma grande quantidade de funções algébricas (raiz quadrada, logaritmo, exponencial, etc), trigonométricas (seno, tangente, arco tangente, etc) e hiperbólicas (seno hiperbólico, cosseno hiperbólico, etc), com números reais de 80 bits de mantissa (lembrando que um número real pode ser representado por uma base, ou mantissa, e um expoente). Programas que utilizam grandes quantidades de cálculos deste tipo ficavam incrivelmente mais velozes quando usavam o 8087. Normalmente, os softwares eram fornecidos simultaneamente em duas versões, uma para operar através do 8086/8088, e outra para usar o 8087. Quando o PC não tinha o 8087 insta- lado, mesmo assim podia realizar esses cálculos, mas estes eram feitos por etapas, o que era muito mais demorado. Os programas que se beneficiam de um coprocessador matemático são os seguintes:  CAD (Computer Aided Design) Capítulo 4 – Arquitetura de um PC 4-27  Programas para engenharia  Programas científicos  Programas que geram figuras tridimensionais Ao lançar os seus novos processadores, a Intel sempre lançava também um coprocessador matemático compatível: Processador Coprocessador matemático 8086 / 8088 8087 80286 80287 80386SX 80387SX 80386DX 80387DX Ao lançar o 486, a Intel finalmente colocou o coprocessador matemático dentro de próprio processador. O chamado 486DX possui um coprocessador matemático interno, enquanto o 486SX não o possui. Outros processadores mais avançados como o Pentium e o Pentium Pro também possuem o coprocessador matemático interno. O mesmo ocorre com todos os processadores produzidos depois do 486, ou seja, todos possuem um coprocessador matemático embutido. Esta parte do processador é chamada atualmente de unidade de ponto flutuante (FPU, ou Float Point Unit). Antigamente apenas engenheiros, arquitetos e cientistas precisavam de um coprocessador matemático. No tempo em que reinava o processador 486, a sua unidade de ponto flutuante ficava praticamente ociosa, pois os softwares da época quase não a utilizavam. Hoje em dia, além das aplicações sérias já citadas, existe uma categoria de programas que faz uso intensivo da unidade de ponto flutuante: os jogos tridimensionais. A geração de imagens tridimensionais demanda uma grande quantidade de cálculos, portanto a unidade de ponto flutuante passou a ser um ítem essencial, mesmo para os usuários domésticos. Mapas de memória e de E/S Um bom conhecedor de hardware deve entender não apenas o que se passa dentro de um processador, mas também a forma como ele se comunica com o seu exterior. É preciso entender como o processador envia e recebe dados para a memória e para os dispostivos a ele ligados. Vamos então começar estudando a forma como o processador “vê” a memória e os demais dispositivos. Como vimos no início deste capítulo, um processador é capaz de realizar operações como: 4-30 Hardware Total Significa Input-Output/Memory, ou seja, Entrada e Saída / Memória. Com este sinal digital o processador indica se está acessando uma posição de memória ou uma posição de E/S. d) R/W Significa Read/Write, ou seja, Leitura/Escrita. Este é um sinal digital através do qual o processador informa se está realizando uma operação de leitura ou de escrita. Através dos sinais IO/M e R/W, o processador define uma das 4 operações de transferência de dados possíveis:  Leitura da memória  Leitura de E/S  Escrita na memória  Escrita em E/S Um exemplo de leitura de E/S é a recepção do código de uma tecla pressi- onada pelo usuário no teclado. Um exemplo de escrita em E/S é a trans- missão de um caracter para a impressora. Observe bem a figura 11 e veja como existe uma grande similaridade (pelo menos do ponto de vista do processador) entre as operações de acesso à memória e as operações de acesso a E/S. Em ambos os tipos de operação o processador precisa fornecer o endereço desejado. Em ambos os tipos podem ser feitas leituras e escritas através do barramento de dados. O sinal R/W indica se a operação é de leitura ou escrita, tanto no caso do acesso à memória como no acesso a E/S. O sinal IO/M é o único diferenciador que o processador fornece para distinguir entre as operações de acesso à memória e as de acesso a E/S. O processador “enxerga” a memória como uma grande seqüência de bytes. Esta seqüência, quanto representada em um gráfico, é chamada de mapa de memória. Da mesma forma, o processador “enxerga” os dispositivos de E/S como uma seqüência de bytes, que ao serem representados graficamente, formam o que chamamos de “mapa de E/S”. O mapa de memória é uma representação gráfica de todos os bytes presentes em todos os chips de memória do computador. O mapa de E/S é uma representação gráfica de todos os bytes existentes nos diversos chips que formam as diversas interfaces existentes no computador. A figura 12 mostra o mapa de memória e o mapa de E/S de um PC equipado com 256 MB de RAM. Capítulo 4 – Arquitetura de um PC 4-31 Figura 4.12 Mapa de memória e mapa de E/S. Observe o mapa de memória da figura 12. Vemos que neste mapa existem vários "finais de memória". 1. Memória instalada. Na figura está sendo usado um limite de 256 MB, mas poderia ser qualquer quantidade suportada pela placa de CPU. Esta é a memória que os programas poderão acessar. 2. Limite da placa de CPU. Este limite é imposto pelo projetista da placa de CPU, que possui previsão para a instalação futura de novos módulos de me- mória. Muitas placas de CPU modernas possuem 3 soquetes para instalação de módulos de até 512 MB, portanto seu limite máximo é 1536 MB. Outras placas poderão ter limites ainda maiores, assim como placas um pouco mais antigas têm limites menores. 3. Limite do processador. Com um barramento de endereços de 36 bits, o máximo endereço que pode ser utilizado é 64 GB de memória. A figura 12 mostra também o mapa de E/S e dois limites: 1. Limite da placa de CPU. Este limite foi imposto pela IBM quando projetou o IBM PC, e era seguido pelas placas de CPU até poucos anos atrás. Nessas palcas são usados apenas 1024 endereços de E/S (1k), apesar do processador poder chegar até 64k. Na figura, chamamos este limite de “Tradicional Limite da Placa de CPU”, pois nas modernas placas de CPU, este limite é maior, ou seja, é usado um espaço de endereçamento maior que 1 kB. 4-32 Hardware Total 2. Limite do processador. Nas operações de E/S, os processadores usados na família PC usam apenas 16 bits do seu barramento de endereços, limitando o endereço máximo de E/S em 64k. As placas de CPU modernas utilizam todos os 16 bits para especificar endereços de E/S, portanto seu limite máximo é o próprio limite de endereçamento do processador, ou seja, 64 kB. Os bytes do mapa de E/S ficam localizados em diversos chips existentes nas diversas interfaces instaladas no PC. Quando o processador escreve valores nesses bytes, os dispositivos conectados às interfaces recebem automaticamente os comandos correspondentes a esses valores. Através do Gerenciador de Dispositivos do Windows, podemos visualizar o mapa de E/S, com as indicações das faixas de endereços ocupadas por cada interface. No Gerenciador de Dispositivos, clique em Computador, depois em Propriedades. No quadro apresentado (figura 13), marque a opção “Entrada/saída (E/S)”. Figura 4.13 Mapa de E/S apresentado pelo Gerenciador de Dispositivos do Windows. No mapa apresentado, vemos por exemplo que a porta COM2 ocupa os endereços entre 2F8 e 2FF, e que a porta paralela está ocupando os endereços entre 378 e 37F. Usando a barra de rolamento deste quadro podemos visualizar todos os endereços de E/S usados pelo computador. Você certamente já ouviu falar em drivers de dispositivos de E/S. Temos por exemplo o driver da placa de som, o driver da placa de vídeo, o driver do modem, e assim por diante. Uma das coisas que o driver faz é ler e escrever valores apropriados nos endereços apropriados do mapa de E/S correspondentes ao dispositivos que está controlando. Capítulo 4 – Arquitetura de um PC 4-35 utiliza um circuito chamado de controlador de interrupções. Uma das funções deste circuito é receber requisições de interrupções de vários dispositivos e interromper o processador através do sinal INT. Outra função é informar ao processador qual foi o dispositivo que gerou a interrupção. A figura 14 mostra de forma muito simplificada, a estrutura de interrupções no IBM PC XT. A figura 15 mostra a estrutura de interrupções usada nos PC mais modernos. Por simplicidade, comecemos a analisar como eram as interrupções no XT. Figura 4.14 Uso das interrupções no IBM PC XT. Os vários circuitos que precisam gerar interrupções enviam as requisições ao chip controlador de interrupções, que por sua vez, interrompe o processador e o informa qual foi o dispositivo que requisitou a interrupção. Observe na figura 14 os seguintes sinais digitais: INT Sinal que serve para interromper o processador. IRQ0 a IRQ7 Essas são as oito entradas de interrupções, ligadas a diversos dispositivos. A sigla IRQ significa "Interrupt Request" (Requisição de interrupção). Quando o controlador de interrupções recebe um IRQ de algum dispositivo, gera um sinal INT para o processador. Além disso, o controlador de interrupções informa ao processador qual dos oito sinais IRQ foi ativado. Este controlador também é capaz de gerenciar prioridades entre as interrupções (qual interrupção é atendida em primeiro lugar quando duas ou mais ocorrem no mesmo instante), e também leva em conta interrupções aninhadas (quando uma nova interrupção ocorre antes do final do atendimento de uma prévia interrupção). Entre os diversos chips controladores de interrupções existentes no mercado, a IBM optou pelo 8259A, fabricado pela Intel. Para que todos esses dispositivos possam gerar interrupções, é preciso que suas interfaces tenham acesso físico aos respectivos sinais IRQ. Observe que tanto o processador como os controladores de interrupções ficam localizados 4-36 Hardware Total na placa de CPU. Por outro lado, a maioria das interfaces ficam localizadas em placas de expansão. Portanto, os sinais IRQs são originados em placas de expansão e precisam chegar até a placa de CPU. Por esta razão, os sinais IRQ estão presentes nos slots, que são a ligação física entre a placa de CPU e as placas de expansão. As oito entradas de interrupções disponíveis são descritas na tabela que se segue: IRQ0 Timer. Trata-se de um circuito que gera uma interrupção a cada 55 milésimos de segundo. Esta interrupção é usada para manter a data e a hora. Nos XTs, o usuário precisava fornecer a data e a hora durante o boot. Depois disso, o timer fazia a contagem do tempo a partir da data e hora iniciais, e das suas interrupções. Nos PCs modernos, apesar da existência do relógio permanente localizado no chip CMOS, o timer continua sendo usado pelos programas que necessitam saber a data e a hora. A única diferença é que nas operações de boot o timer não precisa mais ser acertado pelo usuário, pois este acerto é feito automaticamente pelo BIOS a partir da data e hora existentes no chip CMOS. IRQ1 Teclado. É gerada pelo chip de interface de teclado sempre que o usuário pressiona alguma tecla. IRQ2 Reservado. Inicialmente a IBM deixou esta interrupção reservada para uso futuro, e não fez nela nenhuma conexão. Entretanto, diversas placas de interface passaram a usá-la, já que estava disponível, apesar da recomendação da IBM de reservá-la para uso futuro. IRQ3 COM2. É usada pela segunda interface serial, para sinalizar o final da transmissão e da recepção de dados. A cada byte recebido pela interface serial, uma interrupção é gerada. Ocorre também no final da transmis- são de cada byte, indicando ao processador que o próximo byte já pode ser transmitido. IRQ4 COM1. Tem o mesmo uso da IRQ3, porém é usada pela interface serial COM1. IRQ5 Disco rígido. As placas controladoras de disco rígido para XT usavam esta interrupção para indicar a finalização de operações de acesso ao disco rígido. Assim o processador saberia que é hora de enviar o próximo comando. Entre essas operações podemos citar: Leitura de setor, gravação de setor, posicionamento sobre uma trilha, formatação de trilha, etc. IRQ6 Drive de disquetes. Esta interrupção era, e ainda é usada pela interface de drives de disquetes. Serve para sinalizar o término de operações de acesso ao disquete, como leitura, gravação, posicionamento, formatação, etc. IRQ7 Impressora. Através desta interrupção, a impressora pode informar a ocorrência de erros (falta de papel, carro de impressão preso, etc). É também usada para controlar o fluxo de dados entre o computador e a impressora. Quando a impressora está com o seu buffer cheio, gera esta interrupção para informar esta condição, fazendo com que o computador suspenda a transmissão de dados. Quando o buffer fica parcialmente descarregado, gera outra interrupção para informar que o computador já pode enviar mais dados. Com o lançamento do IBM PC AT, equipado com o processador 80286, a IBM passou a utilizar dois controladores de interrupções ligados em cascata, como mostra a figura 15. Este arranjo continua sendo utilizado da mesma forma, com mínimas modificações, nos PCs atuais. Capítulo 4 – Arquitetura de um PC 4-37 Figura 4.15 Uso de interrupções nos PCs modernos. As interrupções passaram a ser usadas da seguinte forma: IRQ0 Timer. Mesmo uso que tinha no XT. IRQ1 Teclado. Mesmo uso que tinha no XT. IRQ2 CASCADE. Ligação com o segundo controlador de interrupções (ligação em cascata). IRQ3 COM2 / COM4. A IBM aumentou o número de portas seriais para um máximo de quatro, mas não reservou interrupções exclusivas para a COM3 e a COM4. A COM4 deve usar a mesma interrupção que a COM2, enquanto a COM3 deve usar a mesma interrupção que a COM1. Esta é uma das principais razões de conflitos de hardware envolvendo as interfaces seriais. IRQ4 COM1 / COM3. IRQ5 Paralela. A IBM reservou esta interrupção para a segunda interface paralela. IRQ6 Interface de drives. Mesmo uso do XT. IRQ7 Paralela. Mesmo uso do XT. Normalmente esta interrupção é usada pela primeira interface paralela (LPT1), ficando a IRQ5 para a LPT2. Entretanto, nem sempre esta regra é seguida. Existem placas em que a LPT1 está ligada na IRQ5. IRQ8 Alarm clock. Esta interrupção está ligada ao chip CMOS, que pode ser programado para gerar uma interrupção após um período pré-programado. IRQ9 EGA / VGA. Originalmente esta interrupção era utilizada pela placa de vídeo EGA, que deu lugar às placas VGA. As placas VGA podem opcionalmente, por questão de compatibilidade com a EGA, usar também esta interrupção. IRQ10 Reservado. A IBM nunca diz "livre", e sim, "reservado". Normalmente esta interrupção está livre, e pode ser usada por novas placas, como por exemplo, placas de rede e placas de som. IRQ11 Reservado. Mesmo caso da IRQ10. IRQ12 Reservado. Mesmo caso da IRQ10. IRQ13 Coprocessador matemático. Esta interrupção é reservada para uso exclusivo do coprocessador matemático. Através dela o processador pode ser informado sobre condições anormais do cálculo, como por exemplo, a divisão por zero e a raiz quadrada de um número negativo. IRQ14 Disco rígido. No IBM PC XT, a interface do disco rígido usava o IRQ5. Nos ATs, esta foi substituída pelo IRQ14, ficando a IRQ5 destinada à segunda interface paralela. IRQ15 Reservado. Mesmo caso da IRQ10. Ao lançar o IBM PC AT, a IBM passou a utilizar não apenas um número maior de interrupções, mas também um número maior de bits de dados e de endereços. Veja algumas diferenças entre os modelos XT e AT: XT AT Bits de dados 8 16 Bits de endereços 20 24 Número de IRQs 8 15 4-40 Hardware Total As placas de vídeo antigas eram muito lentas. Tão lentas que sua memória de vídeo não podia ser simultaneamente acessada pelo processador e pelos circuitos que enviam os sinais para o monitor. Se este acesso fosse feito de forma simultânea, fazia com que surgissem momentaneamente pequenos traços pretos horizontais na tela sempre que o processador precisava colocar dados na memória de vídeo. Este efeito indesejável é chamado de snow. Para evitar este problema, os programas faziam acesso à memória de vídeo apenas durante o retraço vertical, que é o período no qual o feixe eletrônico do monitor atinge a parte inferior da tela e é reposicionado na sua parte superior. Como neste período o feixe eletrônico do monitor é apagado, não ocorre o snow. A placa de vídeo EGA gerava interrupções através do IRQ9 para indicar o início e o fim do retraço vertical, e muitos programas utilizavam este recurso. As modernas placas SVGA são bem mais velozes, e podem ao mesmo tempo enviar sinais de vídeo para o monitor e serem acessadas pelo processador, sem a ocorrência de snow. Por isso os programas atuais não precisam mais esperar pelo retraço vertical para acessá- la. Por questões de compatibilidade com as placas EGA, as placas VGA e SVGA podem opcionalmente utilizar o IRQ9. Entretanto, a esmagadora mai- oria dos softwares modernos não necessita desta interrupção. Podemos tranqüilamente deixar o IRQ9 na placa VGA desabilitado. Assim esta interrupção ficará livre para ser usada por novas placas que desejemos instalar. A única desvantagem de desativar o IRQ9 na placa VGA é que programas gráficos bem antigos (criados entre 1985 e 1990, em geral), escritos para a placa EGA, deixarão de funcionar, e o micro "travará" sempre que forem executados. Como é pouco provável que você utilize algum pro- grama desta época, a melhor coisa a fazer é realmente desabilitar o uso da IRQ9 na sua placa VGA. Nas placas VGA antigas, esta desabilitação era feita através de um jumper. Nos PCs modernos, podemos encontrar no CMOS Setup, um comando para ativar ou desativar o uso da IRQ9 para a placa de vídeo. Uso das IRQs nos PCs atuais Nos PCs modernos, sejam eles equipados com slots ISA ou não, o uso das interrupções é muito parecido com o que ocorria no IBM PC AT. Por exemplo, o teclado continua usando a IRQ1, o timer continua usando a IRQ0, a IRQ13 continua sendo usada para indicar a ocorrência de cálculos inválidos pela unidade de ponto flutuante. Vejamos quais são as diferenças presentes nos PCs atuais: Capítulo 4 – Arquitetura de um PC 4-41 IRQ5 e IRQ7 Essas duas interrupções são reservadas para interfaces paralelas. Como na configuração básica existe apenas uma interface paralela, apenas uma dessas interrupções, normalmente a IRQ7, estará sendo usada. A outra, normalmente a IRQ5, estará livre. Tome cuidado, pois em certos casos ocorre exatamente o contrário, ou seja, a IRQ5 está em uso e a IRQ7 está livre. Outro dado interessante é que muitas impressoras podem funcionar sem o uso de interrupções. Portanto em caso de necessidade, podemos configurar o Windows para que não use uma IRQ para a porta parlela, deixando assim mais uma IRQ livre para ser usada por novas placas de expansão. IRQ9 Esta interrupção poderá estar sendo usada pela placa de vídeo. Podemos desabilitar seu uso através de um jumper (nas placas antigas), de acordo com as instruções existentes no manual da placa de vídeo. Em PCs modernos, pode ser possível desabilitar o uso de interrupções pela placa de vídeo, através de um comando do CMOS Setup. IRQ10, IRQ11, IRQ12 Essas interrupções estarão livres, já que não são usadas pelos dispositivos que fazem parte da configuração básica de um PC. Poderão ser usadas por placas de expansão, como modems, placas de som, placas de rede, etc. Nos PCs atuais essas interrupções são normalmente destinadas às placas de expansão que estão ligadas ao barramento PCI. IRQ15 Esta interrupção normalmente é usada pela interface IDE secundária, enquanto a IRQ14 é usada pela interface IDE primária. Podemos facilmente visualizar o uso das interrupções usando o Gerenciador de Dispositivos do Windows. Para chegar a ele basta clicar em Meu Computador com o botão direito do mouse e no menu apresentado escolher a opção Propriedades. No quadro apresentado clicamos na guia Gerenciador de Dispositivos. Clicamos em Meu Computador e Propriedades, e finalmente marcamos a opção Pedido de interrupção (IRQ). O quadro assumirá o aspecto mostrado na figura 18. Figura 4.18 Relatório de uso das IRQs. Este relatório informa como as IRQs estão sendo utilizadas, e indica também quais IRQs ainda estão livres para serem usadas em novas placas a serem instaladas. Compartilhamento de interrupções 4-42 Hardware Total A princípio não podemos ter dois dispositivos usando o mesmo recurso de hardware. Quando isto ocorrer, o Gerenciador de Dispositivos colocará um ponto de exclamação sobre os dispositivos em conflito. É o caso da IRQ5 e IRQ10, indicadas na figura 19. O ponto de exclamação indica que pode existir um conflito de hardware, ou então que o dispositivo não está corretamente instalado. Note que este conflito de hardware pode ser devido a IRQ (ambos usariam a mesma IRQ), ou de DMA, ou de endereços de memória, ou de endereços de E/S. Figura 4.19 Dispositivos em conflito de hardware. Note entretanto que existem casos de dispositivos usarem a mesma IRQ, e mesmo assim não estar ocorrendo conflito. Observe na figura 20 que existem três dispositivos usando a IRQ11, e mesmo assim não existe indicação de conflito. O que isso significa? Figura 4.20 Interrupções compartilhadas. Capítulo 4 – Arquitetura de um PC 4-45 som operasse também com E/S programada, não poderia ser usada em conjunto com o disco IDE. Para ouvir um arquivo sonoro seria preciso transferi-lo integralmente para a memória (o que nem sempre é possível no caso de arquivos muito grandes) para depois transferi-lo para a placa de som. Esta operação poderia ser inviabilizada pela limitação no tamanho da memória. O arquivo também não poderia ser lido por partes, pois seu som ficaria com diversas pausas. Devido às limitações da E/S programada, os PCs podem operar também com um outro tipo de operação de E/S. Trata-se da entrada e saída por DMA. Nessas operações, um circuito especial chamado de controlador de DMA faz o controle dos barramentos do processador. Para receber um dado por DMA, este controlador faz o seguinte: 1. Desabilita momentaneamente o processador, colocando-o em tristate 2. Faz a leitura do dado da interface que requisitou a transferência 3. Grava este dado na posição de memória pré-programada 4. Habilita o processador para funcionamento normal Figura 4.23 E/S por DMA. O processador fica em tristate enquanto o controlador de DMA assume o controle dos barramentos e faz as transferências. Nas operações de saída, o controlador de DMA faz o seguinte: 1. Desabilita momentaneamente o processador, colocando-o em tristate 2. Faz a leitura do dado da memória 3. Transmite o dado para a interface apropriada 4. Habilita o processador para funcionamento normal As operações de DMA são sempre feitas em blocos. Por exemplo a leitura de um setor vindo do disquete é feita desta forma. O controlador de DMA é 4-46 Hardware Total antes programado com o número de bytes a serem recebidos (que neste caso é 512) e com o endereço de memória a partir do qual os dados serão armazenados. O controlador de DMA automaticamente conta o número de bytes recebidos e gera os endereços consecutivos onde os 512 bytes serão armazenados. Podemos ver as operações de E/S por DMA ilustradas na figura 23. A grande vantagem do DMA é que o processador não precisa se ocupar diretamente da operação de recepção e transmissão de cada byte, ficando livre para executar outros processamentos. Normalmente as interfaces que utilizam DMA, utilizam também uma interrupção para avisar o processador sobre o término da transferência do número de bytes pré-programado. Entre as interfaces que utilizam DMA podemos citar:  Interface de drives de disquetes  Placas controladoras SCSI  Placas de som  Placas de interface de scanner  Placas digitalizadoras de vídeo  Interface paralela operando no modo ECP Entre as interfaces que NÃO usam DMA, podemos citar:  Interfaces seriais  Interfaces paralelas (exceto quando operam no modo ECP)  Interfaces para joystick  Interfaces de teclado Durante as transferências de DMA, o processador não fica o tempo todo de- sabilitado. Entre a chegada de dois dados consecutivos de uma transferência, o processador opera normalmente. Suponha que uma determinada interface transmita dados de 1000 em 1000 ns, e que a recepção de cada um desses dados leve 100 ns. Após receber um dado, o processador tem mais 900 ns para processamento normal antes da chegada do próximo dado. Por isso o processador pode realizar, por exemplo, a leitura de um arquivo sonoro do disco rígido e ao mesmo tempo enviá-lo para a placa de som. Ao mesmo tempo em que um trecho do som está sendo tocado, o trecho seguinte estará sendo lido do disco. Isto só é possível porque as placas de som operam com DMA. Capítulo 4 – Arquitetura de um PC 4-47 Os PCs derivados do IBM PC AT (baseados no 286, 386, 486, Pentium e superiores) podem operar com até 7 dispositivos utilizando DMA. Dizemos então que o circuito controlador de DMA implementa 7 canais de DMA. Na verdade, este circuito é formado por dois controladores de DMA, cada um sendo capaz de gerenciar 4 canais. Esses dois controladores estão ligados em cascata, e um dos canais é utilizado nesta ligação, sobrando apenas 7. Os oito canais e seus usos são os seguintes: DMA0: Livre DMA1: Livre DMA2: Interface de drives DMA3: Livre DMA4: [CASCADE] DMA5: Livre DMA6: Livre DMA7: Livre Um PC que ainda está com a sua configuração básica, possui os canais 0, 1, 3, 5, 6 e 7 livres. À medida que placas de expansão vão sendo instaladas, é preciso escolher canais de tal forma que não ocorram conflitos, ou seja, nunca devemos deixar que duas placas utilizem o mesmo canal de DMA. Placas Plug-and-Play (PnP), quando usam DMA, têm seus canais escolhidos de forma automática pelo Windows, durante o processo de instalação. No caso de placas que não são PnP (modelos antigos), cabe ao usuário fazer a escolha dos canais. No Windows podemos visualizar os canais de DMA que estão em uso, através do Gerenciador de Dispositivos, como mostra a figura 24. Neste exemplo, além dos canais DMA2 e DMA4, que estão sempre ocupados em qualquer PC, temos ainda os canais DMA1 e DMA5 sendo utilizados pela placa de som. 4-50 Hardware Total freqüências, de acordo com o processador utilizado. Um método para fazer isso seria utilizar 3 osciladores independentes, um para 66, outro para 100 e outro para 133 MHz. Um método ainda melhor, e que é realmente aplicado na prática, é utilizar um gerador de clock programável. Figura 4.26 Gerador de clock e cristal de referência. A figura 26 mostra um chip gerador de clock. Esses chips sempre trabalham ligados a um cristal que é usado como referência para as freqüências que serão geradas. Eles geram clocks independentes para o processador e para os diversos barramentos usados na placa de CPU. Figura 4.27 Gerador de clock programável. A figura 27 mostra o funcionamento de um gerador de clock. Ele usa um oscilador a cristal como referência. Normalmente o cristal é de 14,31818 MHz, por razões históricas. Este era o cristal usado na geração da freqüência de 4,77 MHz do IBM PC original, e dos 3,58 MHz usados na geração de vídeo composto NTSC, pelas antigas placas de vídeo que eram ligadas a TVs. O clock desejado é gerado por um VCO (oscilador controlado por Capítulo 4 – Arquitetura de um PC 4-51 voltagem). O clock gerado é dividido digitalmente por um número programável n, e o resultado é comparado com a freqüência gerada pelo oscilador a cristal. O resultado da comparação é usado para controlar o VCO. Quando a freqüência do cristal e a freqüência gerada, dividida por n, estão em fase, o VCO ficará estável e manterá a freqüência fixa. Portanto o circuito ficará estável quando: F/n = fcristal Ou seja: F = n x fcristal Programando o valor de n podemos fazer com que o circuito gere qualquer freqüência, múltipla de 14,31818 MHz. Por exemplo, com n=7 temos F=100,22726 MHz O circuito mostrado tem um pequeno inconveniente. Como o valor de n só pode ser um número inteiro, a freqüência gerada será sempre múltipla de 14,31818 MHz. Não seria possível desta forma gerar freqüências como 66 MHz, por exemplo (na verdade os “66 MHz” são 66,666 MHz). Isso pode ser resolvido facilmente, adicionando um divisor na saída do oscilador a cristal. O valor enviado para o comparador de fase não seria 14,31818 MHz, e sim um valor bem menor. Por exemplo, se usamos na saída do oscilador a cristal um divisor 256, teremos: F/n = fcristal/256 F = n x fcristal/256 Se fizermos n=1788 teremos F=100,0035 MHz, valor bem mais próximo dos 100 MHz ideais. Se fizermos n=1192 teremos F=66,669 MHz, valor bem próximo dos 66,666 MHz ideais. Em um chip gerador de clock existem vários circuitos como o da figura 27, sendo um para cada freqüência gerada. Apenas o oscilador a cristal é comum a todos esses circuitos. Como funciona o Reset 4-52 Hardware Total Todas as placas de CPU possuem um circuito de RESET. Este circuito tem como finalidade enviar um sinal RESET para o processador em duas situações: 1) Quando o usuário pressiona o botão RESET do gabinete 2) No instante em que o computador é ligado É necessário gerar um RESET automático quando o computador é ligado (Power on Reset) porque neste instante os bits armazenados no interior do processador e dos demais circuitos têm valores aleatórios. O Reset faz com que todos esses bits sejam preenchidos com valores conhecidos, assim o processador não fica “perdido”. Quando o computador está em uso normal, o capacitor C1 estará carregado com uma tensão igual a Vcc. Seu carregamento foi feito pela corrente que passa pelo resistor R1. O ponto X estará representando um bit 1, e este mesmo bit 1 será enviado ao ponto de saída do circuito. O componente em forma de triângulo é um buffer. Trata-se de um operador lógico que gera na saída um bit igual ao da entrada. Portanto em uso normal o sinal RESET estará com o valor 1. Normalmente o comando de RESET ocorre quando o processador recebe na sua entrada RESET, um bit 0. Figura 4.28 Circuito de RESET. Digamos que o usuário pressiona o botão RESET do gabinete. Isto fará com que o capacitor C1 seja imediatamente descarregado, e a tensão no ponto X será zero volts, o que corresponde a um bit 0. Este bit 0 será transmitido pela saída do circuito, resetando o processador e os demais componentes do computador. Quando o usuário solta o botão Reset, o capacitor C1 será carregado através do resistor R1. O tempo de carregamento do capacitor depende dos valores de R1 e C1. Quanto maiores forem seus valores, maior será o tempo de carga. Durante o carregamento do capacitor, sua tensão atinge um valor que passa a ser considerado como um bit 1, o que irá