Sistemas Operativos - Ficheiros - 2016/2017 PDF
Document Details
Uploaded by SpiritedDerivative
Instituto Politécnico de Portalegre
2016
Valentim Realinho
Tags
Summary
This document is a presentation about file systems in operating systems, covering topics such as file names, extensions, content, and implementations. It mentions different file types and how to handle them in programming.
Full Transcript
4. Sistema de Ficheiros Sistemas Operativos Chapter 4 2016/2017 Valentim Realinho Introdução Problema Como armazenar grandes quantidades de informação e de forma permanente, num suporte que o permita: disquete, disco, CD, e...
4. Sistema de Ficheiros Sistemas Operativos Chapter 4 2016/2017 Valentim Realinho Introdução Problema Como armazenar grandes quantidades de informação e de forma permanente, num suporte que o permita: disquete, disco, CD, etc. ? Solução sobrepor à organização física do "meio" (sectores,...) uma organização em "peças" de informação lógica: ficheiros é da responsabilidade do SO criar esta organização lógica 2 Introdução Sistema de Ficheiros (File System) A forma como o SO organiza o suporte físico em ficheiros formatação do disco, localização dos ficheiros no disco,... Proporciona os mecanismos para o "utilizadores" (programas) lidarem com eles acesso: criação, leitura/escrita protecção buffering... 3 Ficheiros – Nome Nome - forma de identificação do ficheiro O primeiro aspecto visível de utilização de um ficheiro ex: comandos > cp um_ficheiro outro_ficheiro Dimensão MS/DOS – tamanho fixo – 8+3 (extensão) Linux – tamanho variável (limite de 255 caracteres) Extensão – formal ou informalmente indicia a natureza (ou conteúdo) do ficheiro Case sensitive – distinguir letras maiúsculas e minúsculas Unix: case sensitive Windows : case insensitive (por razões de compatibilidade com versões anteriores e MS/DOS) 4 Ficheiros – Extensão Extensão Windows Extensões têm significado formal no SO ex: ficheiro.exe – um executável Pode-se relacionar uma extensão com uma aplicação (registry) Permite invocar uma aplicação (isto é executar um programa) abrindo um ficheiro com a extensão correspondente ex: ficheiro.doc => executar programa winword.exe (passando o ficheiro como argumento) Unix As extensões são convencionais (tratadas pelo utilizador) e, eventualmente, forçadas pelos programas que tratam determinado tipo de ficheiros ex: compilador.c.o; 5 Ficheiros – Extensão Extensões – alguns exemplos .c.cpp.h.java ficheiros fonte c/c++, java (texto); .o.obj.lib objecto; livrarias compiladas; (binário); .htm.html.xml ficheiros com texto marcado para internet (texto); .bmp.jpeg.mp3.mpg imagens;conteúdos multimédia; (binário); .doc.xls.mdb.ppt aplicações microsoft windows; (binário) .zip.Z contentor de outros ficheiros, comprimidos; (binário); 6 Ficheiros – Conteúdo Conteúdo físico Classificação pelo conteúdo físico do ficheiro, independentemente do conteúdo funcional Ficheiros de texto Conteúdo físico: Sequência de caracteres ASCII, incluindo alguns caracteres especiais: 10 (Line feeder), 13 (Carriage return) Conteúdo visível directamente: ex: > cat /etc/passwd O conteúdo funcional pode ser o mais diverso: ex: fonte c; script shell; dados xml 7 Ficheiros – Conteúdo Conteúdo físico Ficheiros binários Conteúdo “físico” não interpretável como um conjunto de caracteres ASCII Não é visível directamente; ex: > cat /bin/cat; reset Tratáveis apenas por programas (ou os próprios ficheiros são programas) 8 Ficheiros – Conteúdo Exemplo: registo de dados em formato de texto e formato binário Resultado: #include ficheiro com 2 bytes int main() { código do caractere '3' e int i = 37; código do caractere '7' FILE *fp = fopen("teste.txt", "w"); fprintf(fp, "%d", i); fclose(fp); } #include Resultado: int main() ficheiro com 4 bytes { int i = 37; representando o número FILE *fp = fopen("teste.txt", "w"); 37 em binário fwrite(&i, sizeof(i), 1 , fp); (numa máquina com inteiros de 32 bit´s) fclose(fp); } 9 Ficheiros – Acesso Ficheiros de acesso sequencial Localizar lendo o ficheiro, desde o início até à posição pretendida Ex: é dado um ficheiro de texto com vários números inteiros, um em cada linha – para obter o 13º número: #include main() { int i, n; FILE *fp = fopen("teste.txt", "r"); for (i=1; i novo_ficheiro ; fopen(..., "w" ); delete – remover um ficheiro rm antigo.txt; remove(...); open – abrir um ficheiro para determinada operação fopen (... , "r"); close – fechar um ficheiro depois de concluído um conjunto de operações ex: fclose(...); read – ler o conteúdo de um ficheiro ex: cat teste ; fgets (...); 13 Ficheiros – Operações Operações de manipulação de um ficheiro write – escrever (alterar) o conteúdo de um ficheiro cat > teste ; fprintf (...); append – acrescentar ao conteúdo anterior cat >> teste ; fopen(..., "w+"); seek – posicionamento para acesso directo fseek (...) get/set attributes – obter / alterar atributos chmod ; chmod (...); stat (...); rename – alterar o nome de um ficheiro mv.... ; rename (...); 14 Ficheiros – Operações lock bloqueio de todo / parte do ficheiro: mecanismo de exclusão para acesso simultâneo lock READ (não exclusivo) pode ser feito por vários processos; impede o lock WRITE por um outro processo lock WRITE (exclusivo) impede qualquer outro lock (read ou write) por um outro processo; memory mapped files mapeamento do ficheiro no espaço de endereçamento do processo; permite o acesso ao ficheiro através de "variáveis"; 15 Directórios Árvore de directórios e ficheiros Directórios (nós) – contêm uma lista de outros directórios ou ficheiros (folhas) Nome do ficheiro – nome único na árvore de ficheiros – caminho desde o directório principal (raiz) até directório onde o ficheiro se encontra Ou nome relativo – caminho a partir de um directório intermédio ("corrente") Link – representação do mesmo ficheiro em mais que um directório soft – referência simbólica para um ficheiro real definido noutro directório hard – representação do mesmo ficheiro em mais que um directório 16 Discos e partições Disco: organização típica A formatação de baixo nível divide o disco em sectores (blocos) Em cima dessa formatação, o disco é dividido em partições (uma ou mais por disco) Cada partição pode ter um sistema de ficheiros diferente Master Boot Record e Partições O sector 0 do disco contém o MBR e a tabela de partições MBR – programa de boot ("arranque") do disco Tabela de partições – lista das partições existentes no disco Tabela de partições Disco MBR Partição 1 Partição 2 17 Discos e partições Partição: organização típica Boot block Programa de arranque do sistema operativo instalado na partição Super-block Informação característica do sistema de ficheiros instalado Tabelas / estruturas de colocação Informação relativa aos blocos do disco livres/ocupados com ficheiros Elementos de controlo e gestão próprios de cada sistema de ficheiros Unix: i-nodes MS/DOS: FAT Directórios e ficheiros Sectores ocupados com os ficheiros e directórios armazenados no disco Boot block Super block Tab. colocação Directórios e ficheiros 18 Implementação do Sistema de Ficheiros Colocação contígua Armazenamento de cada ficheiro num conjunto de bloco contíguos Vantagens: Implementação simples – para cada ficheiro, basta o SO saber o bloco inicial e final (ou nº de blocos) Eficiente em termos de leitura – sempre bloco contíguos a a a b b b b b b c c d d d d e e f f f f f Ficheiro Início Nº de blocos Partição a 0 3 b 3 6 c 9 2 Tabela de colocação d 11 4 e 15 2 f 17 5 19 Implementação do Sistema de Ficheiros Desvantagem: Fragmentação resultante da remoção / criação de novos ficheiros, que só pode ser eliminada com compactação Ex: removeu-se a,c e e; um ficheiro d que ocupa 4 blocos só pode ser colocado após uma compactação... a a a b b b b b b c c d d d d e e f f f f f b b b b b b d d d d f f f f f Este sistema é útil em CD-ROMs, pois conhece-se à partida a dimensão de cada ficheiro não são feitas remoções de ficheiros após a gravação 20 Implementação do Sistema de Ficheiros Lista ligada de blocos Mantém-se uma lista ligada dos blocos ocupados por cada ficheiro; Em cada bloco, para além dos dados, guarda-se também um apontador para o bloco seguinte do mesmo ficheiro Vantagens: Todos os blocos podem ser ocupados (a fragmentação não é problemática) Ao SO basta saber a localização do 1º bloco. a b a a b a b b 21 Implementação do Sistema de Ficheiros Desvantagens: Acesso sequencial – para chegar a um bloco é preciso passar pelos anteriores Em ficheiros que ocupem muitos blocos espalhados pela partição o acesso aos últimos blocos é demasiado lento Ex: para aceder ao último bloco de um ficheiro com 1000 blocos – será necessário que sejam lidos os 999 blocos anteriores O tamanho real de cada bloco é diminuído pelo espaço ocupado pelo apontador 22 Implementação do Sistema de Ficheiros FAT – File Allocation Table Manter em memória uma tabela com uma representação da lista ligada de blocos. Em cada posição da tabela indica-se o bloco seguinte do ficheiro. Vantagens Tal como no modelo anterior, a fragmentação não é problemática Cada bloco é utilizado integralmente para armazenamento de dados (ao contrário do esquema anterior) Facilita o acesso directo – para obter um bloco basta percorrer a FAT (mais rápido, pois percorre-se a memória e não o disco) Desvantagem A dimensão da FAT pode ser demasiado grande Ex: 20GB de disco , blocos de 1KB indexados com 4 Bytes A FAT terá uma dimensão de 80MBytes 23 Implementação do Sistema de Ficheiros Exemplo: FAT... 10 11 12 13 14 15 16 17 18 19 20...... 10 18 a b a b b c a c 11 13 12 10 13 14 No directório basta guardar o 14 -1 bloco de início de cada ficheiro 15 0 16 0 Ficheiro 1º bloco 17 20 a 12 18 -1 b 11 19 0 c 17 20 -1... “0” representa bloco livre “ –1” representa último bloco do ficheiro 24 Implementação do Sistema de Ficheiros I-Nodes associar a cada ficheiro uma estrutura de dados contendo a localização em disco e os atributos do ficheiro O i-node contém um número limitado de blocos do ficheiro Para ficheiros de maior dimensão são atribuídos ao i-node outros blocos que contém tabelas com nºs de bloco extra O i-node contém todas as características do ficheiro, excepto o nome que figura no (ou nos) directórios onde o i-node é incluído Vantagens A fragmentação não é problemática Para aceder a um ficheiro basta ter o respectivo i-node em memória (não é necessário dispor de toda uma tabela de alocação) Facilita a partilha de ficheiros através de hard links 25 Implementação do Sistema de Ficheiros Exemplo:... 10 11 12 13 14 15 16 17 18 19 20... a b a b b b b b a b b b b I-node de a I-node de b Atributos de a Atributos de b 12 11 Blocos extra 10 13 18 14 20 - 15 21 - 16 - - 17 - - 19 - outros blocos: - outros blocos: - - - 26 Implementação do Sistema de Ficheiros Implementação dos directórios Directório Um directório é basicamente uma lista de nomes, a cada um dos quais se associam os respectivos atributos e localização em disco O directório é um ficheiro especial Situações típicas O directório contém os atributos do ficheiro e a localização do primeiro bloco em disco - a partir do primeiro bloco localizam-se os restantes (ex: lista ligada, FAT,..) O directório contém o nome do ficheiro e o endereço de uma estrutura que contém os atributos do ficheiro e sua localização do em disco (ex: i-nodes) Questões de implementação Lidar com nomes de dimensão variável (fragmentação e compactação nos directórios) Procurar ficheiros em directórios grandes (utilização de hash-tables e estruturas em árvore) 27 Implementação do Sistema de Ficheiros Ficheiros partilhados Possibilidade de um mesmo ficheiro figurar em mais que um directório Hard link (ligação real) Incluir o mesmo ficheiro em mais que um directório Replicar em cada directório os atributos e localização no disco Implementação simples com i-nodes – basta replicar o nº de i-node Implementação complexa se os atributos estiverem contidos no directório – as alterações têm que ser replicadas em cada ligação Soft link (ligação simbólica) Incluir num directório o nome de outro ficheiro que contém o caminho para o ficheiro original Através do caminho acede-se à entrada de directório do ficheiro original e, por essa via, aos seus atributos e localização em disco 28 Questões de Implementação Dimensão do bloco (Qual será a melhor dimensão para os blocos ?) Eficácia de leitura – relação entre o tempo de leitura e a informação efectivamente obtida do disco Aumenta com a dimensão do bloco menor overhead de posicionamento em cada leitura menor número de leituras necessárias para obter os dados Eficácia de ocupação – relação entre o espaço físico ocupado e o respectivo aproveitamento em termos de dados Diminui com o aumento da dimensão do bloco desperdício devido ao ajuste da dimensão do ficheiro para um número fixo de blocos exemplo: um ficheiro de dimensão 1 byte desperdiça o resto da dimensão do bloco 29 Questões de Implementação Variação da eficácia com a dimensão do bloco Eficácia de armazenamento Eficácia de leitura Dimensão do bloco 30 Questões de Implementação Controlo da lista de blocos livres estrutura de dados de controlo dos blocos de disco não ocupados por ficheiros Lista ligada Lista ligada com o número de cada um dos blocos livres Criação de um ficheiro: Obter os primeiros blocos da lista (até à dimensão do ficheiro) e de seguida retirá-los da lista Remoção de um ficheiro: Acrescentar os respectivos blocos à lista Método simples, mas poderá levar a dispersão dos ficheiros por vários blocos não contíguos A dimensão da lista poderá ser bastante grande se o disco estiver pouco ocupado 31 Questões de Implementação Bitmap Sequência com um número de bits igual ao número de blocos Bit a “0” significa bloco livre Bit a “1” significa bloco ocupado Dimensão fixa Quase sempre uma dimensão menor que na solução com lista (excepto quando disco está quase cheio) Facilita a procura de blocos contíguos / próximos Basta procurar 0's contíguos / próximos no bitmap 32 Questões de Implementação Backup Salvaguarda de segurança Backup incremental – apenas as alterações desde o backup anterior Com base no dispositivo físico – backup completo (imagem) de um disco Com base na organização – backup de parte dos ficheiros Evitam-se geralmente backups de: Programas (pois podem-se reinstalar) Ficheiros que modelizam dispositivos (bloco, caractere) Consistência Mecanismos de verificação e recuperação da consistência do sistema de ficheiros 33 Questões de Implementação Caching Manter em memória blocos mais recentes / maior probabilidade de uso futuro Leitura antecipada Leitura e caching, por antecipação, de vários blocos Armazenamento contíguo Tentar colocar o ficheiro em blocos de disco contíguos Reduz-se o tempo de overhead relativo ao posicionamento no disco 34