Sistemas Operativos - Ficheiros - 2016/2017 PDF

Document Details

SpiritedDerivative

Uploaded by SpiritedDerivative

Instituto Politécnico de Portalegre

2016

Valentim Realinho

Tags

sistemas operativos ficheiros computação tecnologia de informação

Summary

This document is a presentation about file systems in operating systems, covering topics such as file names, extensions, content, and implementations. It mentions different file types and how to handle them in programming.

Full Transcript

4. Sistema de Ficheiros Sistemas Operativos Chapter 4 2016/2017 Valentim Realinho Introdução  Problema  Como armazenar grandes quantidades de informação e de forma permanente, num suporte que o permita: disquete, disco, CD, e...

4. Sistema de Ficheiros Sistemas Operativos Chapter 4 2016/2017 Valentim Realinho Introdução  Problema  Como armazenar grandes quantidades de informação e de forma permanente, num suporte que o permita: disquete, disco, CD, etc. ?  Solução  sobrepor à organização física do "meio" (sectores,...) uma organização em "peças" de informação lógica: ficheiros é da responsabilidade do SO criar esta organização lógica 2 Introdução  Sistema de Ficheiros (File System)  A forma como o SO organiza o suporte físico em ficheiros  formatação do disco, localização dos ficheiros no disco,...  Proporciona os mecanismos para o "utilizadores" (programas) lidarem com eles  acesso: criação, leitura/escrita  protecção  buffering... 3 Ficheiros – Nome  Nome - forma de identificação do ficheiro  O primeiro aspecto visível de utilização de um ficheiro  ex: comandos > cp um_ficheiro outro_ficheiro  Dimensão  MS/DOS – tamanho fixo – 8+3 (extensão)  Linux – tamanho variável (limite de 255 caracteres)  Extensão – formal ou informalmente indicia a natureza (ou conteúdo) do ficheiro  Case sensitive – distinguir letras maiúsculas e minúsculas  Unix: case sensitive  Windows : case insensitive (por razões de compatibilidade com versões anteriores e MS/DOS) 4 Ficheiros – Extensão  Extensão  Windows  Extensões têm significado formal no SO  ex: ficheiro.exe – um executável  Pode-se relacionar uma extensão com uma aplicação (registry)  Permite invocar uma aplicação (isto é executar um programa) abrindo um ficheiro com a extensão correspondente  ex: ficheiro.doc => executar programa winword.exe (passando o ficheiro como argumento)  Unix  As extensões são convencionais (tratadas pelo utilizador) e, eventualmente, forçadas pelos programas que tratam determinado tipo de ficheiros  ex: compilador.c.o; 5 Ficheiros – Extensão  Extensões – alguns exemplos .c.cpp.h.java  ficheiros fonte c/c++, java (texto); .o.obj.lib  objecto; livrarias compiladas; (binário); .htm.html.xml  ficheiros com texto marcado para internet (texto); .bmp.jpeg.mp3.mpg  imagens;conteúdos multimédia; (binário); .doc.xls.mdb.ppt  aplicações microsoft windows; (binário) .zip.Z  contentor de outros ficheiros, comprimidos; (binário); 6 Ficheiros – Conteúdo  Conteúdo físico Classificação pelo conteúdo físico do ficheiro, independentemente do conteúdo funcional  Ficheiros de texto  Conteúdo físico:  Sequência de caracteres ASCII, incluindo alguns caracteres especiais: 10 (Line feeder), 13 (Carriage return)  Conteúdo visível directamente:  ex: > cat /etc/passwd  O conteúdo funcional pode ser o mais diverso:  ex: fonte c; script shell; dados xml 7 Ficheiros – Conteúdo  Conteúdo físico  Ficheiros binários  Conteúdo “físico” não interpretável como um conjunto de caracteres ASCII  Não é visível directamente; ex:  > cat /bin/cat; reset  Tratáveis apenas por programas (ou os próprios ficheiros são programas) 8 Ficheiros – Conteúdo  Exemplo: registo de dados em formato de texto e formato binário Resultado: #include ficheiro com 2 bytes int main() { código do caractere '3' e int i = 37; código do caractere '7' FILE *fp = fopen("teste.txt", "w"); fprintf(fp, "%d", i); fclose(fp); } #include Resultado: int main() ficheiro com 4 bytes { int i = 37; representando o número FILE *fp = fopen("teste.txt", "w"); 37 em binário fwrite(&i, sizeof(i), 1 , fp); (numa máquina com inteiros de 32 bit´s) fclose(fp); } 9 Ficheiros – Acesso  Ficheiros de acesso sequencial  Localizar lendo o ficheiro, desde o início até à posição pretendida  Ex: é dado um ficheiro de texto com vários números inteiros, um em cada linha – para obter o 13º número: #include main() { int i, n; FILE *fp = fopen("teste.txt", "r"); for (i=1; i novo_ficheiro ; fopen(..., "w" );  delete – remover um ficheiro  rm antigo.txt; remove(...);  open – abrir um ficheiro para determinada operação  fopen (... , "r");  close – fechar um ficheiro depois de concluído um conjunto de operações  ex: fclose(...);  read – ler o conteúdo de um ficheiro  ex: cat teste ; fgets (...); 13 Ficheiros – Operações  Operações de manipulação de um ficheiro  write – escrever (alterar) o conteúdo de um ficheiro  cat > teste ; fprintf (...);  append – acrescentar ao conteúdo anterior  cat >> teste ; fopen(..., "w+");  seek – posicionamento para acesso directo  fseek (...)  get/set attributes – obter / alterar atributos  chmod ; chmod (...); stat (...);  rename – alterar o nome de um ficheiro  mv.... ; rename (...); 14 Ficheiros – Operações  lock bloqueio de todo / parte do ficheiro: mecanismo de exclusão para acesso simultâneo lock READ (não exclusivo) pode ser feito por vários processos; impede o lock WRITE por um outro processo lock WRITE (exclusivo) impede qualquer outro lock (read ou write) por um outro processo;  memory mapped files mapeamento do ficheiro no espaço de endereçamento do processo; permite o acesso ao ficheiro através de "variáveis"; 15 Directórios  Árvore de directórios e ficheiros  Directórios (nós) – contêm uma lista de outros directórios ou ficheiros (folhas)  Nome do ficheiro – nome único na árvore de ficheiros – caminho desde o directório principal (raiz) até directório onde o ficheiro se encontra  Ou nome relativo – caminho a partir de um directório intermédio ("corrente")  Link – representação do mesmo ficheiro em mais que um directório  soft – referência simbólica para um ficheiro real definido noutro directório  hard – representação do mesmo ficheiro em mais que um directório 16 Discos e partições  Disco: organização típica  A formatação de baixo nível divide o disco em sectores (blocos)  Em cima dessa formatação, o disco é dividido em partições (uma ou mais por disco)  Cada partição pode ter um sistema de ficheiros diferente  Master Boot Record e Partições  O sector 0 do disco contém o MBR e a tabela de partições  MBR – programa de boot ("arranque") do disco  Tabela de partições – lista das partições existentes no disco Tabela de partições Disco MBR Partição 1 Partição 2 17 Discos e partições  Partição: organização típica  Boot block  Programa de arranque do sistema operativo instalado na partição  Super-block  Informação característica do sistema de ficheiros instalado  Tabelas / estruturas de colocação  Informação relativa aos blocos do disco livres/ocupados com ficheiros  Elementos de controlo e gestão próprios de cada sistema de ficheiros  Unix: i-nodes  MS/DOS: FAT  Directórios e ficheiros  Sectores ocupados com os ficheiros e directórios armazenados no disco Boot block Super block Tab. colocação Directórios e ficheiros 18 Implementação do Sistema de Ficheiros  Colocação contígua Armazenamento de cada ficheiro num conjunto de bloco contíguos  Vantagens:  Implementação simples – para cada ficheiro, basta o SO saber o bloco inicial e final (ou nº de blocos)  Eficiente em termos de leitura – sempre bloco contíguos a a a b b b b b b c c d d d d e e f f f f f Ficheiro Início Nº de blocos Partição a 0 3 b 3 6 c 9 2 Tabela de colocação d 11 4 e 15 2 f 17 5 19 Implementação do Sistema de Ficheiros  Desvantagem:  Fragmentação resultante da remoção / criação de novos ficheiros, que só pode ser eliminada com compactação Ex: removeu-se a,c e e; um ficheiro d que ocupa 4 blocos só pode ser colocado após uma compactação... a a a b b b b b b c c d d d d e e f f f f f b b b b b b d d d d f f f f f  Este sistema é útil em CD-ROMs, pois  conhece-se à partida a dimensão de cada ficheiro  não são feitas remoções de ficheiros após a gravação 20 Implementação do Sistema de Ficheiros  Lista ligada de blocos Mantém-se uma lista ligada dos blocos ocupados por cada ficheiro; Em cada bloco, para além dos dados, guarda-se também um apontador para o bloco seguinte do mesmo ficheiro  Vantagens:  Todos os blocos podem ser ocupados (a fragmentação não é problemática)  Ao SO basta saber a localização do 1º bloco. a b a a b a b b 21 Implementação do Sistema de Ficheiros  Desvantagens:  Acesso sequencial – para chegar a um bloco é preciso passar pelos anteriores  Em ficheiros que ocupem muitos blocos espalhados pela partição o acesso aos últimos blocos é demasiado lento  Ex: para aceder ao último bloco de um ficheiro com 1000 blocos – será necessário que sejam lidos os 999 blocos anteriores  O tamanho real de cada bloco é diminuído pelo espaço ocupado pelo apontador 22 Implementação do Sistema de Ficheiros  FAT – File Allocation Table Manter em memória uma tabela com uma representação da lista ligada de blocos. Em cada posição da tabela indica-se o bloco seguinte do ficheiro.  Vantagens  Tal como no modelo anterior, a fragmentação não é problemática  Cada bloco é utilizado integralmente para armazenamento de dados (ao contrário do esquema anterior)  Facilita o acesso directo – para obter um bloco basta percorrer a FAT (mais rápido, pois percorre-se a memória e não o disco)  Desvantagem  A dimensão da FAT pode ser demasiado grande  Ex: 20GB de disco , blocos de 1KB indexados com 4 Bytes  A FAT terá uma dimensão de 80MBytes 23 Implementação do Sistema de Ficheiros  Exemplo: FAT... 10 11 12 13 14 15 16 17 18 19 20...... 10 18 a b a b b c a c 11 13 12 10 13 14 No directório basta guardar o 14 -1 bloco de início de cada ficheiro 15 0 16 0 Ficheiro 1º bloco 17 20 a 12 18 -1 b 11 19 0 c 17 20 -1... “0” representa bloco livre “ –1” representa último bloco do ficheiro 24 Implementação do Sistema de Ficheiros  I-Nodes associar a cada ficheiro uma estrutura de dados contendo a localização em disco e os atributos do ficheiro  O i-node contém um número limitado de blocos do ficheiro  Para ficheiros de maior dimensão são atribuídos ao i-node outros blocos que contém tabelas com nºs de bloco extra  O i-node contém todas as características do ficheiro, excepto o nome que figura no (ou nos) directórios onde o i-node é incluído  Vantagens  A fragmentação não é problemática  Para aceder a um ficheiro basta ter o respectivo i-node em memória (não é necessário dispor de toda uma tabela de alocação)  Facilita a partilha de ficheiros através de hard links 25 Implementação do Sistema de Ficheiros  Exemplo:... 10 11 12 13 14 15 16 17 18 19 20... a b a b b b b b a b b b b I-node de a I-node de b Atributos de a Atributos de b 12 11 Blocos extra 10 13 18 14 20 - 15 21 - 16 - - 17 - - 19 - outros blocos: - outros blocos: - - - 26 Implementação do Sistema de Ficheiros  Implementação dos directórios  Directório  Um directório é basicamente uma lista de nomes, a cada um dos quais se associam os respectivos atributos e localização em disco  O directório é um ficheiro especial  Situações típicas  O directório contém os atributos do ficheiro e a localização do primeiro bloco em disco - a partir do primeiro bloco localizam-se os restantes (ex: lista ligada, FAT,..)  O directório contém o nome do ficheiro e o endereço de uma estrutura que contém os atributos do ficheiro e sua localização do em disco (ex: i-nodes)  Questões de implementação  Lidar com nomes de dimensão variável (fragmentação e compactação nos directórios)  Procurar ficheiros em directórios grandes (utilização de hash-tables e estruturas em árvore) 27 Implementação do Sistema de Ficheiros  Ficheiros partilhados Possibilidade de um mesmo ficheiro figurar em mais que um directório  Hard link (ligação real)  Incluir o mesmo ficheiro em mais que um directório  Replicar em cada directório os atributos e localização no disco  Implementação simples com i-nodes – basta replicar o nº de i-node  Implementação complexa se os atributos estiverem contidos no directório – as alterações têm que ser replicadas em cada ligação  Soft link (ligação simbólica)  Incluir num directório o nome de outro ficheiro que contém o caminho para o ficheiro original  Através do caminho acede-se à entrada de directório do ficheiro original e, por essa via, aos seus atributos e localização em disco 28 Questões de Implementação  Dimensão do bloco (Qual será a melhor dimensão para os blocos ?)  Eficácia de leitura – relação entre o tempo de leitura e a informação efectivamente obtida do disco  Aumenta com a dimensão do bloco  menor overhead de posicionamento em cada leitura  menor número de leituras necessárias para obter os dados  Eficácia de ocupação – relação entre o espaço físico ocupado e o respectivo aproveitamento em termos de dados  Diminui com o aumento da dimensão do bloco  desperdício devido ao ajuste da dimensão do ficheiro para um número fixo de blocos exemplo: um ficheiro de dimensão 1 byte desperdiça o resto da dimensão do bloco 29 Questões de Implementação  Variação da eficácia com a dimensão do bloco Eficácia de armazenamento Eficácia de leitura Dimensão do bloco 30 Questões de Implementação  Controlo da lista de blocos livres estrutura de dados de controlo dos blocos de disco não ocupados por ficheiros  Lista ligada  Lista ligada com o número de cada um dos blocos livres  Criação de um ficheiro:  Obter os primeiros blocos da lista (até à dimensão do ficheiro) e de seguida retirá-los da lista  Remoção de um ficheiro:  Acrescentar os respectivos blocos à lista  Método simples, mas poderá levar a dispersão dos ficheiros por vários blocos não contíguos  A dimensão da lista poderá ser bastante grande se o disco estiver pouco ocupado 31 Questões de Implementação  Bitmap  Sequência com um número de bits igual ao número de blocos  Bit a “0” significa bloco livre  Bit a “1” significa bloco ocupado  Dimensão fixa  Quase sempre uma dimensão menor que na solução com lista (excepto quando disco está quase cheio)  Facilita a procura de blocos contíguos / próximos  Basta procurar 0's contíguos / próximos no bitmap 32 Questões de Implementação  Backup Salvaguarda de segurança  Backup incremental – apenas as alterações desde o backup anterior  Com base no dispositivo físico – backup completo (imagem) de um disco  Com base na organização – backup de parte dos ficheiros  Evitam-se geralmente backups de:  Programas (pois podem-se reinstalar)  Ficheiros que modelizam dispositivos (bloco, caractere)  Consistência Mecanismos de verificação e recuperação da consistência do sistema de ficheiros 33 Questões de Implementação  Caching  Manter em memória blocos mais recentes / maior probabilidade de uso futuro  Leitura antecipada  Leitura e caching, por antecipação, de vários blocos  Armazenamento contíguo  Tentar colocar o ficheiro em blocos de disco contíguos  Reduz-se o tempo de overhead relativo ao posicionamento no disco 34

Use Quizgecko on...
Browser
Browser