П.Н. Афонин. «Информационные таможенные технологии»
Атрибуты файлов. Понятие файл включает в себя не только данные, но и атрибуты. Атрибуты — это информация, описывающая свойства файла (тип, владелец, пароль, информация для авторизации доступа, время создания и доступа, размер, признаки и пр.)
Рис. 12. Структура файловых систем: а — иерархическая; б — сетевая
Набор атрибутов зависит от ОС. Значения атрибутов могут храниться в каталогах (FAT) или в специальных таблицах, ссылки на которые хранятся в каталогах (NTFS).
Физическая организация файловой системы. Представление пользователя о ФС и физическое хранение файлов на диске имеют мало общего. Диск в общем случае состоит из пакета пластин. На каждой пластине — две поверхности. На каждой пластине размечены дорожки, на которых хранятся данные. Дорожки нумеруются с нуля, начиная от края к середине. Для каждой поверхности пластины имеется магнитная головка, которая, перемещаясь, может позиционироваться над каждой дорожкой. Все головки закреплены на одном механизме и перемещаются синхронно. Дорожки одного радиуса на всех поверхностях называются цилиндром. Каждая дорожка делятся на фрагменты, называемые секторами. Чаще размер сектора равен 512 байтам. Сектор — наименьшая адресуемая единица обмена. Для поиска контроллер должен задать: номер цилиндра, поверхности и сектора.
ОС для работы с диском использует собственную единицу — кластер. Размер кластера часто принимают равным 1024 байта. Дорожки и секторы создаются в результате низкоуровневого форматирования диска и не зависят от типа ОС. Диск может быть разделен на логические устройства — разделы (тома): a, b, c, ... Разметку раздела под конкретный тип файловой системы выполняют процедуры логического форматирования. При этом определяется размер кластера и записывается информация о границах файлов и каталогов, поврежденных областях, о доступном пространстве. Также записывается загрузчик ОС. В одном разделе может быть создана только одна ФС, но любого доступного типа (FAT, FAT32, NTFS и пр.).
Основными способами физического размещения файлов на диске являются:
• непрерывное размещение (рис. 13, а);
• связанный список кластеров (рис. 13, б);
• связанный список индексов (рис. 13, в);
• перечень номеров кластеров (рис. 13, г).
Физическая организация FAT. ФС FAT состоит из следующих областей:
• загрузочный сектор — программа загрузки ОС;
• основная копия FAT, резервная копия FAT, переменной длины;
• корневой каталог — содержит 512 записей по 32 байта;
• область данных — кластеры размером от 1 до 128 секторов.
Рис. 13. Способы физического размещения файлов на диске
Размер таблицы FAT и разрядность указателя определяют количество кластеров в области данных (часто по 4 Кбайта).
Индексный указатель в таблице FAT принимает следующие значения: кластер свободен, занят и не последний, занят и последний, дефектный, резервный. Разрядность индексного указателя в таблице FAT определяет название: FAT12, FAT16, FAT32.
ФС FAT распознает два типа файла: файл и каталог. В каталоге хранятся имя и атрибуты файла. Запись в файле-каталоге ссылается на первый индекс файла. Структура файловой системы аналогична варианту, представленному на рис. 13, в.
Физическая организация NTFS. Файловая система NTFS была разработана в качестве основной для Windows NT. Ее особенностями являются поддержка больших файлов и дисков (до 264 Гбайт), восстанавливаемость после сбоев, низкий уровень фрагментации.
Непрерывная область кластеров в NTFS называется отрезком. Порядковый номер кластера тома называется логическим номером кластера (LCN). Порядковый номер кластера внутри файла называется виртуальным номером кластера (VCN).
Часть файла в отрезке характеризуется числом (VCN, LCN, К), где К — длина отрезка. Для хранения номера кластера используются 64-разрядные указатели. Весь том (раздел) — это последовательность кластеров.
Файловая система NTFS представляет собой один и более файлов. Каталог тоже файл. Основа структуры, таблица MFT (Master File Table), это тоже файл. MFT состоит из записей, по умолчанию 2 Кбайта. Порядковый номер записи в MFT — номер файла. Физическая организация NTFS представлена на рис. 14.
Рис. 14. Физическая организация NTFS
Файлы могут быть небольшие — имеют сокращенное количество атрибутов и помещаются в одной записи MFT; большие — перечисляются отрезки, входящие в этот файл; очень большие — используется косвенная адресация на отрезки; сверхбольшие — используется двойная косвенная адресация.
Восстанавливаемость файловой системы NTFS. Восстанавливаемость обеспечивается только для системной информации файловой системы (каталогов, атрибутов безопасности и пр.). Проблемы, связанные с восстановлением файловой системы, тесно связаны с понятием транзакции.
Транзакция — это неделимая работа, т. е. работа, состоящая из подопераций, которая либо полностью выполняется, либо нет. Транзакции, выполненной наполовину, быть не может.
Для обеспечения восстанавливаемости файловой системы, операционная система ведет журнал транзакций. Протоколируются все изменения, т. е. фиксируются все действия по выполнению подопераций транзакций, модифицирующие системные данные. Действия, не модифицирующие данные (чтение, поиск), не протоколируются. Протоколируются все действия, необходимые как для повтора подопераций, так и для отката.
1.4.2. Сравнительный анализ быстродействия файловых систем FAT и NTFS
Особенности структуры организации поиска и хранении информации в автоматизированных информационных таможенных системах определяют эффективность любой файловой системы. Рассмотрим основные процессы, осуществляемые системой для доступа к файлам в FAT и NTFS.
Поиск информации о местоположении файла. Скорость определения местоположения фрагментов файла на диске влияет на скорость навигации по файлу (доступ к произвольному фрагменту файла). Этот параметр показывает, насколько сильно сама файловая система страдает от фрагментации файлов.
NTFS способна обеспечить быстрый поиск фрагментов, поскольку вся информация хранится в нескольких очень компактных записях (типичный размер — несколько килобайт). Если файл очень сильно фрагментирован (содержит большое число фрагментов) — NTFS придется использовать много записей, что часто заставляет хранить их в разных местах.
FAT32 из-за большой области самой таблицы (от сотен килобайт до нескольких мегабайт) размещения будет испытывать трудности, если фрагменты файла разбросаны по всему диску, поскольку для доступа к каждому фрагменту файла в системе придется обращаться к соответствующей части таблицы FAT.
Поиск свободного места. Данная операция производится в том случае, если файл нужно создать или скопировать на диск. Поиск места под физические данные файла зависит от того, как хранится информация о занятых участках диска. Этот параметр показывает, насколько быстро система сможет найти место для записи на диск новых данных.
Определение того, свободен данный кластер или нет, требует от системы на основе FAT просмотра одной записи FAT, соответствующей этому кластеру. Размер одной записи FAT32 — 32 бита. Для поиска свободного места на диске может потребоваться просмотр почти всей FAT, что может оказаться весьма длительным процессом.
NTFS имеет битовую карту свободного места, одному кластеру соответствует 1 бит. Для поиска свободного места на диске приходится оценивать объемы в десятки раз меньшие, чем в системах FAT и FAT32. Таким образом, NTFS имеет наиболее эффективную систему нахождения свободного места.
Работа с каталогами и файлами. Скорость выполнения различных файловых операций напрямую зависит от принципов организации хранения данных об отдельных файлах и от устройства структур каталогов. Данный параметр может стать критичным для каталогов с большим числом файлов (тысячи).
FAT16 и FAT32 имеют очень компактные каталоги, размер каждой записи которых предельно мал. Более того, благодаря исторически сложившейся системе хранения длинных имен файлов (более 11 символов) в каталогах систем FAT используется очень экономная структура хранения длинных имен. Работа с каталогами FAT производится достаточно быстро, так как в подавляющем числе случаев каталог (файл данных каталога) не фрагментирован и находится на диске в одном месте. Однако система хранения данных в FAT — линейный массив и не позволяет организовать эффективный поиск файлов в слишком перегруженном файлами каталоге (порядка тысячи или более), что приводит для таких каталогов к значительному снижению скорости поиска.
NTFS использует более эффективный способ адресации — бинарное дерево, позволяющее эффективно работать с каталогами любого размера. Поэтому NTFS не страшно увеличение количества файлов в одном каталоге и до десятков тысяч. Однако сам каталог NTFS представляет собой гораздо менее компактную структуру, нежели каталог FAT, — это связано с гораздо большим (в несколько раз) размером одной записи каталога. Поэтому каталоги на томе NTFS в подавляющем числе случаев сильно фрагментированы. Размер типичного каталога на FAT укладывается в один кластер, тогда как сотня файлов (и даже меньше) в каталоге на NTFS уже приводит к размеру файла каталога, превышающему типичный размер одного кластера. Это, в свою очередь, почти гарантирует фрагментацию файла каталога, что довольно часто сводит на нет все преимущества гораздо более эффективной организации самих данных.
< [1] ... [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] ... [66] >>
|