Что такое СХД
СХД (Система Хранения Данных или Сервер для Хранения Данных) — представляет собой важный элемент в мире информационных технологий. Это физическое устройство, специально разработанное для хранения, обработки и управления большими объемами данных.СХД находят широкое применение в сферах:
• резервное копирование,
• видеонаблюдение,
• документооборот внутри одной компании,
• системы управления базами данных и др.
Архитектура хранения данных представляет собой важный аспект в области информационных технологий.
Существует несколько популярных типов систем хранения данных (СХД), каждый из которых имеет свою специфику.
Три основных типа СХД включают:
• блочные,
• файловые
• объектные хранилища.
Принцип работы инфраструктуры, а также плюсы и минусы каждого типа СХД.
Блочная СХД
Блочная система хранения данных, как следует из названия, разделяет данные на блоки одинакового объема. В отличие от файловой системы, где хранятся целые файлы, в блочной СХД данные хранятся в виде частей информации, называемых чанками. Чанк представляет собой наибольшую единицу дискового пространства сервера, выделенную для хранения данных. Размер чанка зависит от типа физического диска (например, SSD или HDD) и настроек операционной системы сервера. Каждый чанк хранится в отдельном блоке, что обеспечивает эффективное управление данными.
Как происходит работа блочной системы хранения данных?
Система присваивает числовые идентификаторы каждому блоку данных и использует их, когда нужно предоставить информацию.
Алгоритм запроса данных выглядит так:
- Клиент (чаще всего клиентом называют браузер) отправляет запрос серверу.
- Сервер принимает запрос и ищет блок информации, которую нужно передать в ответе.
- Сервер обращается к блоку по идентификатору и «достает» из него информацию, которую нужно передать в ответе.
- Сервер отдает ответ браузеру.
Блочная организация СХД обладает рядом преимуществ:
1. Высокая производительность. Блочная СХД обеспечивает быстродействие, что позволяет эффективно работать с данными, требующими аппаратных вычислений.
2. Гибкая настройка. При увеличении объема данных можно легко добавлять новые тома с блоками без потери производительности, что делает систему масштабируемой.
3. Легкость редактирования файлов. При редактировании файла перезаписываются только те чанки, которые были изменены, что помогает избежать потери быстродействия и ускоряет процесс обновления данных.
4. Простота управления доступом к информации. Блочные СХД позволяют настроить любые виды доступа к данным.
Блочные устройства, несмотря на свою эффективность, обладают несколькими значительными недостатками, на которые необходимо обратить внимание при выборе хранилища данных:
• строгая зависимость от конкретного сервера. Блочная СХД не разрешает доступ с другого сервера. Это ограничение можно обойти с помощью ПО, но тогда увеличится нагрузка на хранилище;
• ограниченное количество метаданных, то есть информации о типе файлов и их характеристиках. Это влияет на работу приложений, которые требовательны к метаданным;
• высокая стоимость в сравнении с другими типами СХД. Это может стать серьезным фактором при принятии решения о выборе оптимального варианта хранилища для конкретных задач и бюджета компании.
Файловая СХД
Файловые устройства, которые используются для хранения информации, имеют много общего с тем, как операционная система отображается на компьютере.
Как и в блочной СХД, в файловой системе каждому файлу присваивается идентификатор. Он включает в себя:
• имя сервера, на котором расположен файл,
• путь к файлу от корневой директории сервера,
• имя файла.
Файловая система с хранением данных (СХД) представляет собой важный компонент компьютерной системы, который обеспечивает организацию и управление файлами. Одним из принципиальных отличий файловой СХД является ее структура, основанная на директориях, которые играют ключевую роль в определении доступа к файлам.
Остановимся на них подробнее:
Первый тип - одноуровневые директории.
Это папки, расположенные на одном уровне вложенности друг с другом. В таких директориях файлы доступны всем пользователям, но существует ограничение: в разных учетных записях нельзя хранить файлы с одинаковыми названиями. Это обеспечивает уникальность файлов и предотвращает конфликты при обращении к ним.
Второй тип - двухуровневые директории.
Здесь подпапки вложены в корневую директорию, что позволяет организовать индивидуальный доступ к файлам. Важно отметить, что в двухуровневых директориях можно хранить файлы с одинаковыми названиями в разных учетных записях, что дает больше гибкости при управлении данными.
Третий тип - древообразная модель.
Она представляет собой папки с несколькими уровнями вложенности, объединяющие функционал одноуровневых и двухуровневых директорий. Такая структура позволяет эффективно организовывать и структурировать данные, обеспечивая как общий доступ к файлам, так и индивидуальное управление ими.
Преимущества файловая СХД:
• максимально простой функционал, который максимально приближен к интерфейсу графической операционной системы, что делает работу с данными более интуитивно понятной;
• функция поиска, которая обеспечивает возможность быстро находить нужный файл независимо от его уровня вложенности;
• низкая цена относительно других типов СХД, делает их более доступными для широкого круга пользователей.
Однако, стоит отметить, что у файловых систем хранения данных есть и свои недостатки.
Основной недостаток ФСХД заключается в их ограниченном масштабировании. С увеличением количества файлов в системе возрастает вероятность замедления отклика сервера. Это может привести к снижению производительности и эффективности работы системы в целом, особенно при работе с большим объемом данных.
Объектная СХД
Объектная СХД представляет собой тип хранилища данных, специально предназначенного для хранения неструктурированных данных. В отличие от традиционных реляционных баз данных, данные в объектной СХД организованы в виде объектов, каждый из которых имеет уникальный идентификатор и подробные метаданные. Это обеспечивает более эффективный и удобный поиск и доступ к данным.
Одним из ключевых преимуществ объектной СХД является ее практически неограниченная масштабируемость. Это означает, что такое хранилище можно легко масштабировать в зависимости от объема данных, что делает его идеальным выбором для хранения и обработки больших объемов информации.
Виды сетевого доступа к хранилищу
Для эффективной работы СХД (систем хранения данных) необходимо учитывать не только архитектуру дискового пространства, но и метод доступа к нему через сеть.
Существует три основных технологии сетевого доступа:
• NAS,
• SAN,
• DAS.
Ниже подробно рассмотрим каждый тип сетевого доступа к хранилищу.
NAS
Network Attached Storage (NAS) переводится с английского как «сетевое хранилище». Представляет собой устройство хранения данных, подключенное к сети и доступное пользователям по протоколам файловой системы, таким как NFS или SMB. Это удобный способ обмена файлами в домашних сетях или небольших офисах.
Как это работает? Например.
Предположим, что у вас есть компьютер, смартфон и WiFi-роутер. Для выхода в интернет с каждого из устройств вы используете один и тот же роутер. В этот момент компьютер, смартфон и WiFi-роутер становятся частями одной виртуальной сети.
Сервер NAS состоит из большого количества дисков, которые объединены в RAID-массив — единый модуль. В свою очередь этот массив — часть сети, которая работает по заданным правилам и протоколам, например:
• SMB/CIFS,
• NFS,
• FTP,
• SFTP,
• HTTP,
• WebDAV,
• DC и др.
На практике эта сеть может быть реализована по-разному. К серверу могут быть подключены другие серверы (физические или виртуальные), а также дисковые станции — устройства, которые помогают увеличить объем за счет съемных жестких дисков.
SAN
Storage Area Network (SAN) — это высокоскоростная сеть, предназначенная для обеспечения прямого доступа к блочным устройствам хранения. SAN используется в крупных предприятиях, где требуется высокая производительность и надежность хранения данных.
DAS
Direct Attach Storage (DAS) — подразумевает прямое подключение устройства хранения к серверу. Это наиболее простой способ организации хранения данных, но он ограничен масштабируемостью и гибкостью. Кроме того, существует технология объединения NAS и SAN, называемая Unified Storage, которая позволяет использовать одну систему для обоих типов доступа. NAS обеспечивает простоту в управлении и распространен в малых офисах, где важна легкая настройка и доступ к общим файлам. SAN, в свою очередь, обеспечивает высокую производительность и масштабируемость, что делает его предпочтительным для крупных корпораций.
Важно отметить, что развитие технологий хранения данных постоянно продвигается вперед, приводя к появлению новых концепций, таких как хранилища данных в облаке, программно-определяемое хранилище (Software-Defined Storage) и технологии хранения данных на основе смешанных (гибридных) облаков.
Эти инновации расширяют возможности хранения и обработки данных, делая их более гибкими, масштабируемыми и доступными для широкого круга пользователей.
Таким образом, системы хранения данных играют ключевую роль в современных информационных технологиях, обеспечивая эффективное управление и обработку информации, необходимую для успешного функционирования бизнеса и других организаций.