Хранение информации. Способы и методы сохранения данных
Содержание:
Хранение информации — что представляет собой система
Особую систему хранения данных организуют, когда не хватает мощностей обычных компьютеров для размещения существенного объема рабочих сведений: баз данных, медиафайлов, архивов, резервных копий. СХД представляет собой комплекс программно-аппаратных инструментов, где носителями выступают структуры, состоящие из жестких дисков и твердотельных накопителей. От стандартной компьютерной памяти система хранения данных отличается усложненной архитектурой, способностью группировать контейнеры для передачи информации в сеть, особым ПО для администрирования СХД и развитыми технологиями, позволяющими копировать, архивировать и виртуализировать данные.
Хранение данных — уровни СХД
Подбирая подходящую систему хранения данных, специалисты ориентируются на ее производительность и задачи, поставленные перед СХД. Например, организация создает СУБД с высокой нагрузкой. Айтишники проводят специальное тестирование, в ходе которого выясняют возможное поведение СХД во время выполнения задач, поставленных системой управления базами данных. Особое внимание уделяется полученным значениям показателей теста. По результатам исследования специалисты делают вывод, подходит ли данная СХД для решения задач, поставленных СУБД.
Так тестируется любая система хранения данных, где айтишники ставят задачу, определяют правила тестирования, готовят и проводят исследование, фиксируют результат и сравнивают его с итогами проверки других СХД. По окончании работ выбирается система, самая оптимальная для выполнения конкретных задач.
Существуют следующие уровни СХД:
- Блочная. Стандартное дисковое хранилище, которое возможно отформатировать, инсталлировать на него операционную систему, разделить на логические диски. Хранение данных организовано в виде блоков, а не файлов. Это делает более скоростным ввод и вывод информации. Показывает высокую производительность при проведении сложных вычислений, хранении значительного количества информации, работе с СУБД и в качестве сред разработки. Среди минусов отмечают нехватку специалистов, способных настроить и обслуживать такую сложную и дорогую СХД. Чаще всего система используется в сетях SAN.
- Файловая. В этой СХД файлы с информацией хранятся в каталогах. Чаще всего систему используют для размещения «холодных» данных, которые не нужны для операционных вычислений. К недостаткам использования относят усложнение иерархии папок и снижение времени отклика и скорости функционирования по мере накопления значительного количества сведений.
- Объектная. Подобная СХД служит для обработки неструктурированных сведений внушительных размеров (их объем измеряется в петабайтах). Сведения размещают в виде особых объектов, которые обладают оригинальными признаками и метаданными. Схожая структура имеется у баз данных. Такую СХД используют для аналитических работ и машинного обучения, размещения объемных медиафайлов, резервных копий, реализации облачного функционала, хостинга интернет-ресурсов. Скорость этой системы при проведении транзакций ниже, чем у блочной.
Особенности систем хранения данных
Учитывая вышесказанное (и другие разнообразные нюансы), специалист определяет тип СХД, который необходим компании. Систему выстраивают в соответствии с одним из 3 вариантов: DAS, NAS и SAN.
DAS
Эта система появилась первой, но показала низкую скорость передачи информации (по сравнению с другими вариациями) и оказалась неспособной предоставить совместный доступ. Подключается напрямую к серверу через высокоскоростной интерфейс, поэтому носит второе название SAS (Server Attached Storage — хранилище, подключенное к серверу). Обладает низкой стоимостью и быстро реагирует на запросы только в пределах работы с одним сервером, посредством которого пользователи реализуют доступ к хранящемуся информационному массиву (в рамках, обозначенных возможностями операционной и файловой систем). Когда server начинает испытывать высокую нагрузку, скорость отклика снижается.
NAS
NAS (Network Attached Storage) — хранилище, соединенное с сетью. Иными словами, файл-сервер, интегрированный в существующую ЛВС. Предоставляет совместный одновременный доступ к общим документам вне зависимости от особенностей операционной и файловой систем. Хранилище легко устанавливать и администрировать, но оно конфликтует с трафиком LAN/WAN. Это — отличный вариант для недорогих серверов, обладающих минимумом функций. Сегодня по типу NAS реализовано большое количество разных вариантов, где за отправную точку взята технология Thin Server.
SAN
SAN (Storage Area Network) — сеть хранения информации. В нее могут быть включены разнообразные хранилища, которые ОС воспринимает как единый сетевой логический диск. SAN размещает информацию по блочному типу. Сегодня производители особо не разделяют NAS и SAN, а создают гибридные решения (на основе протокола iSCSI), позволяющие решить максимум задач.
Фундаментом SAN выступает сеть, отделенная от трафика LAN/WAN. Она предоставляет доступ к хранилищу и отлично справляется с широким потоком запросов, обеспечивая высокий отклик. Системой легко управлять централизованно. Также удобно резервировать сведения, не загружая ЛВС и серверы. Единственный недостаток СХД — высокая стоимость компонентов. Технология SAN достаточно молода, и постоянно совершенствуется в сфере разработки и применения управленческих стандартов и определения путей взаимодействия подсетей.
Как выбрать систему хранения данных
Сначала нужно определить задачи, которые будет решать СХД. Затем обозначить основные параметры системы, и только после этого обращаться к поставщику (интегратору) услуги. Обратите внимание на следующие показатели:
- Тип сведений. Отдельные типы информации обрабатываются на разной скорости с помощью различных технологий. Поэтому СХД для объемных медиаданных будет отличаться от системы, которая взаимодействует с СУБД или неструктурированными сведениями.
- Объем данных. Определяет вид накопителей, которые необходимо использовать. Иногда возможно организовать СХД и на обычном SSD (если скорость отклика не имеет значения, а объем хранящихся данных не превысит 300 Гбайт).
- Отказоустойчивость. Необходимо посчитать, сколько будет стоить потеря информации за конкретный промежуток времени. Это поможет определить важные для функционирования системы показатели — RPO и RTO, и уменьшить расходы на резервное копирование. Первый показывает отрезок времени, за который будет потеряна информация (между моментом выхода СХД из строя и созданием свежей резервной копии). При RPO, равном 10 часов, могут исчезнуть сведения, накопившиеся за эти самые 10 часов, предшествующие аварии хранилища. Показатель выставляют, ориентируясь на стоимость потери конкретного количества информации. С помощью RPO подбирают подходящую программу восстановления данных. RTO показывает срок восстановления доступа к системе. Этот показатель важен, когда необходимо оценить стоимость простоя СХД.
- Производительность. Чтобы правильно оценить производительность СХД, приобретаемую под новый проект, лучше предварительно проконсультироваться с теми, кто уже опробовал систему в аналогичных условиях. Или купить разработку у грамотного поставщика, уже не раз участвовавшего в запуске подобных сервисов. В идеале специалисты конкретной компании должны протестировать систему, чтобы увидеть ее в действии.
- Марка. Многие производители (как бюджетные, так и топовые) предлагают достойные решения. Huawei, Dell EMC, StarWind, NetApp — список можно продолжать. Но, несмотря на разнообразие марок, на одной инфраструктуре желательно использовать продукцию небольшого числа производителей.
Резервное копирование
Отдельно стоит коснуться темы резервного копирования. То, насколько часто система будет делать бэкапы, зависит от определенных задач и необходимого уровня защиты. Размещать основную информацию и резервные копии возможно в СХД, которые расположены в различных странах и материках. Также создают снапшоты, моментальные снимки, позволяющие откатить систему до предыдущей рабочей версии. Для экономии пространства применяют дедупликацию резервных копий — перезаписывают исключительно изменившуюся информацию.
Заключение
У вас остались вопросы по функционированию систем хранения данных? Обращайтесь за консультацией к специалистам «АйТи Спектр» по телефону на сайте или с помощью формы обратной связи под статьей. Мы наладим СХД в вашей организации, а также предоставим услуги по настройке и администрированию сетей.
Мы в организации, когда поняли, что ресурсы нашей блочной СХД заканчиваются, обратились к облачным технологиям. Вместо закупки и настройки нового оборудования мы арендовали у провайдера нужный объем для хранения данных. Когда закончится и эта емкость, дозакажем еще.
Спасибо за понятное изложение критериев выбора нужной СХД. Я понял, на что конкретно обратить внимание в первую очередь при покупке системы. И сделал вывод, что лучше доверить это дело специалистам. Но ваша статья мне помогла понять основные термины, и я теперь смогу более-менее понятно объяснить айтишникам, что именно мне нужно.
Мы в универе как раз одной из последних тем в этом году проходили создание и администрирование SAN. И это действительно интересная тема с широкими возможностями. Мне, как будущему программисту, было интересно разбирать все известные на данный момент вариации и вносить свои правки.
Что означает протокол iSCSI, который вы упомянули в статье?
Это протокол, разработанный специально для того, чтобы устанавливать взаимодействие СХД, серверов и клиентов и управлять ими. Основан на технологии TCP/IP, применяемой для интернета и других сетей (в т. ч. ЛВС).
А насколько безопасно содержать данные в облаке по сравнению с домашним компьютером, защищенным надежным антивирусом?
Во-первых, физическое устройство легко вывести из строя непосредственным воздействием — ударить, уронить, пролить воду и т. д. С облачным ресурсом такие действия исключены. Во-вторых, как бы хорошо вы ни защищали свой компьютер и другие устройства, на облаке применяются повышенные меры безопасности, в т. ч. и шифрование данных. Поэтому, на наш взгляд, содержать информацию в облачных ресурсах гораздо безопаснее.
А что за технология Thin Server?
Thin Server, или тонкий сервер — это компьютер в сети, служащий недорогой заменой стандартного сервера. Он обладает достаточными вычислительными ресурсами, чтобы обеспечить работу сетевых клиентов в небольших ЛВС. Среди предоставляемых тонким сервером услуг — совместный доступ к информации в хранилище, интернету, принтеру.