Конфигурирование сервера Oracle для сверхбольших баз данных

       

Чередование блоков с распределенным контролем (RAID уровня 5)


RAID 5 подобен RAID 3 за исключение того, что размер сегмента чередования в RAID 5 можно настраивать, а также того, что контрольные блоки распределены по всем дискам в массиве. Сегмент чередования RAID 5 содержит либо данные, либо контрольную информацию. Любой запрос на запись в массиве RAID 5 требует выполнения шести ресурсоемких операций [, Sun (1995)]:

  1. Чтение блока, в который должна производиться запись.
  2. Чтение соответствующего контрольного блока.
  3. Вычет старой составляющей блока данных из контрольного блока.
  4. Добавление новой составляющей блока данных в контрольный блок.
  5. Запись контрольного блока.
  6. Запись блока данных.

Энергонезависимый кэш в значительной мере снижает влияние издержек для операции записи, но его эффективность зависит от многих условий. Пакетные задания, генерирующие большой объем операций записи, могут быстро заполнить кэш, снижая его возможность устранить проблемы, присущие RAID 5.

RAID 5 является очень полезным для снижения стоимости подсистем ввода-вывода при хранении данных, требующих высокую устойчивость к отказам с высоким уровнем операций чтения, но не для часто изменяемых данных. Поскольку RAID 5 имеет крайне низкую производительность при выполнении операции записи, многие опытные проектировщики VLDB занимают негативную позицию по отношению к RAID 5. Для VLDB с интенсивным использованием операции чтения, в которых низкая производительность при восстановлении БД не так важна как стоимость приобретения, массив на основе RAID 5 предлагает приемлемую производительность при много меньшей стоимости чем RAID 1.

  • Производительность при случайном чтении

    — отличная при всех уровнях параллелизма при условии, что каждый запрос на чтение использует один сегмент чередования. Использование слишком малых размеров сегментов чередования может привести к резкому ухудшению производительности при высоком уровне конкуренции.

  • Производительность при случайной записи — плохая. Наихудшая при высоком уровне параллелизма. Цикл чтениеизменение-запись, присущий RAID 5 и необходимый для поддержания контрольной информации делают его на порядок хуже в сравнении с RAID 0. Использование дискового кэша может улучшить ситуацию, если он имеет достаточный размер для обработки необходимого уровня параллелизма.
  • Производительность при последовательном чтении — отличная при малом размере сегмента чередования в средах с низким уровнем параллелизма. Также отличная в средах с высоким уровнем параллелизма при условии, что каждый запрос на чтение попадает в один сегмент чередования. Использование слишком малого размера сегмента чередования может привести к резкому снижению производительности в средах с высоким уровнем параллелизма.
  • Производительность при последовательной записи — удовлетворительная в средах с низким уровнем параллелизма. При высоком уровне параллелизма может быть на порядок хуже, чем у RAID 0. Большие объемы операций записи заполняют дисковый кэш RAID 5, сводя к нулю его возможности по смягчению низкой производительности массива. Как и для последовательного чтения, высокий уровень параллелизма при малом размере сегмента чередования снижает производительность.
  • Частота отказов — хорошая. Выход из строя любого одного диска в массиве не влияет на доступность массива RAID 5 и приложений. Потеря двух дисков приведет к потере данных, которую можно устранить только с помощью восстановления носителя. Следует отметить, что надежность RAID 5 падает с ростом числа дисков в массиве и что потеря надежности может свести к нулю преимущества от невысокой стоимости приобретения. См. .
  • Длительность простоя — хорошая. Продолжительность частичного простоя, связанного с выходом из строя одного диска в массиве равна времени на обнаружение неисправности и времени на замену диска в массиве. Длительность полного простоя, который влечет выход из строя более одного диска в массиве, адаптера, шины или других незащищенных компонент, увеличивается на время необходимое для выполнения процедуры восстановления носителя сервера Oracle.
  • Снижение производительности в течение отказа — удовлетворительное. При чтении данных, располагающихся на неповрежденном диске, снижения производительности не будет. Запись данных на неповрежденный диск требует выполнения цикла чтениеизменение-запись. Чтение и запись данных, которые располагались на поврежденном диске, влечет за собой большие издержки и значительное снижение производительности, поскольку такие операции требуют данных, располагающихся на всех дисках массива. Реконструкция массива при замене диска связана с резким ухудшением производительности в массиве.
  • Стоимость приобретения — удовлетворительная. Стоимость дисковой емкости в g/(g - 1) раз выше, чем стоимость той же емкости для RAID 0, где g — число дисков в массиве, плюс стоимость контроллера RAID 5. Стоимость приобретения RAID 5 всегда выше, чем стоимость RAID 0, но в общем, меньше, чем стоимость RAID 3 и теоретически меньше чем RAID 1 для g > 2.

В реальной жизни, ожидания производительности RAID 5 иногда превышают имеющиеся возможности по конфигурированию. Стоимость анализа и дополнительного оборудования, в итоге, может оказаться даже выше, чем у RAID 0+1.

  • Стоимость обслуживания — удовлетворительная. Для достижения оптимальной производительности требуется обучение конфигурированию массивов с чередованием. Увеличение емкости требует либо закупки дополнительных массивов, либо реконфигурирования существующих.


  • Содержание раздела