Яков Сироткин (yakov_sirotkin) wrote,
Яков Сироткин
yakov_sirotkin

Базовое

Часто разговор о базах данных ведётся так, как будто мы имеем дело с чёрными ящиками. При этом люди всерьёз спорят, какой ящик надёжней, но не то что никогда не задумывались, сколько времени займёт восстановление из бэкапа, но и никогда не проверяли, могут ли они восстановиться из бэкапа в принципе.

На самом деле данные бывают очень и очень разные: есть первичные данные, есть данные, прошедшие разные этапы обработки, есть агрегированные данные, есть копии только для чтения. Кроме собственно данных, бывают ещё разные индексы: одни ускоряют SQL-запросы, а другие используются для полнотекстового поиска. Иногда данные только читают, иногда только обновляют существующие записи, а иногда только добавляют новые. Данные можно копировать торрентами на много серверов, а можно рубить на несколько частей. Разумеется, с одними и теми же данными могут работать самые разные приложения, которые будут решать разные задачи.

Помимо этого есть ещё вопросы контроля доступа, производительности и отказоустойчивости — для каждой большой системы нужно думать обо всём этом. Даже самая «золотая» по стоимости система не станет серебряной пулей для решения всех вопросов работы с данными. Если вы хотите добиться успеха при работе с большими объёмами данных, необходимо шевелить собственными мозгами, выяснять требования и рассматривать разные варианты решения.
Tags: it
Subscribe
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 8 comments