Нормализация это: Page not found – Курсы Big Data, Hadoop, Arenadata, Kafka и Spark
alexxlab | 05.05.1974 | 0 | Разное
НОРМАЛИЗАЦИЯ – это… Что такое НОРМАЛИЗАЦИЯ?
Нормализация — У этого термина существуют и другие значения, см. Нормализация (значения). Нормализация (в звукозаписи) это процесс выравнивания частотных характеристик при студийной звукозаписи на магнитный носитель. Коррекция необходима, поскольку… … Википедия
нормализация — стандартизация; упорядочение, утрясание, улаживание, налаживание Словарь русских синонимов. нормализация см. налаживание Словарь синонимов русского языка. Практический справочник. М.: Русский язык. З. Е. Алекса … Словарь синонимов
НОРМАЛИЗАЦИЯ — (франц. normalisation упорядочение от normal правильный, положенный), вид термической обработки стали, заключающийся в нагреве (выше верхней критической точки), выдержке и охлаждении на воздухе. Цель придание металлу однородной мелкозернистой… … Большой Энциклопедический словарь
Нормализация — определение доходов и расходов, характерных для нормально действующего бизнеса; исключает единовременные доходы и расходы, превышающие среднеотраслевые значения … Словарь терминов антикризисного управления
НОРМАЛИЗАЦИЯ — НОРМАЛИЗАЦИЯ, нормализации, мн. нет, жен. (книжн.). Действие по гл. нормализовать. Толковый словарь Ушакова. Д.Н. Ушаков. 1935 1940 … Толковый словарь Ушакова
нормализация — НОРМАЛИЗОВАТЬ, зую, зуешь; ованный; сов. и несов., что. Подчинить ( нять) норме. Н. орфографию. Н. отношения. Толковый словарь Ожегова. С.И. Ожегов, Н.Ю. Шведова. 1949 1992 … Толковый словарь Ожегова
НОРМАЛИЗАЦИЯ — (от лат. norma упорядоченный, правильный, урегулированный) англ. normalization; нем. Normalisierung. 1. Установление нормы, образца. 2. Приведение в нормальное состояние, в соответствие с принятой нормой; урегулирование. 3. В статистике… … Энциклопедия социологии
нормализация — и, ж. normalisation f. 1. Упорядочение, приведение в норму. Ож. 1936. Беру любой газетный лист и читаю: в целях нормализации партстроительства комячейка призывает к интенсификации партработы. 1922. Горнфельд Новые словечки 4. Торможение процессов … Исторический словарь галлицизмов русского языка
нормализация — 1. Установление нормы, образца. 2. Урегулирование, приведение к норме, нормальному состоянию. 3. То же, что стандартизация. Словарь практического психолога. М.: АСТ, Харвест. С. Ю. Головин. 1998 … Большая психологическая энциклопедия
нормализация — Метод группирования данных, позволяющий не хранить повторяющиеся группы данных и избежать их избыточности. [http://www.morepc.ru/dict/] Тематики информационные технологии в целом EN normalisation … Справочник технического переводчика
НОРМАЛИЗАЦИЯ — вид термической обработки стали, заключающийся в нагревании до закалочных температур с последующим охлаждением на воздухе. Н. приводит к получению мелкозернистой стали с однородной структурой, повышению прочности, пластичности и ударной вязкости … Большая политехническая энциклопедия
нормализация – это… Что такое нормализация?
Нормализация — У этого термина существуют и другие значения, см. Нормализация (значения). Нормализация (в звукозаписи) это процесс выравнивания частотных характеристик при студийной звукозаписи на магнитный носитель. Коррекция необходима, поскольку… … Википедия
нормализация — стандартизация; упорядочение, утрясание, улаживание, налаживание Словарь русских синонимов. нормализация см. налаживание Словарь синонимов русского языка. Практический справочник. М.: Русский язык. З. Е. Алекса … Словарь синонимов
НОРМАЛИЗАЦИЯ — (франц. normalisation упорядочение от normal правильный, положенный), вид термической обработки стали, заключающийся в нагреве (выше верхней критической точки), выдержке и охлаждении на воздухе. Цель придание металлу однородной мелкозернистой… … Большой Энциклопедический словарь
Нормализация — определение доходов и расходов, характерных для нормально действующего бизнеса; исключает единовременные доходы и расходы, превышающие среднеотраслевые значения … Словарь терминов антикризисного управления
НОРМАЛИЗАЦИЯ — НОРМАЛИЗАЦИЯ, нормализации, мн. нет, жен. (книжн.). Действие по гл. нормализовать. Толковый словарь Ушакова. Д.Н. Ушаков. 1935 1940 … Толковый словарь Ушакова
нормализация — НОРМАЛИЗОВАТЬ, зую, зуешь; ованный; сов. и несов., что. Подчинить ( нять) норме. Н. орфографию. Н. отношения. Толковый словарь Ожегова. С.И. Ожегов, Н.Ю. Шведова. 1949 1992 … Толковый словарь Ожегова
НОРМАЛИЗАЦИЯ — (от лат. norma упорядоченный, правильный, урегулированный) англ. normalization; нем. Normalisierung. 1. Установление нормы, образца. 2. Приведение в нормальное состояние, в соответствие с принятой нормой; урегулирование. 3. В статистике… … Энциклопедия социологии
нормализация — и, ж. normalisation f. 1. Упорядочение, приведение в норму. Ож. 1936. Беру любой газетный лист и читаю: в целях нормализации партстроительства комячейка призывает к интенсификации партработы. 1922. Горнфельд Новые словечки 4. Торможение процессов … Исторический словарь галлицизмов русского языка
нормализация — 1. Установление нормы, образца. 2. Урегулирование, приведение к норме, нормальному состоянию. 3. То же, что стандартизация. Словарь практического психолога. М.: АСТ, Харвест. С. Ю. Головин. 1998 … Большая психологическая энциклопедия
нормализация — Метод группирования данных, позволяющий не хранить повторяющиеся группы данных и избежать их избыточности. [http://www.morepc.ru/dict/] Тематики информационные технологии в целом EN normalisation … Справочник технического переводчика
НОРМАЛИЗАЦИЯ — вид термической обработки стали, заключающийся в нагревании до закалочных температур с последующим охлаждением на воздухе. Н. приводит к получению мелкозернистой стали с однородной структурой, повышению прочности, пластичности и ударной вязкости … Большая политехническая энциклопедия
режимы и назначение термической обработки
Нормализация (нормализационный отжиг) углеродистой стали – термическая операция, после которой устраняются крупнозернистые элементы и неровности в структуре металла, появляющиеся в результате литья, прокатки, ковки, штамповки, снижаются внутренние напряжения.
Режимы нормализации стали
Этот вид термообработки подразумевает:
- нагрев до температур аустенитного состояния, которые несколько ниже температуры закалки;
- непродолжительную выдержку при этой температуре;
- охлаждение на воздухе.
Определение! Характеристики нормализованных горячекатаных полуфабрикатов во многом зависят от сечения. Чем меньше размер сечения, тем меньше время охлаждения и тем выше прочностные характеристики.
Отличия нормализации от классического полного отжига:
- охлаждение происходит не в печи, а на воздухе;
- экономичность, поскольку на нормализацию затрачивается меньше времени и финансов, по сравнению с отжигом;
- обеспечение полной рекристаллизации, что становится причиной появления благоприятной мелкозернистой структуры, более высокой прочности, твердости и ударной вязкости.
Внимание! С увеличением содержания углерода разница между характеристиками нормализованной и отожженной стали увеличивается. Для марок, содержащих до 0,2% C, предпочтительнее более экономичная нормализация. Для средне- и высокоуглеродистых марок твердость нормализованных сталей гораздо выше отожженных, поэтому в данном случае эти две термические операции не всегда взаимозаменяемы.
Назначение термической обработки
Цель термообработки определяется химическим составом металла и способом его предыдущей обработки.
- Для легированных сталей проводят нормализацию в сочетании с высоким отпуском при температурах 650-750°C. Совокупность этих двух операций более эффективна для улучшения структуры металла, по сравнению с полным отжигом. Если отпуск не производить, то твердость после нагрева будет слишком высокой, что затруднит резание.
- Для низкоуглеродистых сталей нормализация заменяет отжиг, обеспечивая мелкозернистую структуру, повышенную твердость и производительность при резании, хорошую чистоту реза. Также эта технология используется вместо закалки, проведение которой для стали с низким содержанием углерода исключено.
- Нормализованное состояние средне- и высокоуглеродистых сталей отличается более высокой твердостью и прочностью, по сравнению с отожженным.
- Для некоторых легированных сталей охлаждение на воздухе заменяет закалку.
- Проведение этой термической операции для сталей после горячей прокатки повышает их сопротивляемость хрупкому разрушению.
- Для отливок из сталей со средним содержанием углерода нормализация является адекватной альтернативой закалке с высоким отпуском. Механические характеристики несколько ниже, по сравнению с закалкой, но степень деформации значительно меньше, вероятность появления трещин сводится к минимуму.
Нормализация стали: процесс, температура, режимы, время
Металл, используемый в производстве высокотехнологичных конструкций и деталей, чаще всего должен быть однородным и мелкозернистым. Такие стали обладают более высокими механическими характеристиками по сравнению с материалом крупнозернистой структуры. Для получения требуемых механических свойств, изменения внутреннего строения используется термообработка стали. Она включает множество методов температурного воздействия.
Ключевые понятия – важная терминология
- Диаграмма состояния железо/углерод – график зависимости фазового состояния сплавов железа с углеродом от их химического состава и температуры.
- Мартенсит – пересыщенный твердый раствор углерода в α-железе.
- Цементит – химическое соединение с формулой Fe3С (карбид железа).
- Аустенит – твердый раствор углерода в γ-железе. На диаграмме состояния железо-углерод аустенит появляется выше температуры перлитного превращения (727°С).
- Температура превращения Ас3 – нагрев, при котором заканчивается превращение феррита в аустенит. Для сталей с различным содержанием углерода температура Ас3 отличается.
- Дендритная ликвация – неоднородность химического состава, характерная для сплавов, твердеющих при нормальных условиях.
- Ас, Ar – критические точки температуры фазовых преобразований. Ас – при нагреве, Аr – при охлаждении.
Что такое нормализация стали и зачем она нужна
Нормализация стали (НС) является разновидностью отжига и относится к процессам термической обработки (ТО), при которых сплав нагревается до аустенитного состояния, выдерживается определенное время и охлаждается. В данном случае нагрев происходит до температуры, превышающей критическую точку Ас3 на 30-50°С, при которой металл выдерживается, а затем охлаждается на воздухе.
Для каждого вида сплавов существует свой определенный режим обработки. В ходе процесса:
- устраняются дефекты внутренней структуры;
- повышается прочность;
- понижается порог хладноломкости;
- происходит полная рекристаллизация.
Результат ТО описывается графиком с координатами «температура-время». Для доэвтектоидных (содержание углерода до 0,8%), эвтектоидных (0,8% углерода) и заэвтектоидных (свыше 0,8% углерода) сталей температурный режим нормализации и структурный и фазовый состав после термической обработки будут значительно отличаться.
Нормализация стали используется в таких целях:
- устранение остаточных внутренних напряжений;
- увеличение/снижение прочности, твердости в зависимости от термической и механической истории изделия;
- изменение структурного состава в мелкозернистый в отливках;
- удаление наклепа;
- подготовка к последующему термическому упрочнению (закалке).
В чем суть процесса нормализации стали?
Чтобы понять, для чего нужна нормализация стали, нужно разобраться в технологии. Для выполнения данной обработки используются специализированные участки металлургических и перерабатывающих предприятий, оснащенные термическими печами и другим вспомогательным оборудованием. Здесь металл нагревают до температуры аустенитизации, которая зависит от конкретной марки стали. После необходимой выдержки стальное изделие выгружают с последующим остыванием на спокойном воздухе (иногда может применяться усиленный воздушный обдув).
В прокатных цехах метпредприятий нормализация по такой схеме может быть заменена нормализующей прокаткой, которая осуществляется в потоке стана с использованием тепла нагрева полуфабриката перед деформацией. Такая обработка позволяет получить структуру и свойства стального проката, аналогичные нормализованному состоянию, при гораздо меньших временных и энергетических затратах.
Режимы нормализации стали – температура, время
Ключевыми параметрами любой термической обработки являются:
- температура нагрева – выбирается в зависимости от вида ТО и марки стали, с учетом содержания углерода и основных легирующих элементов;
- время выдержки – время, которое проводит стальное изделие в печи при заданной температуре для равномерного прогрева и протекания структурных и фазовых превращений. Время выбирается, исходя из габаритов изделия, его химического состава и температуры нагрева. Чем толще изделие, выше степень легирования и меньше температура – тем дольше будут протекать фазовые процессы;
- вид, среда и скорость охлаждения оказывают непосредственное влияние на формирование окончательных структуры и механических характеристик. Образцы одной марки стали, нагретые до одной и той же температуры, но охлажденные по разным режимам будут иметь абсолютно разный комплекс свойств.
Температуру нагрева стали под нормализацию выбирают с учетом ее критических точек. Чаще всего для этого используют специальные изотермические и термокинетические диаграммы распада аустенита. Для новых марок стали значения критических температур определяют опытным путем.
Для доэвтектоидных сталей температура нагрева под нормализацию обычно назначается на 30-50°С выше критической точки Ас3. Заэвтектоидные стали нагревают до более низких температур в интервале Ас1-Ас3 (типовой режим – Ас1 + 50°С) для исключения чрезмерного роста зерна аустенита и последующего образования грубой сетки цементита.
Длительность нагрева под нормализацию складывается из двух основных элементов – времени прогрева изделия до заданной температуры и времени фазовых превращений. Для некрупногабаритных изделий простой формы обычно для прогрева достаточно 15 минут. Время фазовых превращений зависит от степени легирования сплава: для углеродистой стали и низколегированных марок назначают 1,5 минуты на каждый миллиметр толщины продукта, для высоколегированных – 2-2,5 мин/мм.
Охлаждение
Это важный элемент термической обработки, формирующий комплекс качественных и эксплуатационных характеристик изделия. Нормализация стали выполнятся с охлаждением на спокойном воздухе либо с применением ускоренного обдува вентиляторами.
В результате такой термообработки нормализованная сталь становится более мелкозернистой и равномерной по механическим характеристикам в сравнении с горячекатаной.
Другие методы термической обработки
ТО стали позволяет придать материалу характерный набор свойств путем изменения его внутренней структуры. Кроме нормализации, термическая обработка стали может осуществляться и другими методами.
- Закалка. Металлопрокат прогревается до температур выше точек фазового превращения, а затем резко охлаждается в воде, масле, солевых и других растворах (в зависимости от состава стали и требуемой скорости охлаждения). Такая обработка придает материалу высокую прочность, твердость и хрупкость. Закалку проходят детали, работающие под статической нагрузкой и в условиях абразивного изнашивания, но без воздействия меняющихся колебаний.
- Отпуск стали. Его проходят некоторые заготовки после закалки, а также изделия, требующие снятия внутренних напряжений или корректировки микроструктуры. В этом случае нагрев выполняют до температур ниже фазовых превращений с последующим охлаждением на воздухе либо ускоренно – в воде. При этом повышаются пластичность и ударная вязкость, снижается прочность и твердость стали.
- Отжиг. Осуществляется по технологии нагрева выше фазовых превращений с последующим плавным остыванием прямо в печи. После такой обработки сталь имеет наивысшую пластичность и наименьшую прочность. Нормализация является подвидом отжига, отличается только условиями охлаждения (часто ее называют нормализационным отжигом). За счет более быстрого остывания металла нормализация является более производительной.
- Термическая обработка в технологическом потоке прокатного стана. Наиболее перспективное направление развития технологий ТО, которое сокращает временные и материальные затраты, а также экологическую нагрузку. Самыми популярными на сегодняшний день являются способы термомеханической, нормализующей и контролируемой прокатки, а также прямая закалка с прокатного нагрева.
Выбор способа термической обработки осуществляется на основании химического состава и параметров стального изделия, уровня свойств, который требуется обеспечить, а также имеющегося набора оборудования для осуществления данных операций. Термическая обработка может применяться и как промежуточная операция при изготовлении металлоизделий, и как окончательная – придающая продукту конечный комплекс характеристик.
Чтобы обезопасить свое производство от форс-мажорных ситуаций, связанных с использованием деталей и конструкций из некачественного металла, приобретайте только сертифицированную продукцию и только у надежных поставщиков.
Если вы решили купить металлопрокат у нас, вы получаете дополнительно гарантию соответствия заявленной структуре и химическому составу. Нужна консультация? По любым вопросам обращайтесь на нашу контактную линию по телефону 0800-30-30-70 – оказываем консультативную поддержку бесплатно.
Что такое нормализация баз данных?
Статья расскажет о том, что такое нормализация баз данных, для чего она нужна, и какие виды нормализации существуют. Для наилучшего понимания отношений между таблицами в нормализованной базе данных будут приведены практические примеры.
При создании базы нужно учитывать некоторые правила. Исходя из вышесказанного, можно привести следующую формулировку: нормализация БД — это процесс организации данных определенным образом и рекомендации по проектированию. То есть таблицы и связи между ними (отношения) создаются в соответствии с правилами. В результате обеспечивается нужный уровень безопасности данных, а сама база становится более гибкой. Также устраняются несогласованные зависимости и избыточность.
Плюсы
Нормализация не является обязательной, но приносит следующие преимущества: — упрощается процесс выборки. Речь идет об упрощении работы по составлению запросов, то есть пользователь сможет получать нужную информацию относительно простыми запросами; — обеспечивается целостность данных. Можно говорить о минимизации искажения информации и снижении вероятности потери данных; — улучшается масштабируемость. При соблюдении правил нормализации формируются благоприятные предпосылки к росту БД; — отсутствует избыточность (data redundancy). Избыточность — известная проблема непродуктивного использования свободного места на жестком диске, затрудняющая обслуживание БД. В отдельных случаях эту проблему усугубляет и то, что в случае необходимости изменения записей однотипных данных, хранимых в нескольких местах (таблицах), пользователю придется вносить требуемые изменения везде, что весьма трудоемкое занятие. Гораздо проще сделать так, чтобы, к примеру, данные о городах хранились только в таблице Cities и нигде больше. Если подытожить вышесказанное, избыточность предполагает дублирование данных, а это не только усложняет работу с БД, но и увеличивает ее размер; — отсутствие несогласованных зависимостей. Несогласованные зависимости затрудняют доступ к данным, ведь путь к такой информации может быть неправилен и нелогичен. В той же таблице Cities логично искать города, количество жителей и т. п., но не адреса и имена жителей — для этой информации уже нужна другая таблица — Citizens.
Как выполнить нормализацию?
Чтобы привести БД к нормальной форме, необходимо: 1. Объединить имеющиеся данные в группы. 2. Выяснить логические связи между группами. Чтобы обеспечить правильность связей, связываемые поля должны иметь один тип.
Если таблица не нормализована, она может хранить информацию о нескольких сущностях и включать в себя повторяющиеся столбцы, а они, в свою очередь, могут хранить дублируемые значения. Если же нормализована, то каждая таблица хранит информацию лишь об одной сущности.
При нормализации предполагается использование нормальных форм по отношению к структуре имеющихся данных. Есть несколько правил нормализации. Каждое из них носит название «нормальная форма» (НФ). Каждая такая форма, кроме первой, предполагает, что к данным уже применили предыдущую нормальную форму. При выполнении первого правила БД представлено в первой нормальной форме (1НФ), при выполнении трех правил — в третьей нормальной форме (3НФ).
Таких форм (уровней) — семь, однако на практике для большей части приложений вполне достаточно нормализовать БД до третьей нормальной формы (строго говоря, БД и будет считаться нормализованной, когда к ней применяется 3НФ и выше).
Да, обеспечить полное соответствие правилам и спецификациям — задача не всегда выполнимая, ведь для нормализации придется создавать дополнительные таблицы, а это не всегда приемлемо или не находит отклика у клиентов. Но если правила приходится нарушать, надо понимать, что все, связанные с этим проблемы, включая несогласованные зависимости и избыточность, будут учтены, и что это допустимо для приложения, не нарушит его работоспособность.
Правила нормализации на примерах
Первая нормальная форма (1НФ)
Согласно правилам, все атрибуты в такой таблице должны быть простыми, все сохраняемые данные на пересечении столбцов и строк — содержать лишь скалярные значения. Также не должно быть повторяющихся строк.
Для примера возьмем таблицу с автомобилями:
Обратите внимание на нарушение нормализации в моделях BMW — в одной ячейке находится перечень из трех элементов: M5, X5M, M1, то есть можно говорить об отсутствии атомарности. После преобразования в 1НФ таблица меняет вид:
Вторая нормальная форма (2НФ)
Отношения будут соответствовать 2НФ, если сама БД находится в 1НФ, а каждый столбец, который не является ключом, зависит от первичного ключа.
Рассмотрим очередную таблицу:
Она в 1НФ, но не во 2НФ. Стоимость авто зависит от модели и производителя. Размер скидки зависит от производителя, поэтому функциональная зависимость от первичного ключа является неполной. Исправить это можно, выполнив декомпозицию на 2 отношения, где неключевые атрибуты будут зависеть от первичного ключа.
Третья нормальная форма (3НФ)
Таблица должна находиться во 2НФ, плюс любой столбец, который не является ключом, должен зависеть лишь от первичного ключа.
В таблице в отношении атрибут первичным ключом является «Модель». Так как собственные телефоны у автомашин отсутствуют, телефон зависит только от магазина.
В результате можно говорить о наличии в связях следующих функциональных зависимостей:
Зависимость «Модель → Телефон» — транзитивна, поэтому отношение не находится в 3НФ.
Разделив исходное отношение, можно получить 2 отношения, и они уже будут находиться в 3НФ:
Остальные виды соотношений и правил, можно посмотреть по ссылкам ниже: – https://ru.wikipedia.org/wiki/Нормальная_форма; – https://habr.com/ru/post/254773/.
P. S. Очень надеемся, что теперь у вас сложилось представление о том, что такое нормализация базы данных. Если же вы хотите освоить работу с БД на профессиональном уровне, добро пожаловать на курсы OTUS!
.
Нормализация данных (Data normalization) · Loginom Wiki
Синонимы: Нормирование данных, Нормировка данных
Разделы: Алгоритмы
В машинном обучении нормализацией называют метод предобработки числовых признаков в обучающих наборах данных с целью приведения их к некоторой общей шкале без потери информации о различии диапазонов.
Иногда нормализацию данных называют стандартизацией, однако это неверно. Стандартизация это более широкое понятие и подразумевает предобработку с целью приведению данных к единому формату и представлению, наиболее удобному для использования определённого вида обработки. В отличии от нормализации, стандартизация может применяться и к категориальным данным.
Необходимость нормализации вызвана тем, что разные признаки обучающего набора данных могут быть представлены в разных масштабах и изменяться в разных диапазонах. Например, возраст, который изменяется от 0 до 100, и доход, изменяющийся от нескольких тысяч до нескольких миллионов. То есть диапазоны изменения признаков «Возраст» и «Доход» различаются в тысячи раз.
В этом случае возникает нарушение баланса между влиянием входных переменных, представленных в разных масштабах, на выходную переменную. Т.е. это влияние обусловлено не реальной зависимостью, а изменением масштаба. В результате, обучаемая модель может выявить некорректные зависимости.
Существует несколько основных методов нормализации.
Десятичное масштабирование (decimal scaling)В данном методе нормализация производится путём перемещения десятичной точки на число разрядов, соответствующее порядку числа: x′i=xi/10n, где n — число разрядов в наибольшем наблюдаемом значении. Например, пусть имеется набор значений: -10, 201, 301, -401, 501, 601, 701. Поскольку n=3, то получим x′i=xi/103. Иными словами, каждое наблюдаемое значение делим на 1000 и получаем: -0.01, 0.201, 0.301, -0.401, 0.501, 0.601, 0.701.
Минимаксная нормализацияНесложно увидеть недостаток предыдущего метода: результирующие значения всегда будут занимать не весь диапазон [0,1], а только его часть, в зависимости от наибольшего и наименьшего наблюдаемых значений. Если исходный диапазон мал (скажем, 400 — 500), то получим, что в результате десятичного масштабирование нормализованные значения будут лежать в диапазоне [0.4,0.5], т.е. его изменчивость окажется очень низкой, что плохо сказывается на качестве построенной модели.
Решить проблему можно путём применения минимаксной нормализации, которая реализуется по формуле:
X′=X−XminXmax−Xmin.
Эту формулу можно обобщить на привидение исходного набора значений к произвольному диапазону [a,b]:
X′=a+X−XminXmax−Xmin(b−a).
Наиболее часто используется приведение к диапазонам [0,1] и [-1,1]
Нормализация средним (Z-нормализация)Недостаткам минимаксной нормализации является наличие аномальных значений данных, которые «растягивают» диапазон, что приводит к тому, что нормализованные значения опять же концентрируются в некотором узком диапазоне вблизи нуля. Чтобы избежать этого, следует определять диапазон не с помощью максимальных и минимальных значений, а с помощью «типичных» — среднего и дисперсии:
x′i=(xi−¯¯¯¯¯X)/σx.
Величины, полученные по данной формуле, в статистике называют Z-оценками. Их Абсолютное значение представляет собой оценку (в единицах стандартного отклонения) расстояния между x и его средним значением ¯¯¯¯¯X в общей совокупности. Если z меньше нуля, то x ниже средней, а если z больше нуля, то x выше средней.
ОтношениеВ этом методе каждое значение исходных данных делиться на некоторое, заданное пользователем число, или на значение статистического показателя, вычисленного по набору данных, например, среднее, стандартное отклонение, дисперсию, вариационный размах и др.
Описание нормализации базы данных – Office
- Чтение занимает 5 мин
-
- Применяется к:
- Microsoft Office Access 2007, Microsoft Office Access 2003
В этой статье
Примечание
Office 365 ProPlus переименован в Майкрософт 365 корпоративные приложения. Для получения дополнительной информации об этом изменении прочитайте этот блог.
Исходный номер КБ: 283878
В этой статье объясняется терминология нормализации баз данных для начинающих. Базовое понимание этой терминологии полезно при обсуждении разработки реляционной базы данных.
Описание нормализации
Нормализация — это процесс организации данных в базе данных. Это включает создание таблиц и установление связей между этими таблицами в соответствии с правилами, предназначенными как для защиты данных, так и для того, чтобы сделать базу данных более гибкой за счет устранения избыточности и непоследовательной зависимости.
Избыточные данные пустая трата дискового пространства и создает проблемы с обслуживанием. Если данные, которые существуют в нескольких местах, должны быть изменены, данные должны быть изменены точно так же во всех расположениях. Изменение адреса клиента гораздо проще реализовать, если эти данные хранятся только в таблице Клиентов и нигде в базе данных.
Что такое “непоследовательная зависимость”? Хотя пользователю интуитивно понятно искать в таблице Клиенты адрес конкретного клиента, не имеет смысла искать там зарплату сотрудника, который вызывает этого клиента. Заработная плата сотрудника связана с сотрудником или зависит от него, и поэтому его следует перенаселять в таблицу “Сотрудники”. Несовместимые зависимости могут затруднить доступ к данным, так как путь к поиску данных может быть пропущен или нарушен.
Существует несколько правил нормализации базы данных. Каждое правило называется “нормальной формой”. Если первое правило соблюдается, база данных, как сообщается, находится в “первой нормальной форме”. Если соблюдаются первые три правила, база данных рассматривается как “третья нормальная форма”. Хотя возможны другие уровни нормализации, третья нормальная форма считается наивысшим уровнем, необходимым для большинства приложений.
Как и во многих формальных правилах и спецификациях, сценарии реального мира не всегда позволяют обеспечить идеальное соответствие требованиям. Как правило, для нормализации требуются дополнительные таблицы, и некоторые клиенты считают это громоздким. Если вы решите нарушить одно из первых трех правил нормализации, убедитесь, что ваше приложение предвосхищает возможные проблемы, такие как избыточные данные и несовместимые зависимости.
Ниже описаны примеры.
Первая нормальная форма
- Исключить повторяющие группы в отдельных таблицах.
- Создайте отдельную таблицу для каждого набора связанных данных.
- Определите каждый набор связанных данных с помощью основного ключа.
Не используйте несколько полей в одной таблице для хранения аналогичных данных. Например, для отслеживания элемента инвентаризации, который может приходить из двух возможных источников, запись инвентаризации может содержать поля для кода поставщика 1 и кода поставщика 2.
Что происходит при добавлении третьего поставщика? Добавление поля не является ответом; она требует изменений программы и таблицы и не позволяет плавно разместить динамическое число поставщиков. Вместо этого поместите всю информацию поставщика в отдельную таблицу под названием Поставщики, а затем увязыв инвентаризацию с поставщиками с ключом номера элемента, или поставщики для инвентаризации с ключом кода поставщика.
Вторая нормальная форма
- Создайте отдельные таблицы для наборов значений, применимых к нескольким записям.
- Соотносим эти таблицы с иностранным ключом.
Записи не должны зависеть от чего-либо, кроме основного ключа таблицы (сложный ключ, если это необходимо). Например, рассмотрим адрес клиента в системе учета. Адрес необходим в таблице Клиенты, а также таблицами “Заказы”, “Доставка”, “Счета-фактуры”, “Отчеты о счетах” и “Коллекции”. Вместо того, чтобы хранить адрес клиента как отдельную запись в каждой из этих таблиц, храните его в одном месте, в таблице Клиенты или в отдельной таблице Адресов.
Третья нормальная форма
- Устранение полей, которые не зависят от ключа.
Значения в записи, которая не входит в ключ этой записи, не относятся к таблице. В общем, в любое время содержимое группы полей может применяться к более чем одной записи в таблице, рассмотрите возможность размещения этих полей в отдельной таблице.
Например, в таблице набора сотрудников может быть включено имя и адрес университета кандидата. Но для групповой рассылки необходим полный список университетов. Если сведения о университетах хранятся в таблице Candidates, нет возможности перечислять университеты без текущих кандидатов. Создайте отдельную таблицу университетов и привяжете ее к таблице Кандидаты с ключом кода университета.
ИСКЛЮЧЕНИЕ: применение третьей обычной формы, хотя теоретически желательно, не всегда является практическим. Если у вас есть таблица Клиентов и вы хотите устранить все возможные зависимости между полями, необходимо создать отдельные таблицы для городов, почтовых индексов, представителей продаж, классов клиентов и любого другого фактора, который может быть дублирован в нескольких записях. В теории, нормализация стоит очистки. Однако многие небольшие таблицы могут ухудшать производительность или превышать возможности открытого файла и памяти.
Возможно, более целесообразно применять третью нормальную форму только к данным, которые часто меняются. Если остаются некоторые зависимые поля, спроектировать приложение, чтобы потребовать от пользователя проверить все связанные поля при их смене.
Другие формы нормализации
Четвертая нормальная форма, также называемая “Обычная форма Бойс Кодд” (BCNF), и пятая нормальная форма существуют, но редко рассматриваются в практическом дизайне. Игнорирование этих правил может привести к менее совершенному дизайну базы данных, но не должно влиять на функциональные возможности.
Нормализация таблицы примеров
Эти действия демонстрируют процесс нормализации фиктивной студенческой таблицы.
Ненормализованная таблица:
Student # Советник Adv-Room Класс 1 Class2 Class3 1022 Джонс 412 101-07 143-01 159-02 4123 Smith 216 101-07 143-01 179-04 Первая нормальная форма: нет повторяюющихся групп
Таблицы должны иметь только два измерения. Так как у одного учащегося несколько классов, эти классы должны быть указаны в отдельной таблице. Поля Class1, Class2 и Class3 в вышеуказанных записях указывают на проблемы с дизайном.
Таблицы часто используют третье измерение, но таблицы не должны. Другой способ взглянуть на эту проблему — это отношение между одним и большим количеством, не помещая одну сторону и множество сторон в одну таблицу. Вместо этого создайте другую таблицу в первой обычной форме, устранив группу повторяющихся (Класс#), как показано ниже:
Student # Советник Adv-Room Класс # 1022 Джонс 412 101-07 1022 Джонс 412 143-01 1022 Джонс 412 159-02 4123 Smith 216 101-07 4123 Smith 216 143-01 4123 Smith 216 179-04 Вторая нормальная форма: устранение избыточных данных
Обратите внимание на несколько значений Класса#для каждого значения Student# в вышеуказанной таблице. Класс# функционально не зависит от student# (основной ключ), поэтому эта связь не находится во второй нормальной форме.
В следующих таблицах демонстрируется вторая нормальная форма:
Студенты:
Student # Советник Adv-Room 1022 Джонс 412 4123 Smith 216 Регистрация:
Student # Класс # 1022 101-07 1022 143-01 1022 159-02 4123 101-07 4123 143-01 4123 179-04 Третья нормальная форма: устранение данных, не зависящих от ключа
В последнем примере Adv-Room (номер офиса советника) функционально зависит от атрибута Advisor. Решение заключается в том, чтобы переместить этот атрибут из таблицы Студенты в таблицу факультета, как показано ниже:
Студенты:
Student # Советник 1022 Джонс 4123 Smith Факультет:
Имя Room Отдел Джонс 412 42 Smith 216 42
Описание нормализации базы данных – Офис
- 5 минут на чтение
- Применимо к:
- Microsoft Office Access 2007, Microsoft Office Access 2003
В этой статье
Примечание
Office 365 профессиональный плюс переименовывается в Microsoft 365 Apps for enterprise .Дополнительные сведения об этом изменении см. В этом сообщении в блоге.
Оригинальный номер базы знаний: 283878
В этой статье объясняется терминология нормализации базы данных для начинающих. Базовое понимание этой терминологии полезно при обсуждении дизайна реляционной базы данных.
Описание нормализации
Нормализация – это процесс организации данных в базе данных. Это включает в себя создание таблиц и установление отношений между этими таблицами в соответствии с правилами, разработанными как для защиты данных, так и для повышения гибкости базы данных за счет устранения избыточности и несогласованных зависимостей.
Избыточные данные занимают место на диске и создают проблемы с обслуживанием. Если данные, которые существуют более чем в одном месте, должны быть изменены, данные должны быть изменены точно так же во всех местах. Изменить адрес клиента намного проще, если эти данные хранятся только в таблице «Клиенты» и больше нигде в базе данных.
Что такое «несогласованная зависимость»? Хотя пользователю интуитивно понятно искать в таблице «Клиенты» адрес конкретного клиента, возможно, нет смысла искать там зарплату сотрудника, который звонит этому клиенту.Заработная плата сотрудника связана с сотрудником или зависит от него, поэтому ее следует переместить в таблицу «Сотрудники». Несогласованные зависимости могут затруднить доступ к данным, поскольку путь для поиска данных может отсутствовать или поврежден.
Есть несколько правил для нормализации базы данных. Каждое правило называется «нормальной формой». Если соблюдается первое правило, говорят, что база данных находится в «первой нормальной форме». Если первые три правила соблюдаются, база данных считается находящейся в «третьей нормальной форме».”Хотя возможны и другие уровни нормализации, третья нормальная форма считается наивысшим уровнем, необходимым для большинства приложений.
Как и многие формальные правила и спецификации, реальные сценарии не всегда позволяют полностью соответствовать требованиям. Как правило, для нормализации требуются дополнительные таблицы, и некоторые клиенты считают это громоздким. Если вы решили нарушить одно из первых трех правил нормализации, убедитесь, что ваше приложение предвидит любые проблемы, которые могут возникнуть, такие как избыточные данные и несогласованные зависимости.
Следующие описания включают примеры.
Первая нормальная форма
- Удалите повторяющиеся группы в отдельных таблицах.
- Создайте отдельную таблицу для каждого набора связанных данных.
- Определите каждый набор связанных данных с помощью первичного ключа.
Не используйте несколько полей в одной таблице для хранения похожих данных. Например, для отслеживания предмета инвентаризации, который может поступать из двух возможных источников, запись инвентаризации может содержать поля для кода поставщика 1 и кода поставщика 2.
Что произойдет, если вы добавите третьего поставщика? Добавление поля – это не ответ; он требует модификаций программы и таблиц и не позволяет плавно приспособиться к динамическому количеству поставщиков. Вместо этого поместите всю информацию о поставщиках в отдельную таблицу под названием «Поставщики», затем свяжите инвентарь с поставщиками с помощью ключа номера позиции или поставщиков с инвентаризацией с помощью ключа кода поставщика.
Вторая нормальная форма
- Создайте отдельные таблицы для наборов значений, которые применяются к нескольким записям.
- Свяжите эти таблицы с внешним ключом.
Записи не должны зависеть ни от чего, кроме первичного ключа таблицы (при необходимости, составного ключа). Например, рассмотрим адрес покупателя в системе бухгалтерского учета. Адрес необходим для таблицы «Клиенты», а также для таблиц «Заказы», «Отгрузка», «Счета-фактуры», «Счета к получению» и «Сборы». Вместо того, чтобы хранить адрес клиента как отдельную запись в каждой из этих таблиц, сохраните его в одном месте, либо в таблице клиентов, либо в отдельной таблице адресов.
Третья нормальная форма
- Удалите поля, не зависящие от ключа.
Значения в записи, которые не являются частью ключа этой записи, не принадлежат таблице. Как правило, в любое время, когда содержимое группы полей может применяться более чем к одной записи в таблице, рассмотрите возможность размещения этих полей в отдельной таблице.
Например, в таблицу набора сотрудников могут быть включены название университета и адрес кандидата. Но для групповых рассылок нужен полный список вузов.Если информация об университете хранится в таблице «Кандидаты», нет возможности перечислить университеты, в которых нет текущих кандидатов. Создайте отдельную таблицу Universities и свяжите ее с таблицей Candidates с помощью кодового ключа университета.
ИСКЛЮЧЕНИЕ: соблюдение третьей нормальной формы теоретически желательно, но не всегда практично. Если у вас есть таблица «Клиенты» и вы хотите устранить все возможные зависимости между полями, вы должны создать отдельные таблицы для городов, почтовых индексов, торговых представителей, классов клиентов и любого другого фактора, который может дублироваться в нескольких записях.Теоретически за нормализацию стоит потратить. Однако многие небольшие таблицы могут снизить производительность или превысить объем открытых файлов и памяти.
Возможно, более целесообразно применить третью нормальную форму только к часто изменяющимся данным. Если остались некоторые зависимые поля, разработайте свое приложение так, чтобы пользователь проверял все связанные поля при изменении любого из них.
Другие формы нормализации
Четвертая нормальная форма, также называемая нормальной формой Бойса Кодда (BCNF), и пятая нормальная форма действительно существуют, но редко рассматриваются в практическом проектировании.Несоблюдение этих правил может привести к не идеальному дизайну базы данных, но не должно повлиять на функциональность.
Нормализация примерной таблицы
Эти шаги демонстрируют процесс нормализации таблицы фиктивного ученика.
Ненормализованная таблица:
Студент № Советник Adv-Room Класс1 Класс2 Класс 3 1022 Джонс 412 101-07 143-01 159-02 4123 Смит 216 101-07 143-01 179-04 Первая нормальная форма: без повторяющихся групп
Таблицы должны иметь только два измерения.Поскольку у одного ученика несколько классов, эти классы должны быть указаны в отдельной таблице. Поля Class1, Class2 и Class3 в приведенных выше записях указывают на ошибку конструкции.
В электронных таблицах часто используется третье измерение, а в таблицах – нет. Другой способ взглянуть на эту проблему – использовать отношения «один ко многим», не помещайте одну сторону и многие стороны в одну и ту же таблицу. Вместо этого создайте другую таблицу в первой нормальной форме, удалив повторяющуюся группу (Class #), как показано ниже:
Студент № Советник Adv-Room Класс № 1022 Джонс 412 101-07 1022 Джонс 412 143-01 1022 Джонс 412 159-02 4123 Смит 216 101-07 4123 Смит 216 143-01 4123 Смит 216 179-04 Вторая нормальная форма: исключить избыточные данные
Обратите внимание на несколько значений Class # для каждого значения Student # в приведенной выше таблице.Class # функционально не зависит от Student # (первичный ключ), поэтому эта связь не во второй нормальной форме.
В следующих таблицах показана вторая нормальная форма:
Студенты:
Студент № Советник Adv-Room 1022 Джонс 412 4123 Смит 216 Регистрационный номер:
Студент № Класс № 1022 101-07 1022 143-01 1022 159-02 4123 101-07 4123 143-01 4123 179-04 Третья нормальная форма: удалить данные, не зависящие от ключа
В последнем примере Adv-Room (номер кабинета консультанта) функционально зависит от атрибута Advisor.Решение состоит в том, чтобы переместить этот атрибут из таблицы «Студенты» в таблицу «Факультет», как показано ниже:
Студенты:
Студент № Советник 1022 Джонс 4123 Смит Факультет:
Имя Комната Отдел Джонс 412 42 Смит 216 42
Что такое нормализация? – Определение из Техопедии
Что означает нормализация?
Нормализация – это процесс реорганизации данных в базе данных таким образом, чтобы они отвечали двум основным требованиям:
- Нет избыточности данных, все данные хранятся только в одном месте.
- Зависимости данных логичны, все связанные элементы данных хранятся вместе.
Нормализация важна по многим причинам, но главным образом потому, что она позволяет базам данных занимать как можно меньше места на диске, что приводит к повышению производительности.
Нормализация также известна как нормализация данных.
Techopedia объясняет нормализацию
Первой целью нормализации данных является обнаружение и удаление всех повторяющихся данных путем логической группировки избыточных данных вместе.Всякий раз, когда один фрагмент данных зависит от другого, они должны храниться рядом в этом наборе данных.
Избавившись от всех аномалий и упорядочив неструктурированные данные в структурированную форму, нормализация значительно повышает удобство использования набора данных. Данные могут быть более легко визуализированы, аналитические данные могут быть извлечены более эффективно, а информация может обновляться быстрее. Поскольку избыточности объединяются вместе, снижается риск ошибок и дублирования, которые еще больше ухудшат дезорганизацию данных.Вдобавок ко всему, нормализованная база данных занимает меньше места, избавляя от многих проблем с дисковым пространством и значительно повышая общую производительность.
Три основных типа нормализации перечислены ниже. Примечание: «NF» относится к «нормальной форме».
Первая нормальная форма (1NF)
Таблицы в 1NF должны соответствовать некоторым правилам:
Каждая ячейка должна содержать только одно (атомарное) значение.
Каждый столбец в таблице должен иметь уникальное имя.
Все значения в столбце должны относиться к одному домену.
Вторая нормальная форма (2NF)
Таблицы в 2NF должны находиться в 1NF и не иметь какой-либо частичной зависимости (например, каждый непервичный атрибут должен зависеть от первичного ключа таблицы).
Третья нормальная форма (3NF)
Таблицы в 3NF должны быть в 2NF и не иметь транзитивных функциональных зависимостей от первичного ключа.
Следующие две НФ также существуют, но редко используются:
Нормальная форма Бойса-Кодда (BCNF)
Более высокая версия 3НФ, нормальная форма Бойса-Кодда, используется для устранения аномалий, которые могут возникнуть, если еще одна существует более одного ключа-кандидата.BCNF, также известный как нормальная форма 3.5, должен быть в 3NF и во всех функциональных зависимостях (X → Y) X должен быть суперключом.
Четвертая нормальная форма (4NF)
Для таблицы, входящей в 4NF, она должна быть в BCNF и не иметь многозначной зависимости.
Первые три NF были получены в начале 1970-х годов отцом реляционной модели данных Э. Ф. Коддом. Почти все современные механизмы реляционных баз данных используют его правила.
Некоторые механизмы реляционных баз данных не полностью соответствуют критериям всех правил нормализации.Примером может служить функция многозначных полей, представленная Microsoft в приложении базы данных Access 2007. В кругах баз данных ведутся горячие споры о том, лишают ли такие возможности возможности таких приложений быть настоящими системами управления реляционными базами данных.
Что такое нормализация данных? – Программное обеспечение BMC
Это не секрет. Официально мы живем в эпоху больших данных. Почти каждый бизнес, особенно крупные предприятия, собирает, хранит и анализирует данные в интересах роста.В большинстве повседневных бизнес-операций управление данными является нормой с использованием таких инструментов, как:
Если вы какое-то время проработали в какой-либо компании, то наверняка встречали термин «нормализация данных». Нормализация данных – лучший способ обработки и использования хранимой информации – это процесс, который поможет добиться успеха во всей компании.
Вот все, что вам нужно знать о нормализации данных, а также несколько советов по их эффективному улучшению.
Что такое нормализация данных?
Нормализация данных обычно считается развитием чистых данных.Однако, если погрузиться глубже, нормализация данных имеет двоякий смысл:
- Нормализация данных – это организация данных, чтобы они выглядели одинаково во всех записях и полях.
- Повышает согласованность типов записей, что приводит к очистке, привлечению потенциальных клиентов, сегментации и повышению качества данных.
Проще говоря, этот процесс включает в себя устранение неструктурированных данных и избыточность (дубликаты) для обеспечения логического хранения данных. Когда нормализация данных будет выполнена правильно, вы получите стандартизированный ввод информации.Например, этот процесс применяется к тому, как записываются URL-адреса, имена контактов, почтовые адреса, номера телефонов и даже коды. Эти стандартизированные информационные поля затем можно сгруппировать и быстро прочитать.
Кому нужна нормализация данных?
Каждый бизнес, который хочет успешно работать и расти, должен регулярно выполнять нормализацию данных. Это одна из самых важных вещей, которые вы можете сделать, чтобы избавиться от ошибок, которые усложняют и усложняют анализ информации.Такие ошибки часто подкрадываются при изменении, добавлении или удалении системной информации. Когда ошибка ввода данных будет устранена, организация останется с хорошо функционирующей системой, которая полна полезных и полезных данных.
С нормализацией организация может максимально использовать свои данные, а также инвестировать в сбор данных на более высоком и эффективном уровне. Поиск данных для улучшения работы компании становится менее сложной задачей, особенно при перекрестном допросе. Для тех, кто регулярно консолидирует и запрашивает данные из приложений «программное обеспечение как услуга», а также для тех, кто собирает данные из различных источников, таких как социальные сети, цифровые сайты и т. Д., Нормализация данных становится бесценным процессом, который экономит время. пространство и деньги.
Как работает нормализация данных
Теперь самое время отметить, что в зависимости от вашего конкретного типа данных ваша нормализация будет выглядеть по-разному.
По сути, нормализация – это просто создание стандартного формата для всех данных в компании:
- Miss EMILY будет написано на Ms. Emily
- 8023097864 будет записано 802-309-7864
- 24 canillas RD будет написано 24 Canillas Road
- GoogleBiz будет называться Google Biz, Inc.
- Вице-президент по маркетингу будет написан Вице-президентом по маркетингу
Помимо базового форматирования, эксперты согласны с тем, что существует пять общих правил или «нормальных форм» для выполнения нормализации данных. Каждое правило направлено на разделение типов сущностей на числовые категории в зависимости от уровня сложности. Считается, что это руководство к нормализации, в некоторых случаях необходимо иметь место отклонения от формы. В случае отклонений важно учитывать последствия и аномалии.
Для усложнения в этой статье первая и три наиболее распространенные формы обсуждаются на верхнем уровне, и все данные рассматриваются в табличном формате.
1. Первая нормальная форма (1NF)
Самая основная форма нормализации данных – 1NFm, которая гарантирует отсутствие повторяющихся записей в группе. Чтобы считаться 1NF, каждая запись должна иметь только одно единственное значение для каждой ячейки, и каждая запись должна быть уникальной.
Например, вы записываете имя, адрес, пол человека и то, купили ли они файлы cookie.
2. Вторая нормальная форма (2NF)
Снова работаем, чтобы гарантировать отсутствие повторяющихся записей, чтобы быть в правиле 2NF, данные должны сначала применяться ко всем требованиям 1NF. После этого данные должны иметь только один первичный ключ. Чтобы разделить данные, чтобы иметь только один первичный ключ, все подмножества данных, которые могут быть размещены в нескольких строках, должны быть помещены в отдельные таблицы. Затем отношения могут быть созданы с помощью новых меток внешнего ключа.
Например, вы записываете имя, адрес, пол человека, если он покупал файлы cookie, а также типы файлов cookie.Типы файлов cookie помещаются в другую таблицу с соответствующим внешним ключом для имени каждого человека.
3. Третья нормальная форма (3NF)
Для того, чтобы данные попали в это правило, они должны сначала соответствовать всем требованиям 2NF. После этого данные в таблице должны зависеть только от первичного ключа. Если первичный ключ изменен, все затронутые данные должны быть помещены в новую таблицу.
Например, вы записываете имя, адрес и пол человека, но возвращаетесь и меняете имя человека.Когда вы это сделаете, пол тоже может измениться. Чтобы этого избежать, в 3NF гендер получает внешний ключ и новую таблицу для хранения пола.
По мере того, как вы начнете лучше понимать формы нормализации, правила станут более ясными, а разделение данных на таблицы и уровни станет проще. Эти таблицы затем упростят для любого в организации сбор информации и обеспечат сбор правильных данных, которые не будут дублироваться.
Преимущества нормализации данных
Как упоминалось выше, наиболее важной частью нормализации данных является лучший анализ, ведущий к росту; однако есть еще несколько невероятных преимуществ этого процесса:
Больше места
С базами данных, переполненными информацией, организация и устранение дубликатов освобождает столь необходимое пространство в гигабайтах и терабайтах.Когда система загружается ненужными вещами, производительность обработки снижается. После очистки цифровой памяти ваши системы будут работать быстрее и быстрее загружаться, а это означает, что анализ данных будет выполняться более эффективно.
Более быстрый ответ на вопросы
Говоря о более быстрых процессах, после того, как нормализация станет простой задачей, вы сможете систематизировать свои данные без каких-либо дополнительных изменений. Это помогает различным командам внутри компании экономить драгоценное время вместо того, чтобы пытаться переводить сумасшедшие данные, которые не были сохранены должным образом.
Лучшая сегментация
Один из лучших способов развития бизнеса – обеспечить сегментацию лидов. С нормализацией данных группы можно быстро разделить на категории по названиям, отраслям – вы называете это. Создание списков на основе того, что является ценным для конкретного лида, – это процесс, который больше не вызывает головной боли.
Нормализация данных не является вариантом
По мере того, как данные становятся все более ценными для всех типов бизнеса, нельзя упускать из виду то, как они организованы в массовом порядке.
От обеспечения доставки электронных писем до предотвращения неправильного набора и улучшения анализа групп, не беспокоясь о дубликатах, легко увидеть, что, когда нормализация данных выполняется правильно, это приводит к улучшению общей бизнес-функции. Только представьте, если вы оставите свои данные в беспорядке и упустите важные возможности роста из-за того, что веб-сайт не загружается или заметки не доходят до вице-президента. Все это не похоже на успех или рост.
Выбор нормализации данных – одна из самых важных вещей, которые вы можете сделать для своей организации сегодня.
Дополнительные ресурсы
Дополнительную информацию по этой теме можно найти на следующих ресурсах:
Основы нормализации базы данных
Если вы какое-то время работали с базами данных, скорее всего, вы слышали термин «нормализация». Возможно, вас спросили: «Нормализована ли эта база данных?» или “Это в BCNF?” Нормализация часто считается роскошью, на которую есть время только у ученых. Однако знание принципов нормализации и их применение к повседневным задачам проектирования базы данных не так уж и сложно, и это может значительно улучшить производительность вашей СУБД.
В этой статье мы познакомимся с концепцией нормализации и кратко рассмотрим наиболее распространенные нормальные формы.
Что такое нормализация?
Нормализация – это процесс эффективной организации данных в базе данных. Процесс нормализации преследует две цели: устранение избыточных данных (например, сохранение одних и тех же данных в более чем одной таблице) и обеспечение разумности зависимостей данных (сохранение только связанных данных в таблице). Обе эти цели достойны, поскольку они сокращают объем пространства, потребляемого базой данных, и обеспечивают логическое хранение данных.
Нормальные формы
Сообщество баз данных разработало серию руководств по обеспечению нормализации баз данных. Они называются нормальными формами и пронумерованы от единицы (самая низкая форма нормализации, называемая первой нормальной формой или 1NF) до пяти (пятая нормальная форма или 5NF). В практических приложениях вы часто будете видеть 1NF, 2NF и 3NF, а также время от времени 4NF. Пятая нормальная форма встречается очень редко и не будет обсуждаться в этой статье.
Прежде чем мы начнем обсуждение обычных форм, важно отметить, что они являются только рекомендациями и рекомендациями. Иногда возникает необходимость отклониться от них, чтобы удовлетворить практические бизнес-требования. Однако, когда имеют место вариации, обязательно оценивать любые возможные разветвления, которые они могут иметь в вашей системе, и учитывать потенциальные несоответствия. Тем не менее, давайте исследуем нормальные формы.
Первая нормальная форма (1NF)
Первая нормальная форма (1NF) устанавливает фундаментальные правила для организованной базы данных:
- Удалите повторяющиеся столбцы из одной таблицы.
- Создайте отдельные таблицы для каждой группы связанных данных и идентифицируйте каждую строку с помощью уникального столбца или набора столбцов (первичный ключ).
Вторая нормальная форма (2NF)
Вторая нормальная форма (2NF) дополнительно обращается к концепции удаления повторяющихся данных:
- Отвечает всем требованиям первой нормальной формы.
- Удалите подмножества данных, относящиеся к нескольким строкам таблицы, и поместите их в отдельные таблицы.
- Создайте отношения между этими новыми таблицами и их предшественниками с помощью внешних ключей.
Третья нормальная форма (3NF)
Третья нормальная форма (3NF) идет еще дальше:
- Отвечает всем требованиям второй нормальной формы.
- Удалите столбцы, не зависящие от первичного ключа.
Нормальная форма Бойса-Кодда (BCNF или 3.5NF)
Нормальная форма Бойса-Кодда, также называемая «третья и половина (3.5) нормальная форма», добавляет еще одно требование:
- Отвечает всем требованиям третьей нормальной формы.
- Каждый определитель должен быть ключом-кандидатом.
Четвертая нормальная форма (4NF)
Наконец, четвертая нормальная форма (4NF) имеет одно дополнительное требование:
Помните, что эти рекомендации по нормализации являются накопительными. Чтобы база данных находилась в 2NF, она должна сначала соответствовать всем критериям базы данных 1NF.
Следует нормализовать?
Хотя нормализация базы данных часто является хорошей идеей, это не абсолютное требование. Бывают случаи, когда намеренное нарушение правил нормализации является хорошей практикой.
Если вы хотите, чтобы ваша база данных была нормализована, начните с изучения того, как перевести вашу базу данных в первую нормальную форму.
Спасибо, что сообщили нам!
Расскажите, почему!
Другой Недостаточно подробностей Трудно понять1NF, 2NF, 3NF и BCNF в базе данных
Нормализация – это процесс организации данных в базе данных, чтобы избежать избыточности данных, аномалии вставки, аномалии обновления и аномалии удаления. Давайте сначала обсудим аномалии, а затем обсудим нормальные формы с примерами.
Аномалии в СУБД
Есть три типа аномалий, которые возникают, когда база данных не нормализована. Это – аномалия вставки, обновления и удаления. Давайте рассмотрим пример, чтобы понять это.
Пример : Предположим, что производственная компания хранит сведения о сотруднике в таблице с именем employee, которая имеет четыре атрибута: emp_id для хранения идентификатора сотрудника, emp_name для хранения имени сотрудника, emp_address для хранения адреса сотрудника и emp_dept для хранения сведений об отделе, в котором сотрудник работает.В какой-то момент таблица выглядит так:
emp_id | emp_name | emp_address | emp_dept |
101 | Рик | Дели | D001 |
101 | Рик | Дели | D002 |
123 | Мэгги | Агра | D890 |
166 | Гленн | Ченнаи | D900 |
166 | Гленн | Ченнаи | D004 |
Приведенная выше таблица не нормализована.Мы увидим проблемы, с которыми мы сталкиваемся, когда таблица не нормализована.
Обновление аномалии : В приведенной выше таблице у нас есть две строки для сотрудника Рика, поскольку он принадлежит к двум отделам компании. Если мы хотим обновить адрес Рика, мы должны обновить его в двух строках, иначе данные станут несовместимыми. Если каким-то образом правильный адрес будет обновлен в одном отделе, но не в другом, то, согласно базе данных, у Рика будет два разных адреса, что неверно и приведет к несогласованным данным.
Вставить аномалию : предположим, что в компанию присоединяется новый сотрудник, который проходит обучение и в настоящее время не закреплен за каким-либо отделом, тогда мы не сможем вставить данные в таблицу, если в поле emp_dept не допускаются значения NULL.
Удалить аномалию : Предположим, если в какой-то момент компания закроет отдел D890, то удаление строк, которые имеют emp_dept как D890, также приведет к удалению информации о сотруднице Мэгги, поскольку она назначена только этому отделу.
Чтобы преодолеть эти аномалии, нам необходимо нормализовать данные. В следующем разделе мы обсудим нормализацию.
Нормализация
Вот наиболее часто используемые нормальные формы:
- Первая нормальная форма (1НФ)
- Вторая нормальная форма (2НФ)
- Третья нормальная форма (3НФ)
- Нормальная форма Бойса и Кодда (BCNF)
Первая нормальная форма (1НФ)
Согласно правилу первой нормальной формы атрибут (столбец) таблицы не может содержать несколько значений.Он должен содержать только атомарные значения.
Пример : Предположим, компания хочет сохранить имена и контактные данные своих сотрудников. Он создает таблицу, которая выглядит так:
emp_id | emp_name | emp_address | emp_mobile | |
101 | Гершель | Нью-Дели | 8 | 2390 |
102 | Джон | Канпур | 8812121212 92222 | |
103 | Рон | Ченнаи | 7778881212 | |
104 | Лестер | Бангалор | 991238123450987 |
Два сотрудника (Джон и Лестер) имеют два мобильных номера, поэтому компания сохранила их в том же поле, что и в таблице выше.
Эта таблица – не в 1NF , поскольку правило гласит, что «каждый атрибут таблицы должен иметь атомарные (одиночные) значения», значения emp_mobile для сотрудников Джон и Лестер нарушают это правило.
Чтобы таблица соответствовала 1НФ, у нас должны быть такие данные:
emp_id | emp_name | emp_address | emp_mobile | |
101 | Гершель | Нью-Дели | 8 | 2390 |
102 | Джон | Канпур | 8812121212 | |
102 | Джон | Канпур | 92222 | |
103 | Рон | Ченнаи | 7778881212 | |
104 | Лестер | Бангалор | 99123 | |
104 | Лестер | Бангалор | 8123450987 |
Вторая нормальная форма (2НФ)
Считается, что таблица находится в 2NF, если выполняются оба следующих условия:
- Таблица в 1НФ (первая нормальная форма)
- Никакой неосновной атрибут не зависит от правильного подмножества любого ключа-кандидата таблицы.
Атрибут, который не является частью какого-либо ключа-кандидата, называется непервичным атрибутом.
Пример : Предположим, школа хочет хранить данные об учителях и предметах, которые они преподают. Они создают таблицу, которая выглядит следующим образом: поскольку учитель может преподавать несколько предметов, в таблице может быть несколько строк для одного и того же учителя.
учитель_ид | субъект | Возраст учителя |
111 | Математика | 38 |
111 | Физика | 38 |
222 | Биология | 38 |
333 | Физика | 40 |
333 | Химия | 40 |
Ключи кандидатов : {teacher_id, subject}
Неосновной атрибут : teacher_age
Таблица находится в 1 NF, потому что каждый атрибут имеет атомарные значения.Однако его нет в 2NF, потому что непервичный атрибут teacher_age зависит только от teacher_id, который является правильным подмножеством ключа кандидата. Это нарушает правило для 2NF, так как правило гласит: « нет, непервичный атрибут не зависит от правильного подмножества любого ключа-кандидата в таблице».
Чтобы таблица соответствовала 2NF, мы можем разбить ее на две таблицы следующим образом:
teacher_details table:
учитель_ид | Возраст учителя |
111 | 38 |
222 | 38 |
333 | 40 |
Teacher_subject table:
учитель_ид | субъект |
111 | Математика |
111 | Физика |
222 | Биология |
333 | Физика |
333 | Химия |
Теперь таблицы соответствуют Второй нормальной форме (2NF).
Третья нормальная форма (3НФ)
Считается, что конструкция стола относится к 3NF, если выполняются оба следующих условия:
Атрибут, который не является частью какого-либо ключа-кандидата, называется непервичным атрибутом.
Другими словами, 3NF можно объяснить так: таблица находится в 3NF, если она находится в 2NF и для каждой функциональной зависимости X-> Y выполняется по крайней мере одно из следующих условий:
- X – это супер ключ таблицы
- Y – основной атрибут таблицы
Атрибут, который является частью одного из ключей-кандидатов, известен как основной атрибут.
Пример : Предположим, компания хочет сохранить полный адрес каждого сотрудника, они создают таблицу с именем employee_details, которая выглядит следующим образом:
emp_id | emp_name | emp_zip | emp_state | emp_city | emp_district |
1001 | Иоанна | 282005 | УП | Агра | Дайал Баг |
1002 | Аджит | 222008 | TN | Ченнаи | М-Сити |
1006 | Лора | 282007 | TN | Ченнаи | Уррапаккам |
1101 | Лилли | 292008 | UK | Паури | Бхагван |
1201 | Стив | 222999 | MP | Гвалиор | Ратан |
Супер ключи : {emp_id}, {emp_id, emp_name}, {emp_id, emp_name, emp_zip}… так далее
Ключи-кандидаты : {emp_id}
Непростые атрибуты : все атрибуты, кроме emp_id, не- prime, поскольку они не являются частью каких-либо ключей-кандидатов.
Здесь emp_state, emp_city и emp_district зависят от emp_zip. Кроме того, emp_zip зависит от emp_id, что делает непростые атрибуты (emp_state, emp_city и emp_district) транзитивно зависимыми от суперключа (emp_id). Это нарушает правило 3NF.
Чтобы эта таблица соответствовала 3NF, мы должны разбить таблицу на две таблицы, чтобы удалить транзитивную зависимость:
Рабочий стол:
emp_id | emp_name | emp_zip |
1001 | Иоанна | 282005 |
1002 | Аджит | 222008 |
1006 | Лора | 282007 |
1101 | Лилли | 292008 |
1201 | Стив | 222999 |
таблица employee_zip:
emp_zip | emp_state | emp_city | emp_district |
282005 | УП | Агра | Дайал Баг |
222008 | TN | Ченнаи | М-Сити |
282007 | TN | Ченнаи | Уррапаккам |
292008 | UK | Паури | Бхагван |
222999 | MP | Гвалиор | Ратан |
Нормальная форма Бойса Кодда (BCNF)
Это усовершенствованная версия 3NF, поэтому ее также называют 3.5NF. BCNF строже, чем 3NF. Таблица соответствует BCNF, если она находится в 3NF и для каждой функциональной зависимости X-> Y, X должен быть суперключом таблицы.
Пример : Предположим, есть компания, в которой сотрудники работают в более чем в одном отделе . Они хранят данные так:
emp_id | emp_nationality | emp_dept | dept_type | dept_no_of_emp |
1001 | Австрийский | Производство и планирование | D001 | 200 |
1001 | Австрийский | магазинов | D001 | 250 |
1002 | Американский | дизайн и техподдержка | D134 | 100 |
1002 | Американский | Отдел закупок | D134 | 600 |
Функциональные зависимости в таблице выше :
emp_id -> emp_nationality
emp_dept -> {dept_type, dept_no_of_emp}
Ключ кандидата : {emp_id, emp_dept}
Таблица не находится в BCNF, поскольку ни emp_id, ни emp_dept сами по себе не являются ключами.
Чтобы таблица соответствовала BCNF, мы можем разбить ее на три таблицы следующим образом:
emp_nationality table:
emp_id | emp_nationality |
1001 | Австрийский |
1002 | Американский |
emp_dept таблица:
emp_dept | dept_type | dept_no_of_emp |
Производство и планирование | D001 | 200 |
магазинов | D001 | 250 |
проектирование и техническая поддержка | D134 | 100 |
Отдел закупок | D134 | 600 |
emp_dept_mapping таблица:
emp_id | emp_dept |
1001 | Производство и планирование |
1001 | магазинов |
1002 | дизайн и техподдержка |
1002 | Отдел закупок |
Функциональные зависимости :
emp_id -> emp_nationality
emp_dept -> {dept_type, dept_no_of_emp}
Кандидаты ключей :
Для первой таблицы: emp_id
Для второй таблицы: emp_dept
Для третьей таблицы: {emp_id, emp_dept}
Теперь это в BCNF, поскольку в обеих функциональных зависимостях левая часть является ключом.
Объяснение нормализации базы данных. Узнайте о нормализации базы данных… | Лоррейн Ли
Схема базы данных Codey’s Construction с новой таблицей, которая приводит к нарушению правил нормализации в базе данных. База данных, с которой мы будем работать в этом руководстве, предназначена для компании Codey’s Construction (Codey – полезный бот для программирования, который работает с вами в рамках курса, упомянутого ранее). Как видно из схемы выше, база данных содержит таблицы проекты
, job_orders
, сотрудников
и project_employees
.Недавно была добавлена таблица customers
для хранения данных о клиентах.
К сожалению, эта таблица не спроектирована таким образом, чтобы удовлетворять трем формам нормализации … Давайте это исправим!
Первая нормальная форма связана с дублированием и чрезмерной группировкой данных в таблицах и столбцах.
Таблица Codey’s Construction: клиенты
нарушают все три правила 1NF.
- Нет первичного ключа! Пользователь базы данных будет вынужден искать компании по их названию, уникальность которого не гарантируется (поскольку уникальные названия компаний регистрируются для каждого штата).
- Данные не в самом сокращенном виде. Столбец
contact_person_and_role
можно дополнительно разделить на два столбца, напримерcontact_person
иcontact_role
. - Есть две повторяющиеся группы столбцов – (
project1_id
,project1_feedback
) и (project2_id
,project2_feedback
).
Для создания таблицы customers
был использован следующий оператор SQL:
customers
.Изменяя некоторые столбцы, мы можем помочь изменить дизайн этой таблицы так, чтобы она удовлетворяла 1НФ.
Во-первых, нам нужно добавить столбец первичного ключа с именем id
с типом данных INT (6)
:
С помощью этого оператора мы добавили автоматически увеличивающийся первичный ключ в качестве первого столбца в таблице.
Чтобы удовлетворить второму условию, нам нужно разделить столбец contact_person_and_role
:
Здесь мы просто переименовали его в contact_person
и добавили столбец contact_person_role
сразу после него.
Чтобы удовлетворить третьему условию, нам нужно переместить столбцы, содержащие идентификаторы проектов и отзывы о проектах, в новую таблицу с именем project_feedbacks
. Во-первых, давайте отбросим эти столбцы из таблицы customers
:
А затем создадим таблицу project_feedbacks
:
Вот как теперь выглядит схема базы данных:
Измененная схема, которая теперь удовлетворяет 1NF. Как видите, повторяющихся групп больше нет ни в таблице project_feedbacks
, ни в таблице customers
.Мы все еще знаем, что сказал клиент, поскольку project_feedbacks.customer_id
относится к таблице customers
.
Теперь у наших клиентов таблица
удовлетворяет 1НФ! Перейдем ко второй нормальной форме.
Для достижения второй нормальной формы база данных должна сначала удовлетворять всем условиям для 1NF. После этого для удовлетворения 2NF необходимо, чтобы все данные в каждой таблице относились непосредственно к записи, которую идентифицирует первичный ключ таблицы.
Мы нарушаем 2NF, поскольку столбцы contact_person
, contact_person_role
и phone_number
отслеживают данные, относящиеся к контактному лицу, а не к клиенту.Если контактное лицо клиента изменится, нам придется отредактировать все эти столбцы, рискуя тем, что мы изменим значения в одном из столбцов, но забудем изменить другой.
Чтобы помочь Codey’s Construction исправить эту таблицу в соответствии с требованиями 2NF, эти столбцы следует переместить в таблицу, содержащую данные о контактном лице. Во-первых, давайте удалим столбцы в «customers», которые не связаны с нашим первичным ключом:
Обратите внимание, что мы сохранили contact_person_id
, поэтому мы по-прежнему знаем, с кем связаться.Теперь давайте создадим нашу новую таблицу contact_persons
, чтобы у нас было где хранить данные о каждом контакте.
Схема базы данных Codey’s Construction теперь выглядит следующим образом:
Измененная схема, которая теперь удовлетворяет 2NF. Теперь, если контактное лицо для клиента меняется, строительная компания просто должна вставить запись в таблицу contact_persons
и изменить contact_person_id
в таблице customers
.
Чтобы база данных была в третьей нормальной форме, она должна сначала удовлетворять всем критериям для 2NF (и, следовательно, также 1NF).
Тогда каждый столбец должен быть нетранзитивно зависимым от первичного ключа таблицы. Это означает, что все столбцы в таблице должны полагаться на первичный ключ, а не на другие столбцы. Если column_a
полагается на первичный ключ, а также на column_b
, тогда column_a
транзитивно зависит от первичного ключа, поэтому таблица не удовлетворяет 3NF.
Твой мозг болит от чтения? Не волнуйся! Подробнее об этом рассказывается ниже.
Вот как выглядит таблица customers
после того, как мы удовлетворили 1NF и 2NF:
В настоящее время таблица имеет транзитивно зависимые столбцы. Транзитивно зависимая связь находится между город
и почтовым индексом
. Город, в котором находится клиент, зависит от клиента, поэтому это удовлетворяет 2NF; однако город также зависит от почтового индекса. Если клиент переезжает, возможно, мы обновим один столбец, но не другой. Поскольку эта связь существует, база данных не находится в 3NF.
Чтобы исправить нашу базу данных, чтобы удовлетворить 3NF, нам нужно удалить столбец city
из клиентов
и создать новую таблицу zips
для хранения этих данных:
Вот и все! Обнаружение проблем, нарушающих 3NF, может быть трудным, но стоит убедиться, что ваша база данных устойчива к ошибкам, вызванным лишь частичным обновлением данных.
Нормализация базы данных | Как нормализовать модель данных от 0NF до 3NF
Эта статья / руководство объяснит, что такое нормализация базы данных, зачем она вам нужна и как нормализовать модель данных. Мы будем использовать простой пример, чтобы объяснить правила нормализации.
Что такое нормализация базы данных
Нормализация базы данных – это метод организации данных в базе данных.Нормализация – это формальный подход, который применяет набор правил для связывания атрибутов с сущностями. Нормализация используется при проектировании базы данных.
Нормализация базы данных в основном используется для:
- Удалите избыточные данные.
- Обеспечение логического хранения данных (в результате получается более гибкая модель данных).
Нормализация модели данных состоит из нескольких шагов. Эти шаги называются правилами нормализации. Каждое правило называется нормальной формой (1NF, 2NF, 3NF).Первые три формы – самые важные. Существует более трех нормальных форм, но эти формы используются редко и могут быть проигнорированы, что не приведет к гибкости модели данных. Каждая нормальная форма ограничивает данные больше, чем предыдущая нормальная форма. Это означает, что вы должны сначала достичь первой нормальной формы (1NF), чтобы иметь возможность достичь второй нормальной формы (2NF). Вы должны достичь второй нормальной формы, прежде чем сможете достичь третьей нормальной формы (3NF).
0NF: не нормализовано
Данные в таблице ниже не нормализованы, потому что они содержат повторяющиеся атрибуты (contact1, contact2 ,…).
Не нормализованные данные клиента.
Не нормализованная (0NF) таблица / объект в модели данных.
1NF: без повторяющихся групп
В первой нормальной форме объект не содержит повторяющихся групп, и все атрибуты должны иметь уникальное имя.
Сущности могут состоять только из двух измерений. У клиента есть несколько контактов (contact1, contact2, …). Вот почему мы должны создать новую сущность для контактов.Модель данных, содержащая атрибуты с такими именами, как contact1, contact2 и т. Д., Является плохой конструкцией базы данных. Повторяющиеся атрибуты делают ваши данные менее гибкими и затрудняют поиск данных.
2NF: исключить избыточные данные
Сущность находится во второй нормальной форме, если она достигла первой нормальной формы и если все ее атрибуты зависят от полного (первичного) ключа. Сущность с первичным ключом, состоящим только из одного атрибута, находится во второй нормальной форме (2NF).
В нашем примере это ключ CustID + ContactID. Если мы удалим атрибут ContactID, мы гарантируем, что все атрибуты в сущности Customer зависят от нового первичного ключа CustID. Мы создаем новую сущность CustomerContact для отношений между Customer и Contact.
3NF: устранение транзитивной зависимости
Сущность находится в третьей нормальной форме (3NF), если она находится во второй нормальной форме и все ее атрибуты не зависят транзитивно от полного первичного ключа.Транзитивная зависимость существует, когда непервичный атрибут зависит от других непервичных атрибутов, а не от основных атрибутов или первичного ключа. Другими словами: третья нормальная форма означает, что ни один атрибут в сущности не зависит от непервичного атрибута, который, в свою очередь, зависит от первичного ключа.
В нашем примере атрибут AccountManagerRoom транзитивен и зависит от атрибута AccountManager. Необходимо создать новую сущность AccountManager, чтобы мы могли удалить атрибут AccountManagerRoom из сущности Customer.Сущность Customer теперь находится в третьей нормальной форме (3NF).
Модель данных после нормализации
Это модель данных после нормализации базы данных (3NF):
Модель данных после нормализации базы данных.
.