Байт

Эта статья входит в число готовых статей
Материал из «Знание.Вики»
Схематичное представление байта и производных от него единиц информации

Байт (англ. byte) (по-русски: Б и байт; международное обозначение: B, byte)— единица хранения и обработки цифровой информации, обрабатываемая процессором одновременно[1]. В современных цифровых системах байт состоит из восьми битов, что позволяет ему принимать одно из 256 (от 0 до 255) уникальных значений (состояний, кодов). В истории вычислительной техники встречались и другие размеры байта (например, 6, 32 или 36 битов), поэтому в некоторых компьютерных стандартах и официальных документах для точного обозначения 8 битов используется термин «октет» (лат. octet).

В большинстве компьютерных архитектур байт является минимальным единичным набором данных, доступным для адресации.

История

Термин «байт» впервые был введён в обиход в июне 1956 года Вернером Бухгольцем во время разработки первого суперкомпьютера под названием IBM 7030 Stretch. Первоначально он означал группу битов в количестве от одного до шести, одновременно передаваемых устройствами ввода-вывода. Позднее в том же проекте количество битов в байте было увеличено до восьми. Для термина было выбрано написание byte, чтобы отличить его от слова bite («укус»). Позже появилось название для 4-битовой единицы «ниббл», происходящее от слова англ. nibble — «откусывать». Написание через y вместо i было выбрано для избежания путаницы со словом «бит» (bit)[2]. Впервые слово byte появилось в печати в июне 1959 года[3].

В середине XX века вычислительные машины таких моделей как БЭСМ-6 и М-220 использовали символы размером 6 битов в 48-битовых или 60-битовых машинных словах. В некоторых системах компании Burroughs Corporation (ныне Unisys) символ состоял из 9 битов. В советском компьютере Минск-32 применялся байт с длиной 7 битов.

Байтовая адресация памяти впервые была применена в линейке компьютеров IBM System/360. В более ранних моделях адресоваться можно было только к машинному слову целиком, что затрудняло обработку текстовых данных, поскольку оно состояло из нескольких байтов.

Причина принятия 8-битовых байтов в System/360, вероятно, связана с использованием BCD-формата для представления чисел: одна десятичная цифра (0—9) требует 4 бита (тетраду) для хранения, один 8-битовый байт может содержать две такие цифры. В байте из 6 битов помещается только одна десятичная цифра, оставляя два незадействованных бита. Размер 8 битов для байта вытекает из 8-битового представления символов в кодировочной системе EBCDIC.

Другая точка зрения основывается на том, что в компьютерах с двоичной системой кодирования наиболее эффективными и удобными для обработки данных являются размеры слов, кратные степеням двойки. К ним относится и 1 байт = 23 = 8 битов. Компьютеры с длинами слов, не кратными двум, оказались менее выгодными и удобными, поэтому постепенно вышли из употребления[4].

Со временем 8-битовые байты стали фактическим стандартом. С начала 1970-х годов в большинстве компьютеров байты имеют размер в 8 битов, а размеры машинных слов кратны 8 битам.

Количество состояний (кодов) в байте

Состояния (коды, значения), которые может иметь один восьмибитовый байт с позиционным кодированием, рассматриваются в рамках комбинаторного анализа. Их количество составляет число размещений с повторениями [a] и вычисляется так[5]:

возможных состояний (кодов, значений), где
  •  — количество состояний (кодов, значений) в одном байте;
  •  — число размещений с повторениями;
  •  — количество состояний (кодов, значений) в одном бите, то есть n = 2;
  •  — количество битов в байте, в восьмибитовом байте k = 8.

Производные единицы

Измерения в байтах
ГОСТ 8.417—2002 Приставки СИ Приставки МЭК
Название Обозначение Степень Название Степень Название Обозначение Степень
байт Б 100 100 байт B Б 20
килобайт Кбайт 103 кило- 103 кибибайт KiB КиБ 210
мегабайт Мбайт 106 мега- 106 мебибайт MiB МиБ 220
гигабайт Гбайт 109 гига- 109 гибибайт GiB ГиБ 230
терабайт Тбайт 1012 тера- 1012 тебибайт TiB ТиБ 240
петабайт Пбайт 1015 пета- 1015 пебибайт PiB ПиБ 250
эксабайт Эбайт 1018 экса- 1018 эксбибайт EiB ЭиБ 260
зеттабайт Збайт 1021 зетта- 1021 зебибайт ZiB ЗиБ 270
йоттабайт Ибайт 1024 йотта- 1024 йобибайт YiB ЙиБ 280
роннабайт - 1027 ронна- 1027 - - - -
кветтабайт - 1030 кветта- 1030 - - - -

Префиксы для кратных и дольных величин, используемые при производстве производных единиц для байта, имеют свои особенности. Уменьшительные приставки не используют вообще, а единицы измерения информации меньше байта обозначаются специальными терминами — ниббл (наполовину байт, тетрада) и бит. Увеличивающие приставки применяются кратно либо 1024 = 210, либо 1000 = 103. Например, 1 кибибайт соответствует 1024 байтам, а 1 мебибайт1024 кибибайтам или 1024×1024 = 1 048 576 байтам, продолжаясь аналогично для гиби-, теби- и пебибайтов.

Иными словами, 1 килобайт равен 1000 байтам, 1 мегабайт1000 килобайтам или 1000×1000 = 1 000 000 байтам, и так далее для гига-, тера- и петабайт. Расхождение в объёмах, представленных в кило = 103 = 1000 и киби = 210 = 1024, увеличивается по мере повышения размеров самих приставок. МЭК предлагает использование двоичных префиксов — таких как кибибайт, мебибайт, йобибайт и им подобных[6].

На практике десятичные приставки используют буквально, не учитывая степени двойки, например, при описании мощности жёстких дисков: гигабайт (или гибибайт) может обозначать не 1 073 741 824 = 10243 байтов, а миллион килобайтов (или кибибайтов), то есть 1 024 000 000 байтов либо просто миллиард байтов.

Обозначение

В ГОСТ 8.417-2002, который устанавливает правила для обозначения единиц величин, регламентируется использование русской заглавной буквы «Б» для байта. Этот стандарт одобрен Межгосударственным советом по стандартизации, включающим страны СНГ. Также документ упоминается в Постановлении Правительства РФ от 31 октября 2009 года № 879. Согласно ГОСТу, традиционно приставки СИ применяются с термином «байт» для обозначения множителей, представляющих степени двойки: 1 Кбайт = 1024 байт, 1 Мбайт = 1024 Кбайт, 1 Гбайт = 1024 Мбайт и так далее, с использованием заглавной буквы «К» вместо строчной «к». В документе также отмечается, что это использование префиксов СИ не является технически правильным. В соответствии с ГОСТ IEC 60027-2-2015. Маленькая «к» равняется 1000, тогда как «Ки» обозначает 1024, поэтому 1 КиБ — это 1024 Б, а 1 кБ — 1000 Б.

Для использования в электротехнической и электронной сферах рекомендуется следующие обозначения[7]:

  • bit — для бита;
  • o, B — для октета, байта.

Склонение слова

Помимо классической формы родительного падежа во множественном числе (например: байтов, килобайтов, битов), существует также счётная форма, такая как «байт» без окончания множественного числа, используемая с цифрами. Звучит как 8 байт, 16 килобайт[8]. Употребляется в быту и в профессиональном сленге, нередко используется в технической документации. Подобный случай встречается и с килограммами: обычное окончание используется в отсутствии числительного, а с числительным допустимы варианты: 16 килограммов (стандартная орфографическая форма) и 16 килограмм (бытовая счётная форма).

См. также

Примечания

Коментарии

  1. В комбинаторике размеще́нием называется упорядоченный набор из различных элементов из некоторого множества различных элементов.

Источники

  1. Положение о единицах величин, допускаемых к применению в Российской Федерации. Утверждено Постановлением Правительства РФ от 31 октября 2009 г. № 879 (недоступная ссылка). Дата обращения: 3 октября 2024. Архивировано 2 ноября 2013 года.
  2. Buchholz W. The Word 'Byte' Comes of Age... (англ.) // Byte Magazine. — 1977. — Vol. 2, iss. 2. — P. 144.
  3. Blaauw G. A., Frederick Brooks, Buchholz W. Processing Data in Bits and Pieces (англ.) // IRE Transactions on Electronic Computers. — 1959. — P. 121.
  4. Меры и единицы количества и объема информации. Энтропия. Лекции.Ком. Дата обращения: 3 октября 2024.
  5. Какое количество байт содержится в слове. Дата обращения: 3 октября 2024.
  6. Понятие информации. Количество информации. Единицы измерения информации. ЗФТШ. Дата обращения: 3 октября 2024.
  7. ГОСТ IEC 60027-2-2015 Обозначения буквенные, применяемые в электротехнике. Часть 2. Электросвязь и электроника (с Поправкой) от 09 октября 2015 - docs.cntd.ru. docs.cntd.ru. Дата обращения: 1 декабря 2021. Архивировано 1 декабря 2021 года.
  8. Русский орфографический словарь: около 180 000 слов [Электронная версия] / О. Е. Иванова, В. В. Лопатин (отв. ред.), И. В. Нечаева, Л. К. Чельцова. — 2-е изд., испр. и доп. — М.: Российская академия наук. Институт русского языка имени В. В. Виноградова, 2004. — 960 с. — ISBN 5-88744-052-X.

Ссылки