Байт
Байт (англ. byte) (по-русски: Б и байт; международное обозначение: B, byte)— единица хранения и обработки цифровой информации, обрабатываемая процессором одновременно[1]. В современных цифровых системах байт состоит из восьми битов, что позволяет ему принимать одно из 256 (от 0 до 255) уникальных значений (состояний, кодов). В истории вычислительной техники встречались и другие размеры байта (например, 6, 32 или 36 битов), поэтому в некоторых компьютерных стандартах и официальных документах для точного обозначения 8 битов используется термин «октет» (лат. octet).
В большинстве компьютерных архитектур байт является минимальным единичным набором данных, доступным для адресации.
История
Термин «байт» впервые был введён в обиход в июне 1956 года Вернером Бухгольцем во время разработки первого суперкомпьютера под названием IBM 7030 Stretch. Первоначально он означал группу битов в количестве от одного до шести, одновременно передаваемых устройствами ввода-вывода. Позднее в том же проекте количество битов в байте было увеличено до восьми. Для термина было выбрано написание byte, чтобы отличить его от слова bite («укус»). Позже появилось название для 4-битовой единицы «ниббл», происходящее от слова англ. nibble — «откусывать». Написание через y вместо i было выбрано для избежания путаницы со словом «бит» (bit)[2]. Впервые слово byte появилось в печати в июне 1959 года[3].
В середине XX века вычислительные машины таких моделей как БЭСМ-6 и М-220 использовали символы размером 6 битов в 48-битовых или 60-битовых машинных словах. В некоторых системах компании Burroughs Corporation (ныне Unisys) символ состоял из 9 битов. В советском компьютере Минск-32 применялся байт с длиной 7 битов.
Байтовая адресация памяти впервые была применена в линейке компьютеров IBM System/360. В более ранних моделях адресоваться можно было только к машинному слову целиком, что затрудняло обработку текстовых данных, поскольку оно состояло из нескольких байтов.
Причина принятия 8-битовых байтов в System/360, вероятно, связана с использованием BCD-формата для представления чисел: одна десятичная цифра (0—9) требует 4 бита (тетраду) для хранения, один 8-битовый байт может содержать две такие цифры. В байте из 6 битов помещается только одна десятичная цифра, оставляя два незадействованных бита. Размер 8 битов для байта вытекает из 8-битового представления символов в кодировочной системе EBCDIC.
Другая точка зрения основывается на том, что в компьютерах с двоичной системой кодирования наиболее эффективными и удобными для обработки данных являются размеры слов, кратные степеням двойки. К ним относится и 1 байт = 23 = 8 битов. Компьютеры с длинами слов, не кратными двум, оказались менее выгодными и удобными, поэтому постепенно вышли из употребления[4].
Со временем 8-битовые байты стали фактическим стандартом. С начала 1970-х годов в большинстве компьютеров байты имеют размер в 8 битов, а размеры машинных слов кратны 8 битам.
Количество состояний (кодов) в байте
Состояния (коды, значения), которые может иметь один восьмибитовый байт с позиционным кодированием, рассматриваются в рамках комбинаторного анализа. Их количество составляет число размещений с повторениями [a] и вычисляется так[5]:
- возможных состояний (кодов, значений), где
- — количество состояний (кодов, значений) в одном байте;
- — число размещений с повторениями;
- — количество состояний (кодов, значений) в одном бите, то есть n = 2;
- — количество битов в байте, в восьмибитовом байте k = 8.
Производные единицы
Измерения в байтах | ||||||||
---|---|---|---|---|---|---|---|---|
ГОСТ 8.417—2002 | Приставки СИ | Приставки МЭК | ||||||
Название | Обозначение | Степень | Название | Степень | Название | Обозначение | Степень | |
байт | Б | 100 | — | 100 | байт | B | Б | 20 |
килобайт | Кбайт | 103 | кило- | 103 | кибибайт | KiB | КиБ | 210 |
мегабайт | Мбайт | 106 | мега- | 106 | мебибайт | MiB | МиБ | 220 |
гигабайт | Гбайт | 109 | гига- | 109 | гибибайт | GiB | ГиБ | 230 |
терабайт | Тбайт | 1012 | тера- | 1012 | тебибайт | TiB | ТиБ | 240 |
петабайт | Пбайт | 1015 | пета- | 1015 | пебибайт | PiB | ПиБ | 250 |
эксабайт | Эбайт | 1018 | экса- | 1018 | эксбибайт | EiB | ЭиБ | 260 |
зеттабайт | Збайт | 1021 | зетта- | 1021 | зебибайт | ZiB | ЗиБ | 270 |
йоттабайт | Ибайт | 1024 | йотта- | 1024 | йобибайт | YiB | ЙиБ | 280 |
роннабайт | - | 1027 | ронна- | 1027 | - | - | - | - |
кветтабайт | - | 1030 | кветта- | 1030 | - | - | - | - |
Префиксы для кратных и дольных величин, используемые при производстве производных единиц для байта, имеют свои особенности. Уменьшительные приставки не используют вообще, а единицы измерения информации меньше байта обозначаются специальными терминами — ниббл (наполовину байт, тетрада) и бит. Увеличивающие приставки применяются кратно либо 1024 = 210, либо 1000 = 103. Например, 1 кибибайт соответствует 1024 байтам, а 1 мебибайт — 1024 кибибайтам или 1024×1024 = 1 048 576 байтам, продолжаясь аналогично для гиби-, теби- и пебибайтов.
Иными словами, 1 килобайт равен 1000 байтам, 1 мегабайт — 1000 килобайтам или 1000×1000 = 1 000 000 байтам, и так далее для гига-, тера- и петабайт. Расхождение в объёмах, представленных в кило = 103 = 1000 и киби = 210 = 1024, увеличивается по мере повышения размеров самих приставок. МЭК предлагает использование двоичных префиксов — таких как кибибайт, мебибайт, йобибайт и им подобных[6].
На практике десятичные приставки используют буквально, не учитывая степени двойки, например, при описании мощности жёстких дисков: гигабайт (или гибибайт) может обозначать не 1 073 741 824 = 10243 байтов, а миллион килобайтов (или кибибайтов), то есть 1 024 000 000 байтов либо просто миллиард байтов.
Обозначение
В ГОСТ 8.417-2002, который устанавливает правила для обозначения единиц величин, регламентируется использование русской заглавной буквы «Б» для байта. Этот стандарт одобрен Межгосударственным советом по стандартизации, включающим страны СНГ. Также документ упоминается в Постановлении Правительства РФ от 31 октября 2009 года № 879. Согласно ГОСТу, традиционно приставки СИ применяются с термином «байт» для обозначения множителей, представляющих степени двойки: 1 Кбайт = 1024 байт, 1 Мбайт = 1024 Кбайт, 1 Гбайт = 1024 Мбайт и так далее, с использованием заглавной буквы «К» вместо строчной «к». В документе также отмечается, что это использование префиксов СИ не является технически правильным. В соответствии с ГОСТ IEC 60027-2-2015. Маленькая «к» равняется 1000, тогда как «Ки» обозначает 1024, поэтому 1 КиБ — это 1024 Б, а 1 кБ — 1000 Б.
Для использования в электротехнической и электронной сферах рекомендуется следующие обозначения[7]:
- bit — для бита;
- o, B — для октета, байта.
Склонение слова
Помимо классической формы родительного падежа во множественном числе (например: байтов, килобайтов, битов), существует также счётная форма, такая как «байт» без окончания множественного числа, используемая с цифрами. Звучит как 8 байт, 16 килобайт[8]. Употребляется в быту и в профессиональном сленге, нередко используется в технической документации. Подобный случай встречается и с килограммами: обычное окончание используется в отсутствии числительного, а с числительным допустимы варианты: 16 килограммов (стандартная орфографическая форма) и 16 килограмм (бытовая счётная форма).
См. также
Примечания
Коментарии
- ↑ В комбинаторике размеще́нием называется упорядоченный набор из различных элементов из некоторого множества различных элементов.
Источники
- ↑ Положение о единицах величин, допускаемых к применению в Российской Федерации. Утверждено Постановлением Правительства РФ от 31 октября 2009 г. № 879 (недоступная ссылка). Дата обращения: 3 октября 2024. Архивировано 2 ноября 2013 года.
- ↑ Buchholz W. The Word 'Byte' Comes of Age... (англ.) // Byte Magazine. — 1977. — Vol. 2, iss. 2. — P. 144.
- ↑ Blaauw G. A., Frederick Brooks, Buchholz W. Processing Data in Bits and Pieces (англ.) // IRE Transactions on Electronic Computers. — 1959. — P. 121.
- ↑ Меры и единицы количества и объема информации. Энтропия . Лекции.Ком. Дата обращения: 3 октября 2024.
- ↑ Какое количество байт содержится в слове . Дата обращения: 3 октября 2024.
- ↑ Понятие информации. Количество информации. Единицы измерения информации . ЗФТШ. Дата обращения: 3 октября 2024.
- ↑ ГОСТ IEC 60027-2-2015 Обозначения буквенные, применяемые в электротехнике. Часть 2. Электросвязь и электроника (с Поправкой) от 09 октября 2015 - docs.cntd.ru . docs.cntd.ru. Дата обращения: 1 декабря 2021. Архивировано 1 декабря 2021 года.
- ↑ Русский орфографический словарь: около 180 000 слов [Электронная версия] / О. Е. Иванова, В. В. Лопатин (отв. ред.), И. В. Нечаева, Л. К. Чельцова. — 2-е изд., испр. и доп. — М.: Российская академия наук. Институт русского языка имени В. В. Виноградова, 2004. — 960 с. — ISBN 5-88744-052-X.