amarao: (Default)
[personal profile] amarao
В связи с релизом gpt-oss с 4-битным форматом, объяснение этого формата проще показать в виде перечисления, чем длинной простыни рассуждений.

4-битный float (MXFP4) позволяет записать следующие числа:

{-6.0, -4.0, -3.0, -2.0, -1.5, -1.0, -0.5, -0.0, 0.0, 0.5, 1.0, 1.5, 2.0, 3.0, 4.0, 6.0}

И вот вся AI вот на этом типе данных и держится. С учётом потерянного полубита в районе нуля, чую я, что троичные форматы не за горизонтом... Ну или, в этом контексте, base15. Объективная экономия 6%. Если только кто-то научится их быстро умножать и складывать...

Date: 2025-08-07 02:14 am (UTC)
sab123: (Default)
From: [personal profile] sab123
https://sab123.dreamwidth.org/775720.html про логарифмическое представление. На самом деле любые операции над 4-бтовыим числами можно легко производить в виде таблицы, там будет всего 256 вариантов.

Date: 2025-08-07 10:05 am (UTC)
kondybas: (Default)
From: [personal profile] kondybas
Так а кроме таблиці - как? Єто ж типичній enum.

Date: 2025-08-07 10:50 am (UTC)
From: [personal profile] ichthuss
Кроме таблицьі - так же, как и с single и double. На них таблиц не напасешься.

Date: 2025-08-07 01:05 pm (UTC)
kondybas: (Default)
From: [personal profile] kondybas
А как можно для сабжа віполнить то же сложение 1.5+1.5 - но без доп.преобразований?

Date: 2025-08-07 06:13 pm (UTC)
From: [personal profile] ichthuss
Не понял вопрос. Для чисел с плавающей запятой 0.75*2^1 + 0.75*2^-1 это будет:
1. Свести к общему показателю (в данном случае он и так общий)
2. Сложить мантиссы: 0.75+0.75 = 1.5
3. Нормализовать: 1.5 = 0.75*2^1
Итого вьіходит 0.75*2^2, т.е. 3.

Date: 2025-08-07 07:22 pm (UTC)
kondybas: (Default)
From: [personal profile] kondybas
Мне кажется, что, все-таки, не 0.75, а 0.5. И не 0.75*2^-1, а 0.5*2^0. И єто только для четірех меньших чисел в множестве. Какими коєффициентами можно получить 2,3,4 и 6 я так сразу и не соображу.

Вероятно, есть какая-то табличка соответствия бинарного представления закодированому флоату. К которой нужно обращаться на каждій чих. Разве нет?

Date: 2025-08-09 12:20 pm (UTC)
From: [personal profile] ichthuss
В принципе, для такого маленького представления табличка может действительно оказаться эффективнее. Но принципиально - нет, здесь нет необходимости ни в какой табличке, все построено строго по логике обычных флоатов и может быть реализовано чисто схемотехнически, логично.

Имеем:
- 1 бит знака
- 2 бита показателя
- 1 бит мантиссы.

При этом мантисса у нас почти всегда нормализованная (т.е. старший бит "1"), поэтому реально мантисса 2 бита, из которых хранится младший, а старший подразумевается. Подразумевается он всегда 1, кроме наименьшего значения показателя - тогда мантисса денормализованная, и старший бит подразумевается 0. Т.е. мантисса может принимать значения 0.75, 0.5, 0.25, 0 (последние два - только в случае денормализации). Или, эквивалентно, можно считать это значениями 3,2,1,0, изменив соответственно интерпретацию показателя.

В итоге имеем (для положительных чисел):
- показатель 00: денормализованная мантисса, коэффициент 2, значения мантиссы 0.0 и 0.25 дают нам числа 0.0 и 0.5
- показатель 01: нормализованная мантисса, коэффициент 2, значения мантиссы 0.5 и 0.75 дают нам числа 1.0 и 1.5
- показатель 10: нормализованная мантисса, коэффициент 4, значения мантиссы 0.5 и 0.75 дают нам числа 2.0 и 3.0
- показатель 11: нормализованная мантисса, коэффициент 8, значения мантиссы 0.5 и 0.75 дают нам числа 4.0 и 6.0

Если интерпретировать мантиссу как 0-3 вместо 0.0 - 0.75, то показатели надо, соответственно, интерпретировать как 0.5 - 2 вместо 2 - 8.

Date: 2025-08-07 10:59 pm (UTC)
sab123: (Default)
From: [personal profile] sab123
1.5 - это третье от нуля положительное число. То есть, видимо, 0011 в двоичном виде. А результат, 3 - это пятое число, то есть 0101. Нам надо сделать вычисление 0011 + 0011 = 0101. Логическая формула для этого вычисления будет:

z0 = z2 = x0 & x1 & ~x2 & ~x3 & y0 & y1 & ~y2 & ~y3
z1 = z3 = ~(x0 & x1 & ~x2 & ~x3 & y0 & y1 & ~y2 & ~y3)

Другие варианты добавятся дизъюнктивно из других вычислений всех возможных входных пар, после чего формулы будет можно упростить через вынеcение общего за скобки.

Date: 2025-08-08 05:19 am (UTC)
kondybas: (Default)
From: [personal profile] kondybas
Как-то непохоже єто на вічисление, на мой дилетантский взгляд. Больше похоже на адресацию в таблично заданной фции. Насчет упрощения имеется в виду что-то вроде
z0 = ~z1 = z2 = ~z3 = (x0 & x1 & ~x2 & ~x3 & y0 & y1 & ~y2 & ~y3)
или более существенное?

Date: 2025-08-08 11:48 pm (UTC)
sab123: (Default)
From: [personal profile] sab123
Начинается с того, что пишутся все 256 возможных комбинаций. Потом для каждого бита результата смотрим, в каких из комбинаций он будет единицей (с нулями смотреть не надо - этих я привел только по случаю того, что н епривел 256 комбинаций). Записываем все эти комбинации как конъюнкции (как я показал) и соединяем в дизъюнкцию - это будет Дизъюнктивная Нормальная Форма для этого бита результата. ПЗУ (таблица) реализует тупо ее в лоб. Если реализовывать логикой, то начинаем выносить за скобки общие множители, чтобы упростить функцию (для классических способов оптимизации - см. карты Карно). В том числе при наличии нескольких битов результата можно выносить общие подвыражения из вычисления нескольких битов.

Date: 2025-08-07 10:50 pm (UTC)
sab123: (Default)
From: [personal profile] sab123
Можно сделать логическую схему с тем же результатом.

Profile

amarao: (Default)
amarao

February 2026

S M T W T F S
123456 7
8910111213 14
15161718192021
22232425262728

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags

No cut tags
Page generated Feb. 26th, 2026 01:08 pm
Powered by Dreamwidth Studios