amarao

You're viewing

amarao's journal
Create a Dreamwidth Account Learn More

Reload page in style: site light

В связи с релизом gpt-oss с 4-битным форматом, объяснение этого формата проще показать в виде перечисления, чем длинной простыни рассуждений.

4-битный float (MXFP4) позволяет записать следующие числа:

{-6.0, -4.0, -3.0, -2.0, -1.5, -1.0, -0.5, -0.0, 0.0, 0.5, 1.0, 1.5, 2.0, 3.0, 4.0, 6.0}

И вот вся AI вот на этом типе данных и держится. С учётом потерянного полубита в районе нуля, чую я, что троичные форматы не за горизонтом... Ну или, в этом контексте, base15. Объективная экономия 6%. Если только кто-то научится их быстро умножать и складывать...

Flat | Top-Level Comments Only

From:

permeakra

Если это не обучение, то по нынешним временам это не HPC *в том понимании, к которому я привык*. Лично я привык относить к HPC системы под задачи, которые подразумевают рабочие множества от терабайта, которые на кластере на пару тысяч ядер общего назначения надо гонять часы и дни. Например ab initio обсчет прогноза погоды на пару недель.

Вот обучение модели с последующим её остругиванием - может быть и HPC.

From:

amarao

Я говорю про inference.

Допустим, запустили задачу в agentic mode с subagents и она пишет код бегает часы, а то и дни.

Общего назначения кластер там, или H200 в потолок перемножением матриц загружена, это вопрос деталей реализации. Просто нужно перемножить 8e+18 матриц и всё тут. Чем быстрее, тем лучше.

From:

permeakra

Для тебя как пользователя это детали реализации. А для организации процесса там есть разница.

Если, грубо говоря, у тебя рабочее множество помещается в память одной машины - это один коленкор. Если нет и тебе нужно творчески его распределять по нодам кластера - совершенно другой.

Flat | Top-Level Comments Only

Profile

amarao

April 2026

S	M	T	W	T	F	S
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

Page Summary

permeakra - (no subject)

Style Credit

Style: Pink Panther for Lefty by sarken

Expand Cut Tags

No cut tags

Page generated Apr. 12th, 2026 09:44 pm

4-битный AI

Navigation

4-битный AI

no subject

no subject

no subject

Profile

April 2026

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags