amarao: (Default)
amarao ([personal profile] amarao) wrote2024-12-12 10:06 am

Гёдель и эмбеддинг

Я человек, ужасно неквалифицированный в этих вопросах. Но это совершенно мне не мешает думать (и писать про это), скорее, даже помогает.

В начале 20ого века Гёдель перевернул математику (или, скорее, даже зачал компьютеры), придумав схему кодирования всего. Схема называется "ординалы Гёделя" и она описывает процесс уникального кодирования любого высказывания в форме произведения степеней простых чисел, где каждое число в формуле что-то кодирует. Надеюсь, не переврал.

Детали этого кодирования важны только в смысле "работает", а суть состоит в том, что у нас каждому высказыванию можно сопоставить число. Уникальное число. Уникальность связи высказывания и числа дало могучий аппарат для математики и заложила основы устройства памяти компьютеров. Очередь из байтов может быть интерпретирована как сумма степеней числа 256.

Гёделевы ординалы дали нам идеи счётности и уникальности высказываний.

Начало 21 века. Эмбеддинг. Каждое высказывание кодируется набором чисел (как у Гёделя), но теперь у нас появилось понятие "дистанции" между высказываниями. Близкие по дистанции высказывания синонимичны или почти синонимичны, далёкие по дистанции высказывания - различны. Появилась возможность группировки высказываний и нахождения структур между высказываниями (легендарное сходство многих процессов в физике по формульности, теперь имеет математическое выражение).

Гёдель: каждое высказывание - это число.
Эмбеддинг: похожие высказывания близки (в математическом смысле "близости").

Вот так вот 100 лет развития науки в два шага.
juan_gandhi: (Default)

[personal profile] juan_gandhi 2024-12-12 01:04 pm (UTC)(link)
Ну в смысле не суммы степеней, а произведения же.

Непонятно, однако, как обеспечить эту метрику, чтобы она соответствовала нашим представлениям. Ну, т.е. есть алгоритмы. Типа сначала назначим случайные векторы, и, имея определённую формулу для метрики, будем эти векторы сдвигать, градиентным спуском, чтобы расстояние соответствовало. (А потом ещё подкрутим - есть на это алгоритмы.)
juan_gandhi: (Default)

[personal profile] juan_gandhi 2024-12-12 11:11 pm (UTC)(link)
Ну да. Я с этим баловался лет пять назад. Заодно понял, какая Скала медленная вещь (пришлось кое-что на Джаву переписывать).