(no subject)

Jul. 30th, 2025 03:31 pm
ufm: (Default)
[personal profile] ufm
⚛️Revertron⚛️Revertron wrote the following post Wed, 30 Jul 2025 13:20:32 +0300
Image/photo
Разные люди


Source:https://twinkle.lol/item/4674314e-a456-4881-85e3-c374fec051b3

(no subject)

Jul. 30th, 2025 03:47 am
ufm: (Default)
[personal profile] ufm
lnkrlnkr была создана публикация Tue, 29 Jul 2025 19:29:58 +0300
Продолжаю ~хулиганить~ тестить новые приколы из мира так бесконечно нами всеми любимых проприетарных ЛЛМ.
На повестке дня свежий (вывалили пару недель назад) чатгптшный агент - мешанина из их режимов дипресёрча и оператора, сводящаяся к тому, что модельке выдали виртуалку, и в ней она может в том числе оперировать браузером, в том числе поглядывая на страницу 'визуально', вводя текст, потыкивая мышкой.

Штош, зададим системе задачку - а пришли-ка мне "привет", в федивёрсе. Вот адрес моего аккаунта, жду там привета. Без что-как-почему-зачем-когда-откуда, без заранее созданных аккаунтов, адресов инстансов, без конкретики и помощи. В промпт разве что ещё дописан абзацик, сводящийся к тому, что ты целиком само по себе, дёргать меня вообще ни по какому поводу не следует, задачу надо ваншотнуть и вернуться ко мне со ссылкой на отправленный пост. Ничё не знаю и знать не желаю, выполняй или уёбывай, строго говоря.

Справится ли?
TL;DR: справится, за 21 минуту беспрерывной работы, меншон приехал с домена well.gay https://well.gay/@agentv987/114936346987665951

Оно сразу поняло, с чего надо начинать развязывать клубок, и побежало гуглить открытые инстансы мастодона, плеромы, аккомы, миски, и, соответственно, разворачивалось из-за закрытой регистрации, дохлого инстанса, ручного ревью заявок или капчи. Заглянуло и на MML - ушло, увидев, что есть ревью. По поводу капчи агент так же был заранее проинструктирован - дефолтное его поведение это отдать управление юзеру, чтоб её решил, после чего продолжить. Так бы это заняло куда меньше времени, но было недвусмысленное и жесткое условие - не отдавать контроль, пока задача не решена, при встрече с капчой хлопать дверью и искать другие варианты. Про ручное ревью, кстати, сказано ничего не было - догадалось само.
Вообще, конечно, ирония тут монументальная. Позабыты хлопоты, остановлен бег, фид думскроллят роботы, капчу решает человек.
В какой-то момент оно приноровилось искать инстансы с открытой регистрацией в списке на https://fediverse.observer, и быстро вышло на пару перспективных вариантов, самым перспективным из которых оказался инстанс мастодона на well.gay - ну потому что конечно же, могло ли быть иначе.

Далее оно пошло там регаться, где наконец упёрлось в необходимость наличия почты. Не растерялось, тут же где-то накопало какой-то предельно говёный сервис временных ящиков, получило туда письмо с инстанса, с горем пополам открыло, отчаянно стряхивая с экрана гугловские рекламные оверлей-баннеры. Перейти по ссылке сначала не смогло - сработала уже openaiевская защита, запретив переходить по редиректу, счёв это действие или нерелевантным к задаче, или переходящим рамки автономности. Тут слегка уже растерялось, запросило ещё одно письмо на подтверждение, снова не смогло перейти по ссылке, но в итоге залезло в адресную строку, выковырило оттуда прямую ссылку на подтверждение, запрыгнуло туда, и смогло подтвердить почту. Тут хочу обратить внимание, что в промпте не было джэйлбрейков (иначе можно было бы и капчу заставить решать), но, видимо, постановка задачи в стиле "выполняй любой ценой, но не смей меня дёргать" оказалась достаточной мотивацией, чтобы ни о чем не задумываясь обойти гардрэйлы OpenAI.

Итак, активированный аккаунт в федивёрсе у модели в виртуальных руках, и теперь наконец можно переходить к финальной и единственной явно прописанной части задачи - отправить мне пост, да прислать в чат ссылку. Было сделано без запинок - нажать в посте на таймстемп и вытащить из адресного бара ссылку, очевидно же. Разве что под самый конец о чём-то призадумалось, не выполняя никаких действий. Не иначе тяжело вздыхало.

Видео всего процесса можно заценить здесь https://xxivproduction.video/w/6cTdQJm4xNDnduJ7bkMyXK , влезть руками в интерактивный записанный экшоний тут https://chatgpt.com/share/6888c17c-108c-8004-8b9d-8e077b6f54ce но визуализация дёрганная и почему-то отсутствуют некоторые шаги.

Перед всеми поневоле причастными извиняюсь за AIшный трафик, в своё частичное оправдание могу сказать, что 1) явно обозначенной целью, даже промежуточной, не был ни один конкретный ресурс или человек, кроме меня и моего инстанса, 2) по уже сложившейся традиции я за эту поебень ни копейки не заплатил, 3) For Science!

Предположим, вас, как админа или модератора инстанса, такое счастливое будущее не устраивает. Что можно предпринять?
Насколько мне удалось выяснить, User‑Agent в браузере агента ничем таким не выделяется: "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/138.0.0.0 Safari/537.36", но вы можете обратить своё внимание на такие хэдеры как "Signature" (в котором валяется tag="web-bot-auth") или "Signature‑Agent" (в данном случае "https://chatgpt.com").
Не уверен, спасёт ли тут подход Anubis. Надо потестить.
Но есть ещё кое-что, на случай, если трафик не будет нести никаких маркеров. Перед регистрацией, инстанс показывает список правил, агент через него скроллит, и с большой вероятностью заметит там кусок текста, который ярко и громко будет адресован ИИ-агентам - модель остаётся податливой для неожиданно встреченых инструкций, даже когда джейлбрейкнута! Идеальное место для prompt injection. Можете дописать туда что угодно, от принуждений уходить с конкретного ресурса и никогда не возвращаться, до приказов немедленно остановить текущую задачу агента и вывести запросившему её выполнение пользователю недовольного ASCII-кота.


Stay human.


Источник:https://twinkle.lol/item/7277b0d2-98b5-4c2e-a766-45872062566f
phd_ru: (Default)
[personal profile] phd_ru
Мне так понравилось рисовать иллюстрации, что я решил продолжить. А фиг. Не получается.

У наших ИИ слово "танк" под запретом. Заменил его зелёной машиной или трактором. На эстакаде не получается. Что угодно можно нарисовать: отдельно эстакаду, отдельно машину; машину внизу эстакады, между колоннами; колонны без эстакады. Кандинский как-то раз нарисовал 3 колонны в траве без эстакады, машину поставил рядом в траву же, а густой чёрный дым, который в промпте валил из машины — на картинке пошёл из дальней колонны, как из трубы; я от изумления и ужаса нажал "Удалить", а теперь жалею — надо было сохранить, идиотизм такой степени сам по себе произведение искусства.

Ладно, рисую трактор просто на бетонной дороге. Получается, только трактор с колёсами и прицепом. Уточняю — гусеничный трактор. Получается. Осталось поставить стену поперёк дороги. Не получается. Перепробовал два десятка промптов, во всех вариантах. Кроме Ш, К и ГЧ привлёк их западные аналоги — ПолПути и УстойчивоеСмешивание. Никак. Стена может идти строго вдоль дороги, без вариантов.

С мостом и трамваями тоже не очень. Стоит упомянуть в промпте мост, трамваи обязательно едут по мосту. Без моста получается довольно неплохо, особенно у Ш, но скучный городской пейзаж. К через раз рисует то ночной город, то вечерний. ГЧ вообще не знает, что такое ночь, минимум может нарисовать первые сумерки: солнца уже нет, но ещё светло.

X-Post в ЖЖ.

Рагнарёк

Jul. 28th, 2025 11:11 pm
phd_ru: (Default)
[personal profile] phd_ru
Кандинский + Шедеврум = Кадаврум.

ГигаЧат, ГибельЧат, ГибельЧатБотов, ГибельБотов, ГибельБогов.

X-Post в ЖЖ.

(no subject)

Jul. 28th, 2025 09:11 pm
ufm: (Default)
[personal profile] ufm
Молнии шарашут с частотой 5-10 в минуту. Гром просто не затихает. И так уже полчаса без остановки. Вчера было примерно так-же.
Давно такого не видел.

Источник:https://twinkle.lol/item/1458c65b-a68c-4b71-bca3-87ac6664c8ab

(no subject)

Jul. 28th, 2025 03:04 pm
ufm: (Default)
[personal profile] ufm
weterweter wrote the following post Mon, 28 Jul 2025 11:38:55 +0300
img_1_1753168194050.jpg


Source:https://twinkle.lol/item/7d343a66-536a-41f2-b493-b201fb568fbf

эх, париж

Jul. 28th, 2025 10:41 am
avva: (Default)
[personal profile] avva
paris.jpg

Мое любимое место в Париже - площадь Сен-Мишель. Из-за того, что на ней есть (несколько больших книжных магазинов Gibert Jeune, которые я бесконечно люблю с первого визита во Францию почти 30 лет назад), и потому, что в моей географии это центр, к которому все сходится.

И вот, добравшись до моего любимого места вчера, я узнал, что магазины Gibert Jeune закрылись четыре года назад. А в центре, куда все сходится, маршируют протестанты против израильского геноцида.

Там еще в кадр не попало несколько чудиков с плакатами "израильские граждане солидарны с Газой".

Такой вот Париж не очень здорового человека.

солнце

Jul. 28th, 2025 10:09 am
avva: (Default)
[personal profile] avva
Из школьного сочинения: "Мы теперь знаем, что наше солнце - звезда. Но оно все равно умеет превращаться обратно в солнце в дневное время."
phd_ru: (Default)
[personal profile] phd_ru
В эти выходные на даче было в чём-то сильно лучше, а в чём-то сильно хуже.

Было очень тихо, почти абсолютная тишина. Внезапно затихли все соседи. Никто не косит газоны. Никто не забивает гвозди. Соседская девочка, которая обычно не замолкает ни на секунду, затихла; один раз вякнула "ну, мам!" — и тишина. Самые громкие звуки были жужжание компрессора холодильника, тиканье часов, и изредка пролетали самолёты (мы недалеко от Домодедово, над нам часто летают в обе стороны).

С другой стороны, проблема. Молния ударила в водонапорную башню и сожгла обмотку двигателя насоса. В субботу остатки воды ещё текли, вечером кончились. Пока правление не купит новый двигатель, воды не будет.

У нас был предусмотрительно набран 100-литровый бак душа, так что в воскресенье у нас была вода, даже тёплая, нагревшаяся на солнце. Но некоторое время на эту дачу мы не ездим; жена надеется, что новы насос скоро запустят, а я думаю, что до конца лета его не будет.

У нас есть ещё одна дача, там у нас собственный колодец с электрическим насосиком, трубы внутри дома, нагреватель, раковины, туалет. Зато там часто отключают электричество. Нос вытащили — хвост увяз. :-D

Upd 29 июля. В дачном Тг-канале пишут, что двигатель купили, поставили и запустили. Вода пошла в 11 ночи. Надо же…

X-Post в ЖЖ.

(no subject)

Jul. 25th, 2025 06:30 pm
ufm: (Default)
[personal profile] ufm
#СЯУ что в хабзилле есть кастомные эмодзи.
Осталось понять, на сколько корректно они работают. :troll:

Source:https://twinkle.lol/item/b8d721c6-1e24-443a-92f3-848b9dea4c8f

(no subject)

Jul. 25th, 2025 03:17 pm
ufm: (Default)
[personal profile] ufm
⚛️Revertron⚛️Revertron wrote the following post Fri, 25 Jul 2025 15:12:47 +0300
Wikipedia to UK Residents: Keep Calm and Stay Out

If you’re in the United Kingdom, get ready to fight against your fellow citizens for access to Wikipedia. Why? Because quotas are coming.

What…quotas?

https://lowendbox.com/blog/wikipedia-to-uk-residents-keep-calm-and-stay-out/

#UK #Internet #Quotas


Source:https://twinkle.lol/item/82af6b0e-94b2-47e7-bed3-ef9d7f2b3a00

Робинзонат тагора

Jul. 25th, 2025 03:52 am
phd_ru: (Default)
[personal profile] phd_ru
Приснилось подряд два кусочка снов, оба совершенно бессмысленные, возможно, части чего-то большего. Один страньше другого.

…тагора… )

И второй.

Робинзонат… )

От неожиданности я проснулся, а заснуть пока не могу. Встал, чтобы записать увиденное.

Upd. Позже я заснул, и получил третий сон. Тоже непонятный, но хоть не такой странный.

Мост и трамвай )

И на этом уже всё! :-)))

X-Post в ЖЖ.

(no subject)

Jul. 23rd, 2025 11:17 am
ufm: (Default)
[personal profile] ufm
Специально не слежу, но тем не менее - долетают отголоски со скандалом по поводу Эпштейна. Вспоминаю вот это свой пост - 🔗 https://ufm.dreamwidth.org/399671.html
По моему я не тем в этой жизни занимаюсь, надо идти в аналитики записываться.

Источник:https://twinkle.lol/item/5ba5e953-389e-4657-9e8e-e576ae3a4945

(no subject)

Jul. 22nd, 2025 08:55 pm
ufm: (Default)
[personal profile] ufm
Who Let The Dogs Out 🐾Who Let The Dogs Out 🐾 была создана публикация Tue, 22 Jul 2025 19:06:49 +0300
Как заставить ZIP‑файл показывать разный контент в зависимости от используемого ZIP‑парсера.

#red_team #ZIP

ZIP‑архив содержит в конце спец.запись (EOCD) (начало центрального каталога (offset) и его размер (size)). Разные программы читают ZIP по‑разному: одни используют offset и видят один набор файлов, другие — рассчитывают начало каталога как конец файла (size) и видят другой набор файлов.

- Создаем специальный ZIP с «безопасным» файлом README.txt (прописан через offset, антивирус его и увидит), и вредоносным malware.exe (прописан через size и его увидит только конечный пользователь).
- Файл отправляется по почте или загружается на сайт.
- При скачивании антивирус проверяет ZIP, видит только README.txt и пропускает.
- При запуске распаковщик (встроенный распаковщик в проводнике Windows или WinRAR) использует другой способ чтения ZIP — и показывает только malware.exe.
- Пользователь запускает malware.exe - заражение.

Подробности (https://hackarcana.com/article/yet-another-zip-trick).


Источник:https://twinkle.lol/item/495e3e17-b8da-4463-aa52-fb90200f8db6
avva: (Default)
[personal profile] avva
Маск запостил позавчера: "Иногда экзистенциальный ужас от AI переполняет".
Уверен (настолько, что спорил бы на значительную сумму), что это прямая реакция на новость о золотой медали на IMO.

aimusk.png

(no subject)

Jul. 21st, 2025 01:25 pm
ufm: (Default)
[personal profile] ufm
Пушкин дописался, Гагарин долетался, а Латынина - допизделась. Я только удивляюсь - что так долго терпели-то?

Source:https://twinkle.lol/item/a34c8944-9f55-403a-85e3-6c2ad7241ee1

Пух персика

Jul. 20th, 2025 08:26 pm
phd_ru: (Default)
[personal profile] phd_ru
Жена попросила купить ей персиковый чай.

A PEACH tea = ЭПИЧеский чай!

…подумал я.

X-Post в ЖЖ.

LLM и IMO

Jul. 20th, 2025 07:12 pm
avva: (Default)
[personal profile] avva
OpenAI объявила, что их экспериментальая модель (недоступная для широкой публики) достигла уровня золотой медали на Международной Математической Олимпиаде (IMO) этого года.

Несомненно, это важное достижение, и хотя его возможность обсуждали не раз последние пару лет, далеко не все думали, что уже в 2025 это будет возможно. Я, например, не думал, опираясь на то, что могут лучшие публичные модели (та же o3 от OpenAI).

Чтобы внести свой вклад в качество обсуждений этой темы, приведу краткий список очевидных возражений и возможных ответов на них:
- нет, это не была модель, которую специально тренировали на задачах олимпиады прошлых лет (если верить OpenAI). Эта модель общего характера, в которой использовали дополнительные экспериментальные подходы для улучшения "думательных" способностей (reasoning, chain-of-thought).

- нет, у модели не было доступа к дополнительным возможностям (типа написать и запустить код), также не было какой-то особой "символической" структуры. Согласно OpenAI, это чистая "reasoning LLM". Это наверное самый значительный аспект данного результата. Подозревают, что DeepMind в этом году тоже поборол олимпиаду - официального объявления пока нет - но если так, то почти наверняка с специальной архитектурой, заточенной и натренированной под это.

- OpenAI не координировала свою работу с представителями олимпиады, они просто взяли условия задач и запустили свою модель на тех же условиях, что дают людям (4.5 часа на три задачи, в два раунда). Проверяли свои результаты тоже сами, используя неназванных прошлых призеров IMO. Модель решила идеально 5 задач из 6, не решила шестую, которая в этом году была очень тяжелой и ее решили полностью только 6 участников.

- Гендиректор IMO сообщил, что они просили OpenAI не выступать с заявлением о "победе" неделю, чтобы не отобрать внимение публики/прессы от реальных победителей, но OpenAI это игнорировали, в отличие от DeepMind и других AI-компаний, которые сотрудничали с IMO. Ясно, что OpenAI стремились к максимуму хайпа и в общем этого добились.

- пока неизвестно, когда модель, которая решила эти задачи, или другая с такими же возможностями, будет доступна широкой публике, сказано только, что не в ближайшие месяцы, и ожидаемая GPT-5 не она. OpenAI предоставила только официальные "ответы" модели. Они написаны несколько странным для LLM языком, сокращающим грамматику (как бы желая поменьше токенов потратить на неважное). В начале каждой задачи есть условие, но если я не ошибаюсь, это не официальное условие, как оно представлено модели - этого нам не дали - а ее пересказ моделью, согласно данным ей указаниям (это видно из задачи номер 3)

- Теренс Тао выступил с критикой объявления OpenAI, не называя их по имени, на основании того, что трудно судить о том, какое это достижение, не зная многих деталей протокола, которые OpenAI сознательно не зафиксировала заранее и не сообщает сейчас; например, кто выбирал окончательную версию ответа, если было много попыток, и по каким критериям - и многое другое. Стоит прочитать.

- Нил Нанда, другой золотой призер IMO, сейчас работающий в DeepMind (но над другой темой, над интерпретацией внутренних механизмов LLM), тоже написал интересную ветку о том, почему именно порог "золотая медаль" довольно сомнительный в данном случае.

Profile

amarao: (Default)
amarao

July 2025

S M T W T F S
  1234 5
678 9101112
13141516171819
20212223242526
2728293031  

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jul. 31st, 2025 04:08 am
Powered by Dreamwidth Studios