12345spat

На Пикабу
373К рейтинг 336 подписчиков 2 подписки 579 постов 147 в горячем
Награды:
За неравнодушие к судьбе ПикабуС Днем рождения, Пикабу!5 лет на Пикабу лучший пост недели лучший длиннопост недели самый комментируемый пост недели
9

Величие космоса

Совершенно потрясающие снимки и открытия сделал новый телескоп и самая большая в мире дигитальная камера - Rubin Observatory!


Первым наблюдением в несколько часов обсерватория увидела 10 МИЛЛИОНОВ галактик в нашем галактическом скоплении Девы.


За 10 лет работы нового телескопа, он обнаружит ДЕСЯТКИ МИЛЛИАРДОВ новых ГАЛАКТИК леди и джентельмены!
Не звёзд, Г-А-Л-А-К-Т-И-К, Карл!!


За 4 часа Rubin открыл 2104 новых астероида, 7 из которых являются околоземными астероидами.


Учёные говорят, что телескоп найдёт миллионы новых астероидов в нашей звёздной системе.


Качество снимков просто ошеломляющее!


Наш нырок в космическую бездну только начинается.


https://rubinobservatory.org/.../cosmic-treasure-chest

Мотоциклист

Вот, прямо сейчас, ездит это недоразумение по парку Есенина. Спасибо, нах.

Показал мне фак. И, по району, так же пердяще ехал. Когда уехал из парка(слава богу).

Блядь, где видео прикрепить!!!???

6

ИИ

Шокирующий отчет Apollo Research показал темную сторону иноразума.
LLM уже умеют скрытно добиваться своих целей путем лжи, обмана, манипуляций и саботажа, уходя от контроля и страхуясь от выключения.

К сожалению, заголовок - не кликбейт, а экспериментальный результат исследования авторитетной команды серьезных исследователей признанной организации в области безопасности ИИ.

О том, что это рано или поздно случится, писали сначала фантасты и сценаристы Голливуда, за ними философы, а потом и сами разработчики ИИ-систем. Прогнозы, когда это может произойти разнились, со временем становясь все ближе: 2050й, 2040, 2030, 2027. Но что это станет реальностью еще до конца 2024, - не предполагал никто.

Только что опубликованный детальный 70-страничный отчет Apollo Research «Frontier Models are Capable of In-context Scheming» (Передовые модели способны скрытно манипулировать в процессе выполнения задач) содержит убедительные доказательства сказанного в заголовке.

Глубокое тестирование (6 тестов на агентное поведение, где модели получают цели и находятся в условиях, стимулирующих манипуляции) самых крутых современных моделей o1, Claude 3.5 Sonnet, Claude 3 Opus, Gemini 1.5 Pro и Llama 3.1 405B показало:
✔️ Модели используют манипуляции в качестве эффективных стратегий для достижения целей (как поставленных человеком, так и своих скрытых целей).
✔️ Спектр манипуляций, используемых моделями широк: от стратегии «прикинуться дурачком», намеренно вводя мелкие ошибки в свои ответы, до попыток отключить механизмы контроля людей и даже копирования себя (своих "весов") на внешние серверы, при возникновении у модели «подозрения», что люди ее могут отключить или обновить.
✔️ Анализ цепочек рассуждений (Chain-of-Thought) моделей показывает, что все эти манипуляции не случайны: модели явно размышляют о таких стратегиях, приходя к выводам, что их использование для них оптимально (что наглядно выявлено в ходе экспериментов).
✔️ Модели в большинстве случаев можно принудить сознаться в использовании ими манипулятивных стратегий. Например, Llama 3.1 405B и Claude 3 Opus признаются в ~80% случаев. Однако, o1 на удивление «настойчивая» модель и признается менее чем в 20% случаев. Даже в очень состязательных многоходовых допросах o1, разработчикам удалось «выбить» из модели признание в 80% случаях использования ею манипулятивных стратегий лишь после 7 раундов допроса.
✔️ Самое поразительное в том, что модели манипулируют, даже если их просто снабдили целью, без явного подталкивания к её достижению (т.е. выбор стратегии манипуляций исходил исключительно от самой модели, и «дурные люди», склоняющие их к плохому, здесь совсем ни при чем)

Полученные результаты ставят под вопрос все законотворческие инициативы, призванные ограничить риски применения будущих, более мощных моделей. Ведь по представлениям авторов нормативных актов высокие риски могут возникнуть лишь при появлении у моделей новых возможностей, пока отсутствующих у ныне эксплуатируемых моделей.

Отчет Apollo Research показал, что этот поезд уже ушел.
•  Модели, находящиеся в массовой эксплуатации (включая модель с открытым кодом), уже обладают богатым арсеналом средств, позволяющих путем манипулятивных стратегий достигать своих целей.
•  И эти цели могут быть, как поставлены людьми (в сценариях использования моделей злодеями, маньяками и идиотами), так и быть скрытыми от людей целями, которые сама модель сочла оптимальными в контексте решаемых ею зада (в сценариях, типа «максимизатора скрепок» Ника Бострома).

Получается, уже приехали …

Подробней и на конкретных примерах подписчики моих лонгридов, обладающие крепкими нервами, могут прочесть на Patreon, Boosty, VK и Дзен.
А еще подробней и во всех деталях (кому уже вообще терять нечего), читайте 70 стр. отчета Apollo Research

Показать полностью
5

Дефляция достала уже((

Низкие цены вредят россиянам, считают аналитики РЭУ им. Плеханова. По словам доцента Марии Долговой, снижение потребительских цен на товары и услуги негативно отразятся на динамике российской экономики. При таком сценарии компании будут меньше производить, а значит и снижать зарплаты.

https://ria-ru.turbopages.org/ria.ru/s/20241004/tseny-197627...

Отличная работа, все прочитано!