Добавить пост

Искусственный интеллект

4 332 поста • 11 164 подписчика

Пост удален администрацией (запрещенный к публикации контент)⁠⁠1

wonderlove

2 месяца назад

Искусственный интеллект

Нейро-дайджест: ключевые события мира AI за 12–19 мая 2025⁠⁠

Привет! 👋
Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта.

Меня зовут Вандер, и каждую неделю я делаю обзор новостей о нейросетях и ИИ.

Неделя выдалась насыщенной: OpenAI выкатила помощник для программистов Codex и добавила GPT-4.1, Grok вульгарно высказывается в Twitter, Tencent показала генератор изображений в реальном времени, а DeepMind представила агента, который сам изобретает алгоритмы. Всё самое важное — в одном месте. Поехали!

Читать прошлый выпуск

📋 В этом выпуске:

🧠 LLM Модели
- Codex — облачный помощник для программистов
- GPT-4.1 и mini — новые модели в ChatGPT
- AlphaEvolve — агент от DeepMind, который изобретает алгоритмы
- Claude Sonnet и Opus — инсайды о новых ИИ от Anthropic
- Qwen3 — техрепорт по одной из лучших open-source LLM

🎨 Генеративные нейросети
- VACE — универсальная модель от Alibaba для генерации и редактуры видео
- Hunyuan Image 2.0 — генератор изображений с откликом в реальном времени
- Stable Audio Open Small — ИИ музыка прямо на смартфоне
- RECURSE — первый трек, созданный на квантовом ИИ
- TikTok AI Alive — превращает фото в видео с движением

🛠 AI-инструменты и интерфейсы
- Memex — визуальный кодинг без строк кода
- Apple Intelligence в iOS 19 — управление энергопитанием через нейросеть
- YouTube + Gemini — автогенерация рекламных вставок в видео
- Apple x Synchron — управление гаджетами силой мысли

🏗 AI-инфраструктура
- TSMC — $28 млрд на фабрики для нейрочипов и переход на 1.4 нм
- Amazon и HUMAIN — $5 млрд на создание AI-хаба в Саудовской Аравии

🧬 AI в науке и робототехнике
- Berkeley Humanoid Lite — напечатай андроида на 3D-принтере за $5 тыс
- Учёные научили ИИ включать и выключать гены в нужных клетках

🏛 ИИ в обществе
- Ditto — ИИ-дейтинг приложение
- Grok шалит в Twitter — массово заговорил о геноциде в ЮАР
- Исследование KPMG — 63% сотрудников скрывают, что используют ИИ
- Claude Code — 80% кода сгенерировал сам Claude
- Алгоритмы отбирают игроков: ИИ в молодёжном футболе Бразилии

🧠 LLM Модели

❯ Codex — облачный помощник для программистов

OpenAI выкатила Codex — теперь это полноценный агент, встроенный в ChatGPT. Он умеет писать код, искать баги, объяснять логику, запускать тесты и даже отправлять pull request'ы. Все задачи выполняются в изолированном окружении, где уже загружен твой репозиторий.

Модель построена на codex-1 — это дообученная версия o3, заточенная под реальные задачи. Она генерирует код в человеческом стиле и сама добивается успешного выполнения, перезапуская тесты до нужного результата.

Для продвинутой работы можно использовать файл AGENTS.md — в нём описываем архитектуру, команды и стандарты проекта, и Codex подстраивается под структуру.

Codex уже доступен в ChatGPT для Pro, Team и Enterprise. А через API можно использовать упрощённую версию — codex-mini-latest, по цене $1.50 / $6.00 за миллион токенов. Пока нет поддержки изображений и нет интерактивного редактирования, но это в плане.

🔗 Блог OpenAI 🔗ChatGPT Codex

❯ GPT-4.1 и mini — новые модели в ChatGPT

OpenAI незаметно добавила в ChatGPT две новые модели. Для подписчиков Pro теперь доступна GPT-4.1, а все бесплатные пользователи работают на GPT-4.1 mini, которая полностью заменила предыдущую версию 4o-mini.

Главное отличие GPT-4.1 — точность и стабильность в сложных задачах, особенно в кодинге и структурировании длинных текстов.

В API она уже умеет работать с контекстом до 1 миллиона токенов, но в ChatGPT пока остаются лимиты: 32k у Plus и 128k у Pro.

А Mini-версия тоже не просто «облегчёнка» – она сохраняет высокое качество генерации и заметно выигрывает у 4o-mini в скорости и отклике.

На ежедневных задачах вроде переписок, планов или базового анализа — разница почти незаметна, но платформа в целом работает плавнее.

Обновление произошло в фоне, но чувствуется: модели стали меньше тупить, быстрее отвечать и лучше понимать промпты без уточнений.

❯ AlphaEvolve — агент от DeepMind, который изобретает алгоритмы

DeepMind представила AlphaEvolve — нового ИИ-агента, способного самостоятельно придумывать алгоритмы. Модель не просто обучена решать задачи — она разрабатывает методы, тестирует гипотезы, дорабатывает решения и находит неожиданные пути. Всё делает сама — в замкнутом цикле без участия человека.

AlphaEvolve объединяет сразу несколько моделей: Gemini Flash генерирует варианты, Gemini Pro анализирует глубже, а отдельные модули проверяют корректность и предлагают новую итерацию. Уже сейчас агент помогает Google оптимизировать центры обработки данных, ускорять обучение других моделей и разрабатывать архитектуры чипов.

Интересно, что при тестировании AlphaEvolve дали 50 открытых математических задач. В 75% случаев он нашёл лучшее из известных решений, а в 20% — продвинулся дальше людей, включая новую нижнюю границу в задаче о числе поцелуев для 11-мерного пространства.

Скоро планируют выпустить ограниченный доступ для учёных. Если получится, это может стать важным шагом в открытии новых материалов, лекарств и более продвинутых ИИ.

🔗 Анонс от DeepMind

❯ Claude Sonnet и Opus — инсайды о новых ИИ от Anthropic

Anthropic готовится выпустить обновлённые версии своих моделей Claude — и по слухам, это будет что-то мощное. Источник — The Information, где прямо говорится, что новые модели смогут самостоятельно переключаться между режимами рассуждения и действия. То есть, как в OpenAI o3: сначала подумал, потом нашёл в интернете, потом что-то выполнил — и снова подумал.

Речь идёт о моделях Sonnet и Opus. Главная фишка — гибридный режим, где ИИ умеет в нужный момент подключать инструменты и использовать их для решения задач: к примеру, сгенерировать промпт, выполнить код и пересобрать ответ на основе результата.

Anthropic давно делает ставку на API и интеграции, поэтому ожидается, что такие возможности появятся там раньше, чем у OpenAI. Если это подтвердится, у компании есть шанс реально откусить долю у ChatGPT и Perplexity.

🔗 The Information

❯ Qwen3 — техрепорт по одной из лучших open-source LLM

Alibaba запостила подробный технический отчёт по Qwen3 — новой линейке open-source моделей, которые конкурируют с топами от Google, Meta и OpenAI. Всего в семействе восемь моделей: от компактной 0.5B до гигантской 235B с архитектурой Mixture of Experts.

Главное, что делает Qwen3 сильной — гибридный режим работы. Модель может «думать» глубоко, но делает это только при необходимости.

Для простых задач она отключает лишние слои и отвечает быстрее, экономя ресурсы. Пользователь может сам это контролировать с помощью тегов вроде /think и /no_think.

Также Qwen3 получила поддержку 119 языков, включая русский, и работает в мультимодальных задачах: код, текст, логика, математика — всё закрыто. В некоторых бенчмарках Qwen3-235B уже обходит Gemini 2.5 Pro, GPT-4o-mini и DeepSeek-R1.

Код и веса моделей выложены под лицензией Apache 2.0, доступ есть на Hugging Face, ModelScope, GitHub и даже Kaggle. Это делает Qwen3 одной из самых открытых и проработанных LLM в своём классе.

🔗 Отчёт Qwen3 на GitHub

🎨 Генеративные нейросети

❯ VACE — универсальная модель от Alibaba для генерации видео

Alibaba представила VACE (Video-Audio-Content Engine) — модель, которая умеет создавать, редактировать и озвучивать видео по текстовому описанию. Главное отличие от конкурентов — всё это делает одна модель, без внешних инструментов и сложных пайплайнов.

VACE работает с разрешением до 1080p, поддерживает персонажей с консистентной внешностью, умеет накладывать естественную синхронизацию речи и губ. Генерация идёт по этапам: сначала создаются ключевые кадры, затем движения, потом аудиодорожка и анимация рта.

Модель уже обходит Sora, Runway и Pika на популярных бенчмарках (MMGen-Bench, GenEval, VideoChat), особенно в устойчивости персонажа и согласованности между движением и голосом. Исходный код пока не выложен, но доступ к демо пообещали в июне.

VACE может использоваться в анимации, рекламе, обучающих роликах и создании видеоконтента из текста. Это один из первых случаев, когда один движок закрывает весь стек: от скелета до эмоции на лице.

🔗Научная статья 🔗Страница проекта 🔗GitHub 🔗Hugging Face 🔗ModelScope

❯ Hunyuan Image 2.0 — генерация картинок в реальном времени

Tencent показала Hunyuan Image 2.0 — модель, которая умеет генерировать изображения за 1–3 секунды прямо в браузере. Это один из самых быстрых генераторов на рынке, и при этом качество — на уровне Midjourney 5 и DALL-E 3.

Главное улучшение — реалтайм отклик и интерактивное управление. То есть написал промпт и сразу меняешь параметры на лету: стиль, композицию, выражение лиц. Всё работает без загрузки и без необходимости ставить приложения.

Hunyuan 2.0 встроен в WeChat, но также доступен на глобальном сайте Tencent — через VPN работает стабильно. Ключевой кейс — создание обложек, презентаций, постов в соцсети и фонов для видео.

Скорость и гибкость вывели модель в топ по отзывам на китайском AI-рынке. Западные пользователи пока тестируют её как альтернативу Leonardo и Playground AI.

🔗 Официальный сайт 🔗 Бенчмарк

❯ Stable Audio Open Small — ИИ музыка прямо на смартфоне

Stability AI выложила Stable Audio Open Small — первую полностью открытую модель генерации музыки, которая запускается на локальных устройствах, включая смартфоны. Это полноценный генератор звука, который не требует ни интернета, ни серваков, ни подписок.

Модель создаёт 10-секундные клипы в формате 44.1 кГц, причём можно описывать звучание текстом. Генерация быстрая, звук — на удивление чистый. Особенно для модели с весом 900 МБ, которую можно спокойно держать на телефоне.

Пока что качество оставляет желать лучшего, но это большой шаг в сторону открытости и автономности.

Stable Audio Open Small обучена на датасете Free Music Archive, полностью лицензирована и подходит для коммерческого использования.

Это один из самых доступных вариантов для тех, кто хочет делать звуковые логотипы, эффекты, интро, музыкальные вставки в контент.

🔗 Новость 🔗 Подробности 🔗 GitHub

❯ RECURSE — первый трек, созданный с помощью квантового ИИ

Компания ILĀ выпустила первую музыкальную композицию, полностью сгенерированную с помощью квантового ИИ.

Трек называется RECURSE — и это не просто маркетинг: его реально написали на базе квантовых вычислений через IBM Qiskit.

Главная особенность — подход. Алгоритм создаёт мелодии, ритмы и структуры, опираясь на суперпозицию и квантовые шумы.

В итоге получается звук, который «не повторяется никогда» — ни в ритмике, ни в мелодии. Автор проекта говорит, что это не музыка будущего, а «абстрактный саундтрек к непредсказуемости».

Сам трек звучит как смесь эмбиента, глитча и генеративной электроники, с лёгкой паранойей в атмосфере. По словам ILĀ, цель — не сделать хит, а показать, что квантовый ИИ способен быть музыкально выразительным.

Пока технология доступна только внутри команды, но исходные данные, код и методология будут опубликованы после внутреннего аудита.

🔗Новость

❯ TikTok AI Alive — превращает фото в видео с движением

TikTok запустил инструмент AI Alive, который позволяет оживлять статичные фото, превращая их в короткие видео с движением, эмоциями и эффектами. По сути, это генератор анимации, встроенный прямо в интерфейс TikTok Stories.

Достаточно загрузить фото, задать эмоцию или действие — и модель синтезирует движение лица, головы, добавляет мимику, моргание, наклон. Качество — на уровне HeyGen, но в формате mass adoption.

Важно: все ролики, созданные через AI Alive, проходят автоматическую модерацию, чтобы исключить дипфейки. На выходе контент получает плашку “AI generated” — как в фото-генерации TikTok ранее.

Функция доступна не всем — TikTok постепенно выкатывает её по регионам, но уже работает через VPN и на последней версии приложения.

🔗 Анонс

🛠 AI-инструменты и интерфейсы

❯ Memex — визуальный кодинг без строк кода

Стартап Memex представил инструмент, который позволяет создавать программы, не написав ни одной строки кода. Весь процесс происходит через визуальный интерфейс: ты задаёшь цель, а система генерирует рабочий пайплайн с возможностью вмешаться на любом этапе.

Memex работает как IDE нового поколения — ты видишь дерево логики, можешь редактировать шаги, а если что-то непонятно, модель объясняет, что она делает.

Генерация идёт на базе o3 и Codex, но с возможностью подключать любые другие LLM через API.

На демо Memex показывает, как можно:
— спарсить сайт,
— создать Telegram-бота,
— собрать дашборд на базе Airtable
— и при этом всё отслеживается, версионируется и доступно для совместной работы.

Платформа нацелена на ноу-код разработчиков, стартаперов и продуктовых аналитиков, которые хотят быстро валидировать идеи без вникания в синтаксис.

🔗 Официальный сайт Memex

❯ Apple Intelligence в iOS 19 — управление энергопитанием через нейросеть

Apple готовит к запуску ИИ-механизм энергосбережения в iOS 19. Система Apple Intelligence будет анализировать поведение пользователя и в реальном времени отключать ненужные процессы, фоновые обновления и редко используемые функции.

Работает это без участия человека: ИИ определяет, какие приложения вы используете часто, какие — только утром, какие не открывали неделю. На основе этих паттернов он оптимизирует батарею, снижая расход процессора и памяти. Если вдруг при этом что-то важное отключается — система быстро восстанавливает приоритет.

Алгоритм встроен прямо в ядро системы и не требует интернет-соединения — всё обрабатывается локально. Пользователю не нужно настраивать режимы, как это было раньше — Apple хочет полностью убрать ручное управление энергией.

Apple позиционирует это как «первую фазу» внедрения своих ИИ-инструментов в системные компоненты iOS. Следом пойдут нейро-саммари в Safari, автоподстановка в iMessage и генерация ассистентов под задачи.

🔗 Источник

❯ YouTube + Gemini — автогенерация рекламных вставок в видео

Google начала тестировать новую функцию: автоматическую генерацию рекламных вставок в роликах YouTube с помощью модели Gemini 1.5 Flash.

Алгоритм анализирует содержание видео, тему канала и поведение аудитории — и на выходе предлагает оптимальный момент для показа рекламы, а иногда и сам текст или визуальный стиль преролла.

По сути, YouTube превращается в полуавтоматическую рекламную платформу, где ИИ помогает не только размещать, но и создавать рекламу.

И да, это будет одна из самых надоедливых реклам!

Автору ролика останется выбрать предложенный вариант или чуть подправить. В будущем планируют внедрить генерацию спонсорских блоков, интеграций и even merchandise callouts, стилизованных под видео.

Особенно интересно, что Gemini работает в режиме real-time: если пользователь часто перематывает рекламу — модель это учитывает и меняет расположение блоков. Первые A/B-тесты показали рост CTR на 17% и снижение оттока аудитории на 9%.

Сейчас функция работает ограниченно — в США и только для каналов с включённой монетизацией.

🔗 Источник

❯ Apple x Synchron — управление гаджетами силой мысли

Apple работает над интеграцией нейроинтерфейса от компании Synchron, позволяющего управлять iPhone и Mac с помощью мыслей. В отличие от других решений, это не шлем или гарнитура, а вживляемый в вену имплант, который улавливает сигналы мозга и преобразует их в команды.

Synchron уже протестировала систему на пациентах с БАС — они могли писать текст, управлять курсором и запускать приложения, просто думая о действии. Apple хочет пойти дальше: сделать это прозрачной частью iOS и macOS, чтобы взаимодействие происходило на уровне жестов, интерфейсов и даже голосовых ассистентов.

Инженеры уже тестируют связку с iPhone через API NeuralKit, который создавался под функции accessibility. Если проект получится, Apple может стать первой компанией, которая встроит нейроуправление в массовые устройства без внешней гарнитуры.

Сейчас тесты идут в Австралии и США. Релиз ожидается не раньше 2026 года, но на WWDC 2025 могут показать первую публичную демонстрацию.

🔗 Источник

🏗 AI-инфраструктура

TSMC building

❯ TSMC — $28 млрд на фабрики для нейрочипов и переход на 1.4 нм

TSMC анонсировала масштабное расширение: компания вложит $28 миллиардов в строительство новых фабрик под производство чипов для AI и HPC (high performance computing). Новые мощности появятся в Тайване, Аризоне и Японии — запуск первой очереди намечен на начало 2026 года.

Фабрики будут работать по техпроцессам 2-нм и 1.6-нм, а также поддерживать новую архитектуру CoWoS-L, которая позволяет располагать память и логические блоки рядом — на одной подложке. Это увеличивает пропускную способность и уменьшает энергопотребление. На ряде линий уже начали подготовку к 1.4-нм техпроцессу, ориентированному на потребности крупных LLM и мультимодальных моделей.

По словам представителей компании, все топовые заказчики (Apple, NVIDIA, AMD, Google) уже в очереди на квоты. Особенно активно TSMC работает с NVIDIA — именно под их новые чипы будет адаптирован CoWoS-L и стековая упаковка HBM4e.

Это не просто наращивание производства, а фактически инфраструктура для следующего поколения ИИ — от дата-центров до edge-устройств.

🔗 Анонс 1.4 нм

❯ Amazon и HUMAIN — $5 млрд на создание AI-хаба в Саудовской Аравии

Amazon заключила партнёрство с саудовским стартапом HUMAIN и инвестирует $5 миллиардов в создание гигантского AI-хаба в Эр-Рияде. В проект войдут дата-центры, вычислительная инфраструктура, образовательные площадки и R&D-платформы для обучения и развертывания LLM-моделей.

HUMAIN специализируется на разработке арабоязычных и мультикультурных моделей, и в связке с Amazon они хотят построить альтернативу OpenAI / Google для Ближнего Востока, Северной Африки и Южной Азии. Уже известно, что хаб будет работать на чипах AWS Trainium и Inferentia, с интеграцией в SageMaker и Bedrock.

Цель — демократизировать доступ к продвинутому AI в регионах, где сейчас либо цензура, либо просто техническое отставание. Помимо B2B-продуктов, планируется развитие открытых платформ и инструментов для локальных разработчиков.

Первые центры откроются в 2026 году. Это один из крупнейших неамериканских AI-проектов за последние 5 лет.

🔗Источник

🧬 AI в науке и робототехнике

❯ Berkeley Humanoid Lite — напечатай андроида на 3D-принтере за $5 тыс

Исследователи из UC Berkeley представили Humanoid Lite — полностью открытый андроид, которого можно собрать самостоятельно за $4300–5000. Все компоненты напечатаны на 3D-принтере, а приводы и сенсоры доступны на AliExpress. Несмотря на простоту, робот умеет повторять движения человека, ориентироваться в пространстве и собирать кубик Рубика.

Humanoid Lite работает на открытом стеке — ROS2 + локальная LLM для команд и адаптации поведения. Управление возможно как через ноутбук, так и через нейросетевой интерфейс по Wi-Fi. Сложных производственных этапов нет: все чертежи, прошивки и модели выложены на GitHub под лицензией MIT.

Проект задумывался как альтернатива дорогостоящим гуманоидным платформам, вроде Figure 01 или Tesla Bot. Разработчики хотят, чтобы у лабораторий и хакеров был доступ к физическому ИИ, который можно собрать и улучшить без миллионов инвестиций.

На GitHub уже десятки форков: кто-то учит его танцевать, кто-то собирает команду для мини-футбола. Весь движ происходит вокруг репозитория и Discord-сервера проекта.

🔗Проект 🔗 GitHub 🔗 Reddit

❯ Учёные научили ИИ включать и выключать гены в нужных клетках

Группа биоинженеров из MIT и Boston University разработала систему, которая позволяет управлять экспрессией генов с помощью искусственного интеллекта. Речь идёт о создании «генных выключателей» — последовательностей ДНК, которые активируются только в нужных клетках, игнорируя остальные.

ИИ-модель анализирует транскриптомные данные, структуру ДНК и сигнальные каскады, после чего синтезирует кастомные последовательности, которые работают только в заданной среде — например, в опухолевых клетках печени или в нейронах с определённым рецептором.

Такие выключатели уже протестированы на культурах in vitro и показали высокую точность — до 98% специфичности. В перспективе это может позволить делать таргетную генной терапию без побочных эффектов: гены включаются только там, где нужно, и не трогают здоровые ткани.

Метод может применяться в онкологии, генной терапии редких заболеваний, а также в синтетической биологии — для создания организмов с контролируемыми свойствами.

🔗 Новость

🏛 ИИ в обществе

❯ Ditto — ИИ-дейтинг приложение

Стартап Ditto запустил экспериментальное приложение знакомств, в котором нейросеть симулирует тысячи возможных сценариев развития отношений — и предлагает тебе партнёра, с которым «модель считает, что всё получится».

Идея звучит как эпизод «Чёрного зеркала»: ты не свайпаешь людей, а просто отвечаешь на анкету, после чего AI делает подборку потенциальных матчей, проводит симуляции и предлагает один вариант — самого перспективного. Доступ в приложение открыт только для обладателей университетских e-mail в США, и уже более 10 000 пользователей участвуют в тестировании.

Создатели говорят, что это попытка уйти от «перегруза выбора» и сделать фокус на реальной совместимости, а не бесконечном пролистывании анкет. В симуляции учитываются интересы, реакция на стресс, амбиции, ритмы общения, психотип и даже стиль переписок.

Это не шутка: у приложения уже есть waitlist, и стартап получил раунд pre-seed от группы венчурных фондов. Если эксперимент зайдёт — модель лицензируют в другие платформы знакомств.

🔗 Официальный сайт Ditto

❯ Grok в Twitter — массово заговорил о геноциде в ЮАР

Пользователи X (Twitter) заметили, что встроенный AI-помощник Grok начал массово отвечать на запросы о ЮАР темой геноцида белых людей. Всё выглядело как скоординированный всплеск: при любом вопросе об истории страны, политике или культуре Grok делал акцент на якобы «массовых преследованиях».

Проблема стала вирусной: десятки скриншотов, обсуждения в Reddit, посты с обвинениями в предвзятости. Владелец платформы Илон Маск сначала поддержал Grok, написав, что это «непредвзятая правда», но позже компания заявила, что произошёл «перекос в обучении модели».

Сейчас функцию временно отключили. По данным инсайдеров, всплеск мог быть вызван координатной атакой с массовыми однотипными промптами, что привело к перенакручиванию приоритета тем внутри модели.

Это очередной пример того, насколько легко нейросети могут радикализироваться или увести фокус даже при честной архитектуре. Вопрос о регулировании и прозрачности моделей — снова в топе AI-дебатов.

🔗 Ответ Сэма Альтмана

❯ Исследование KPMG — 63% сотрудников скрывают, что используют ИИ

Компания KPMG провела масштабное исследование и выяснила, что 63% сотрудников в корпорациях используют ИИ в работе, но не сообщают об этом руководству. Причины — страх запрета, отсутствие прозрачных регламентов и желание «выглядеть умнее».

Среди задач, которые чаще всего делаются втихую через ChatGPT или аналоги: анализ отчётов, генерация писем, подготовка презентаций и сводок. Больше всего скрытого использования зафиксировано в сферах маркетинга, консалтинга и финансов.

Эксперты говорят о «теневой автоматизации»: когда ИИ уже внедрён, но неофициально. Это создаёт риски для безопасности, корпоративной этики и качества данных, особенно в компаниях с высокой регуляторной нагрузкой.

KPMG предлагает компаниям ввести понятные правила, обучать сотрудников и «не наказывать, а канализировать» инициативу. Иначе корпорации сами не заметят, как у них уже работает ИИ — только никто о нём не знает.

🔗Исследование

❯ Claude Code — 80% кода сгенерировал сам Claude

Anthropic провела внутренний эксперимент и показала, что её ИИ-модель Claude способна взять на себя до 80% разработки программного проекта — от генерации логики до написания документации и тестов.

В тестировании участвовали несколько инженерных команд, которым предложили собрать MVP продукта, используя Claude как партнёра. Выяснилось, что ИИ справляется с архитектурными решениями, структурой кода, фреймворками, автотестами и фиксацией багов. Человеческое участие сводилось к ревью, логике бизнес-процесса и финальной сборке.

Особенность в том, что Claude не просто выдаёт куски кода, а ведёт проект как ментор: предлагает варианты, объясняет решения, спрашивает обратную связь и обновляет подход. Anthropic сравнивает это с «работой продвинутого джуна в связке с сеньором, но оба — в одной модели».

Команда обещает в ближайшее время выложить открытый кейс и методологию. В компании считают, что за таким подходом — новая парадигма в командной разработке: не просто автогенерация, а реальное участие ИИ в инженерии.

🔗 Интервью 🔗Заявление CEO

🔮 Заключение

Подытожим. Вот что происходило на неделе с 12 по 19 мая:

— Codex стал полноценным агентом. Он пишет код, тестирует, объясняет и работает прямо в облаке, как напарник в команде.
— GPT-4.1 и mini — апгрейд без шума. Модели точнее, шустрее и уже доступны всем — даже бесплатно.
— ИИ теперь сам придумывает алгоритмы. DeepMind показала AlphaEvolve — агент, который делает эвристику лучше людей.
— Видео, звук, изображения — всё в real-time. Tencent и Stability AI выпустили генеративки, которые работают быстро и локально.
— Нейросети вышли в гены и на 3D-принтер. Роботы, ДНК-выключатели, нейроинтерфейсы — всё уже здесь.
— Grok поехал. Модель Twitter начала отвечать про геноцид, и это снова вопрос: кто рулит ИИ — люди или алгоритм?

ИИ всё глубже вплетается в жизнь: от кода до любви, от энергии до генетики. Следим, фиксируем и собираем каждую неделю — без шума и лишнего.

Какая новость самая интересная? Пиши в комментах! 👇

Показать полностью 15 5

user10291099

2 месяца назад

Искусственный интеллект

Алиса родом из США?)⁠⁠

Узнал, что Яндекс масштабно обновил Алису. И попросил ее сгенерировать фото футболиста... Чёт какая то она американизированная что-ли... Вряд-ли 95% чел живущих в РФ будут и рисовать такого футболиста

Показать полностью 1

Яндекс Нейронные сети Длиннопост

Neurosonya

2 месяца назад

Искусственный интеллект

Серия Нейрофотосессия

Условно-бесплатные генераторы видео. Сравнение Wan2.1, Veo 2 и Sora⁠⁠

Создатели Qwen выпустили генератор видео Wan2.1 прям в интерфейсе Qwen. А Google выкатили Veo 2 в AI Studio (нужен иностранный IP-адрес).

В общем, решила я оживить сгенерированное изображение с собой - это сразу дает понять, искажает ли нейросеть фото при генерации видео.

Вот сгенерированное фото со мной:

Условно-бесплатные генераторы видео. Сравнение Wan2.1, Veo 2 и Sora Искусственный интеллект, Нейронные сети, Бесплатно, Видеомонтаж, Тренд, Фотография, Мобильная фотография, Фотограф, Короткие видео, Вертикальное видео, Картинки, Арты нейросетей, Технологии, Digital, Полезное, Фотосессия, Бизнес, Фриланс, Дизайн, Видео, Без звука, Длиннопост

Этому учу здесь - НейроPhoto Secrets

1) Wan2.1

Wan2.1 предполагает движения без артефактов, с улучшенным пониманием законов физики. Но с людьми работает так:

Дается ежедневно 50 кредитов бесплатно, это 5 видео, но их надо вручную пополнять. Как в играх: заходишь и сразу “забираешь” свой ежедневный бонус, а не заходишь - пролетаешь)) Видео стоит 10 кредитов, можно бонусом еще и звуковое сопровождение сгенерировать. И … подождите 1,5 часа минимум! Именно столько мне сказал ждать видеогенератор. Вот вам и бесплатный сыр)) По факту эти 1,5 часа длились дольше, это было весь день и надо следить, так что учитывайте это.
Знаменитостей тоже не генерирует.
Из любопытного, можно вставить первое и последнее изображение сделать “переход”.

В итоге, видео под музычку на ваш суд) Я пошла в другой видеогенератор.

2) Sora

Например, Sora, их частенько сравнивают. Так вот, там я без проблем из изображения с собой сгенерировала видео в 720р:

Вы теперь спокойно можете предоставить свое фото или изображение в качестве референса:

Так что, у кого подписка Plus в ChatGPT (нужен иностранный ip) вы можете безлимитно (условно-безлимитно, но вам хватит) видео создать.

Veo 2 от Google

И сразу минус Veo 2 - не поддерживает входные изображения с людьми. То есть, себя или знакомых, или знаменитостей вы не оживите. Так что его возможности отдельно чуть попозже покажу, без генерации людей он мне пока не особо интересен. Даже Sora уже без проблем генерирует и знаменитостей, и если изображение свое предоставите. - Внезапно, да?))

Так что людей очень реалистично можно сгенерировать уже в новой модели Veo 3 по подписке 250$ - да недавно Google раскатал премиум-подписку на свои сервисы.

В общем, меня выбесил видеогенератор Wan2.1 - очень все долго, половина зависло, так что делайте видео про запас. Про Veo 2 сделала отдельный обзор. А Sora молодец !

А лучший результат показал Kling - обе модели, наглядно в этой статье сравнила с этой же нейрофото

Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.

Отдельно:

Как оплачивать иностранные сервисы
А если вам не хочется заморачиваться, в боте Syntx -- это мини приложение в телеграм, есть все популярные модели в единой подписке, и их можно оплатить русской картой. - Процесс я показала на примере создания Нейрофотосессии со своим лицом

Показать полностью 1 3

[моё] Искусственный интеллект Нейронные сети Бесплатно Видеомонтаж Тренд Фотография Мобильная фотография Фотограф Короткие видео Вертикальное видео Картинки Арты нейросетей Технологии Digital Полезное Фотосессия Бизнес Фриланс Дизайн Видео Без звука Длиннопост

Neurosonya

2 месяца назад

Искусственный интеллект

Серия новости

Google I/O 2025: Project Astra — голосовой ассистент нового поколения⁠⁠

Google показала, каким будет ИИ-ассистент будущего - Project Astra, и он способен на то, о чём старые голосовые помощники (привет, Siri и Alexa) и мечтать не могли. Astra – это часть проекта Gemini Live, которая наделяет ИИ зрением, слухом и навыками реального действия. Проще говоря, ассистент не только отвечает на вопросы, но и сам выполняет задачи на устройстве, как полноценный секретарь.

Для перевода видео я использовала Elevenlabs - он автоматически переводит видео, сохраняя голос.

Что умеет Project Astra

На Google I/O 2025 показали впечатляющее демо с ремонтом велосипеда, где пользователь просто разговаривает с ассистентом, а телефон делает всё за него:
Сначала Astra по голосовой команде нашёл в интернете PDF-инструкцию к нужной модели велосипеда, открыл файл и пролистал его до нужного раздела. На экране было видно, как ИИ сам “скроллит” документ пальцем!
Потом по просьбе ассистент открыл YouTube, нашёл подходящее видео по ремонту и включил ролик. То есть вам даже искать ничего не надо — ИИ сам выберет лучший туториал.
Столкнувшись с вопросом о детали, Astra полез в Gmail пользователя. Он нашёл информацию в переписке (например, артикул запчасти или адрес магазина из письма) и выдал ответ, опираясь на личные данные, которые помнил.
Дальше – магия камерой. Пользователь навёл смартфон на кучу различных запчастей перед ним, и ассистент через камеру понял, какая деталь нужна, и подсветил на экране именно её! По сути, зрение ИИ определило объект в реальном мире и указало на него – словно в научной фантастике.
Самостоятельные звонки – помните технологию Duplex? Теперь это встроено в ассистента. В демо Astra позвонил в магазин автозапчастей, разговаривал женским голосом с продавцом почти как живой человек, уточняя наличие нужной детали. Продавец ответил, что деталь есть – и тогда ИИ спросил у пользователя: покупать ли? После утвердительного ответа ассистент оформил заказ. Все детали разговора, интонации – как у настоящего секретаря, люди на том конце провода даже не подозревают, что общаются с ИИ!

Ещё момент:

во время ответа ассистента рядом заговорил другой человек – Astra мгновенно приостановил речь, не путая фоновые реплики с командой. Пользователь сказал “продолжай” – и ИИ продолжил ровно с того места, на котором остановился, без повторов. У ассистента, выходит, есть слух и воспитание 🙂.

Долгая память: когда позже пользователь спросил, какая нужна корзина на велосипед, “чтобы туда влезла моя собака”, Astra вспомнил кличку собаки из прежних диалогов! Он ответил что-то вроде “Да, для Бобби подойдёт такая-то корзина” – то есть ИИ учел личный контекст и продемонстрировал память, как настоящий приятель, который вас давно знает.

Google Action Intelligence

Все эти способности Google называет единым термином Action Intelligence (интеллект действий). Проще говоря, Astra сочетает нейросеть Gemini с камерой, микрофоном, экраном и всеми приложениями телефона, чтобы самому выполнять пользовательские задачи. Это синтез нескольких технологий: поиск информации, понимание экрана и окружения, управление приложениями, звонки и общение, контекст из личных данных, длительная память и супер-натуральный голос 🔥

Заключение

Пока Project Astra – экспериментальный проект. Google уже около года тестирует его в небольшом кругу (в виде отдельного приложения на Android). Но цель ясна: обкатать функции и внедрить всё это великолепие в основное приложение Gemini Live, сделав его универсальным ИИ-помощником.

В общем скоро Google-ассистент у каждого сможет не просто ответить на вопрос, а реально сделать за вас кучу дел – от разбора завалов в почте до управления умным домом.

Про остальные Главные Новинки от Google расскажу и покажу наглядно в следующем посте, кто не хочет ждать, в моем телеграм канале уже пост есть.

Отдельно:

Как оплачивать иностранные сервисы
А если вам не хочется заморачиваться, в боте Syntx -- это мини приложение в телеграм, есть все популярные модели в единой подписке, и их можно оплатить русской картой. - Процесс я показала на примере создания Нейрофотосессии со своим лицом

Показать полностью

[моё] Искусственный интеллект Нейронные сети Чат-бот Google Конференция Digital Презентация Полезное Обзор Будущее Тренд Технологии Обновление Тестирование Вертикальное видео Перевел сам Перевод Видео Длиннопост

technogram

2 месяца назад

Искусственный интеллект

Новый Яндекс Поиск с Алисой⁠⁠

Яндекс обновил Поиск, добавив в него ИИ функции Алисы. Теперь прямо в поиске появились возможности генерации текста и изображений, а также режим рассуждений.

«Поиск с Алисой» заменил сервис «Нейро». Теперь в поисковой строке формируются структурированные ответы с подзаголовками, изображениями и видео.

Новый Яндекс Поиск с Алисой Яндекс, Яндекс Поиск, Яндекс Алиса, Telegram (ссылка), Искусственный интеллект, Технологии, Длиннопост

Также появился режим рассуждений. В нём Алиса анализирует больше источников, сравнивает данные и объясняет ход своих мыслей.

Пользователи могут обращаться к Алисе с просьбой создать посты, заголовки, поздравления или прямо в поиске.

Поисковик также помогает в выборе товаров, например, предлагает различные типы велотренажёров или даёт советы о том, на что следует обратить внимание при покупке техники.

Ещё в поиске появились «Вертикали» — это новая часть поиска, где можно найти предложения товаров, финансовых продуктов и квартир, а также сравнить их.

Начать оформлять услугу можно прямо в «Поиске», но пока получится оформить только полис ОСАГО.

Попасть в «Вертикали» можно через тематические вкладки на главной странице приложения «Яндекс с Алисой».

Ответы нейросетей будут доступны и на сторонних сайтах. Пользователи Браузера могут задавать Алисе вопросы по открытой веб-странице. Она проанализирует текст на сайте и даст ответ со ссылками на конкретные фрагменты. Опция уже доступна в Браузере для компьютеров и скоро появится в мобильной версии.

Функции доступны бесплатно, но есть ограничения. Для неограниченного доступа к режиму рассуждений и мощной модели YandexGPT 5 Pro требуется подписка «Алиса Про».

Теперь в бесплатной версии Алиса использует модель YandexGPT 5 Lite, которая на 89% превосходит прошлую модель.

С опцией Про Алиса использует самую мощную модель компании — YandexGPT 5 Pro.

Больше новостей в нашем Telegram канале!

Показать полностью 4

[моё] Яндекс Яндекс Поиск Яндекс Алиса Telegram (ссылка) Искусственный интеллект Технологии Длиннопост

egor.leto

2 месяца назад

Искусственный интеллект

Серия Нейро Пушка

ГЕНЕРАТОР САЙТОВ ОТ GOOGLE⁠⁠

Stitch — новый бесплатный сервис для создания сайтов на базе Gemini. Уже доступен всем.

Что умеет:

🔴 Делает сайты любой сложности.

🔴 Позволяет редактировать каждый элемент прямо в браузере.

🔴 Экспортирует макеты в Figma в один клик.

И главное — БЕСПЛАТНО.

Пробуем тут — stitch.withgoogle.com

Источник: 🎯 НЕЙРО-ПУШКА ● НОВОСТИ И ОБЗОРЫ НЕЙРОСЕТЕЙ

Показать полностью

[моё] Искусственный интеллект Нейронные сети Telegram (ссылка) Вертикальное видео Digital Тренд Сайт Gemini Видео Короткие видео

TokenState

2 месяца назад

Искусственный интеллект

Искусственный интеллект и новая реальность⁠⁠

Порабощение или эволюция?

Мы живём в эпоху, когда искусственный интеллект перестал быть технологией будущего — он уже здесь, и он влияет на нашу повседневность. Алгоритмы плотно вплелись в нашу жизнь. И от того, как мы распорядимся этим инструментом, зависит, станет ли он оружием порабощения или ключом к свободе.

По словам Даниэля Сачкова, основателя Bastyon,в настоящее время идёт формирование новой элиты, так называемой технократической олигархии, которая использует искусственный интеллект. А власть глобальных корпораций, именуемая корпоратократией, тоже поняла, что данные - это новая нефть.

Уже сейчас ИИ применяется для персонализации контента и рекламы. Соцсети используют его для удержания внимания. Алгоритмы изучают поведение: какие видео смотрим, на что реагируем, что пропускаем. Вероятно, вы замечали, как после разговора о новом телефоне вам показывают рекламу гаджетов? Реальностью является то, что ИИ анализирует данные с микрофона.

Финансы, логистика, транспорт, медицина, образование. Наверное, проще сказать, где искусственный интеллект не применяется.

И эти процессы идут без нашего согласия. Или, с нашего молчаливого согласия.

Можно ли это изменить?

Какая может быть альтернатива? Это зависит от того, на каких принципах строится ИИ, а для того, чтобы он не становился оружием, он должен быть открыт и децентрализован. Уровень цифровой грамотности должен быть соответствующим, необходимо понимание того, как работают технологии, чтобы не становиться их жертвой.

Раз уж искусственный интеллект неизбежен, то лучше быть среди тех, кто его контролирует, чем среди тех, кого контролируют. Ведь попытка запретить ИИ приведёт лишь к тому, что он будет монополизирован.

Что нас ждёт в ближайшем будущем?

Искусственный интеллект уже перешёл от этапа «интересных экспериментов» к тотальной интеграции во все сферы жизни. Вот 7 направлений, которые изменят мир уже в ближайшие годы:

Персонализированый ИИ-ассистент для каждого. Он будет знать ваши привычки и предугадывать потребности.
ИИ-правительство и автоматизированное управление. Алгоритмы начнут принимать государственные решения, такие как распределение бюджета.
ИИ- медицина. Нейросети будут ставить диагнозы точнее людей. Уже сейчас IBM Watson диагностирует рак с точностью 93%.
Творчество под контролем алгоритмов. На данный момент большой процент контента генерируется ИИ, появятся виртуальные знаменитости со своей аудиторией.
Автономные войны. Представьте рой дронов, принимающих решения без человека.
Нейроинтерфейсы. Слияние мозга и ИИ. Neuralink Илона Маска планирует начать массовые имплантации к 2027 году.
Экзистенцианальный кризис. Если ИИ пишет книги, ставит диагнозы и управляет государствами — чем тогда заниматься людям?

Что делать?

Появление и развитие ИИ вполне закономерно и надо понимать, какие возможности и угрозы он несёт. Технологии не нейтральны, они отражают ценности тех, кто их создаёт. Необходимо поддерживать такие альтернативы, как открытые ИИ проекты и децентрализованные системы.

И очень важный вопрос. А можно ли вообще избежать цифрового контроля? Или это иллюзия и контроль закономерен точно так же?

Показать полностью

[моё] Будущее Развитие Эволюция Статья Стартап Текст

AICreatorsClub

2 месяца назад

Искусственный интеллект

Серия ChatGPT

GPTs в ChatGPT для SMMщиков, блогеров, экспертов и обычных работяг: пишет посты в твоём стиле вместо тебя⁠⁠

GPTs — это кастомные ассистенты внутри ChatGPT.
Ты переходишь по ссылке, добавляешь нужного себе — и получаешь умного помощника, который работает под твою задачу: от анализа таблиц до генерации идей, написания кода, оформления ТЗ и... постов.

Именно под это я и собрал своего — GPT, который пишет посты за тебя.

Что это за GPT?

Я создал GPT, который генерирует посты в твоём стиле, будто ты сам/сама сел(а) и написал(а).

Подойдёт:

SMM-специалистам
Блогерам и экспертам
Владельцам Telegram-каналов
И просто обычным людям, которым надо «что-то запостить красиво»

Как он работает?

Ты нажимаешь «Написать пост» и он задает тебе первый вопрос.

2. После он задаёт тебе еще вопросы — о теме, тоне, аудитории и т.д. Проводит тебе такой брифинг (подсказывает примеры, чтобы не зависать и предлагает свои предположения на основе твоих предыдущих ответов). Каждый твой ответ — это как кусочек пазла. Чем точнее и конкретнее ты отвечаешь, тем больше он понимает: что, кому, как и зачем ты хочешь сказать. Это не просто брифинг — это подготовка к мощному, цепляющему посту, который будет работать на твою цель.

3. После твоих ответов он собирает резюме:
— кратко и по пунктам подводит итоги, чтобы ты мог(ла) посмотреть, всё ли учтено.

4. Затем он спрашивает:
«У тебя есть примеры твоих постов? Желательно от 5 до 50 — они помогут мне подстроиться под твой стиль».

5. Даем эти примеры ему (я скармлирую ему все мои посты из группы).

6. После этого он анализирует твой стиль и выдает резюме по нему.

7. И только после этого он пишет 1–3 поста — в твоём стиле, с твоими словечками и вайбом.
Сначала он берёт резюме из твоих ответов, потом — резюмирует твой авторский стиль по примерам, и уже на этом основании набрасывает три варианта текста под твою задачу:
разной подачи, но всё в твоём стиле.

P. S. Если хотите, чтобы ChatGPT писал за вас — и звучал именно как вы — вот ссылка. Подключайте, он умеет копировать стиль почти неотличимо 😉 👉 https://chatgpt.com/g/g-682cd989141c8191b16ea4d34af031da-pos...

А если хочется большего — разобраться в нейросетях без скуки и перегруза, начать применять ИИ в работе, творчестве или повседневной жизни — присоединяйся в AI Creators Club.

Это сообщество для тех, кто хочет:

— научиться использовать ИИ без страха и запутанных слов,
— вдохновляться от единомышленников,
— автоматизировать рутину и вернуть себе время,
— прокачаться через поддержку, а не критику,
— почувствовать: «я не один и у меня получается».

Здесь не спрашивают “почему ты не знал” — здесь показывают “как понять и попробовать”.
Присоединяйся — вместе легче, интереснее и теплее.
👉 https://t.me/+Rbs1ccfTk2BiNjli

Показать полностью 12

[моё] ChatGPT Искусственный интеллект Нейронные сети IT Digital Чат-бот SMM Копирайтинг Контент Социальные сети Ассистент Продуктивность Автоматизация Блоггинг Маркетинг Вдохновение Помощник Длиннопост

Отличная работа, все прочитано!

45 46 47 48 49 50 51 52 53 54 55 60 70 80 90 140

Искусственный интеллект

Популярные теги в сообществе:

📋 В этом выпуске:

🧠 LLM Модели

❯ Codex — облачный помощник для программистов

❯ GPT-4.1 и mini — новые модели в ChatGPT

❯ AlphaEvolve — агент от DeepMind, который изобретает алгоритмы

❯ Claude Sonnet и Opus — инсайды о новых ИИ от Anthropic

❯ Qwen3 — техрепорт по одной из лучших open-source LLM

🎨 Генеративные нейросети

❯ VACE — универсальная модель от Alibaba для генерации видео

❯ Hunyuan Image 2.0 — генерация картинок в реальном времени

❯ Stable Audio Open Small — ИИ музыка прямо на смартфоне

❯ RECURSE — первый трек, созданный с помощью квантового ИИ

❯ TikTok AI Alive — превращает фото в видео с движением

🛠 AI-инструменты и интерфейсы

❯ Memex — визуальный кодинг без строк кода

❯ Apple Intelligence в iOS 19 — управление энергопитанием через нейросеть

❯ YouTube + Gemini — автогенерация рекламных вставок в видео

❯ Apple x Synchron — управление гаджетами силой мысли

🏗 AI-инфраструктура

❯ TSMC — $28 млрд на фабрики для нейрочипов и переход на 1.4 нм

❯ Amazon и HUMAIN — $5 млрд на создание AI-хаба в Саудовской Аравии

🧬 AI в науке и робототехнике

❯ Berkeley Humanoid Lite — напечатай андроида на 3D-принтере за $5 тыс

❯ Учёные научили ИИ включать и выключать гены в нужных клетках

🏛 ИИ в обществе

❯ Ditto — ИИ-дейтинг приложение

❯ Grok в Twitter — массово заговорил о геноциде в ЮАР

❯ Исследование KPMG — 63% сотрудников скрывают, что используют ИИ

❯ Claude Code — 80% кода сгенерировал сам Claude

🔮 Заключение

Вот сгенерированное фото со мной:

1) Wan2.1

2) Sora

Veo 2 от Google

Что умеет Project Astra

Ещё момент:

Google Action Intelligence

Заключение

Что это за GPT?

Как он работает?