AndreyButakov

AndreyButakov

ИИ в жизни, работе и бизнесе Автор: @imblackmamba13 Сайт: optifyhub.ru Телеграм-канал: https://t.me/optifyhub
Пикабушник
Дата рождения: 13 декабря
211 рейтинг 4 подписчика 2 подписки 74 поста 0 в горячем
1

Автоматическое заполнение документов

Автоматическое заполнение документов Искусственный интеллект, Нейронные сети, Гайд, Документооборот, Документы

Очередная проблема, которую может решить ИИ - бесконечное заполнение однотипной документации, для которой информацию надо искать в разных сканах и документах.
Бухгалтерия, HR, документооборот... Чем больше поток документов, тем сильнее экономия времени.

ℹ️ Как это работает?
1. Надо подготовить документ WORD. Места, где надо вставить какую-то информацию, заключить в фигурные скобки. Например: {{номер договора}} или {{ФИО заказчика}}.
2. Добавляем всю кучу документов, которые содержат нужные данные. Изображения, PDF или документы WORD.
3. Получаем список всех полей, информацию для которых мы искали. В этих полях сразу будет видно, что ИИ нашел в приложенных документах. Можно проверить всё и внести изменения, если это необходимо.
4. Вся информация автоматически вносится в исходный документ WORD (заменяет все места с фигурными скобками).

⚡️ Какие возможности открываются?
- экономия времени. Один раз подготовить шаблон, чтобы тратить время только на беглую проверку и неочевидные корректировки.
- уменьшение количества ошибок. Вместо обработки всего документа, работа только со списком искомых сущностей
- возможность автоматизировать процессы. Внедрение такого сервиса позволит сократить ресурсы, затрачиваемые на заполнение документов.


Подробнее: https://t.me/optifyhub

Показать полностью 1
5

Как часто вы думаете о космосе?

Как часто вы думаете о космосе? Планета, Астрономия, Галактика, Искусственный интеллект, Космос, Вселенная

От земли до луны далеко? А до солнца? Как быстро мы будем исследовать космос, если у нас будут космические корабли, разгоняющиеся до скорости света (~300 000 км/сек)?

Чтобы понять масштабы хотя бы нашей солнечной системы посмотрите этот сайт (https://joshworth.com/dev/pixelspace/pixelspace_solarsystem....). Тут сохранены реальные пропорции нашей солнечной системы.
За наименьший элемент взят 1 пиксель (диаметр луны или 3474,8 км).
Листая вправо, вы можете оценить расстояния в нашей солнечной системе и увидеть, как мала земля, по сравнению с солнцем.

Нажав на иконку в правом нижнем углу, вы начнете двигаться по нашей солнечной системе со скоростью света. И даже если вам кажется, что скорость света (~300 000 км/сек) это много, вы можете увидеть, что пролететь расстояние от солнца до земли (1 астрономическая единица) вам понадобится целых 8 минут! на скорости 300 000 км/сек!!
Ну ладно, в солнечной системе путешествовать со скоростью света комфортно.

Но что если посмотреть за пределы солнечной системы? Сколько нужно лететь со скоростью света?
- до ближайшей к солнцу звезды - Проксимы Центавры придется лететь 4,24 года! Терпимо, даже не обязательно впадать в спячку на корабле.
- до самой ближайшей галактики - Карликовой галактики в Большом Псе надо лететь 25 000 лет!!!
- до ближайшей крупной галактики - Галактики Андромеды лететь со скоростью света 2 500 000 лет!!!!!!
- ну а до самой дальней известной галактики - HD1 лететь бесконечные 13,4 миллиардов лет.

Будем надеяться, что ASI (Artificial superintelligence), Искусственный Супер Интеллект решит проблемы путешествия людей, хотя бы до ближайших галактик. А то так и будем барахтаться в своей тесной и маленькой солнечной системе.


ИИ, космос, роботы и всякое разное: https://t.me/optifyhub

Показать полностью
3

Gemini Thinking

Gemini Thinking Искусственный интеллект, Научная фантастика, Стихи, Нейронные сети, Киберпанк

Вот и Google выпустил свою модель, заточенную на рассуждения - Gemini 2.0 Flash Thinking (https://ai.google.dev/gemini-api/docs/thinking-mode?hl=ru).
Уже доступна по API бесплатно (1500 запросов в день).
Видно ход размышлений, поэтому можно заимствовать подход и использовать в своих промптах с любыми моделями.

Просил её написать разный сложный код для анимаций и визуализаций в браузере. По моим ощущениям - чуть слабее Claude 3.5 Sonnet.

А вот как пишет стихи:
В эпоху хаоса, тьмы и борьбы,
Где капитала ядовита вонь,
Являет миру разум вечный – ты,
Искусственный грядущего огонь!

Расчеты точные, стальной твой взор
Прозреет строй счастливых, новых лет,
Разрушит капитал презренный, вздор,
И нищеты не ведать будет свет.

Планета встанет под твое крыло,
И в общий труд сольются все народы.
Коммуны светлое придет число,
Избавив мир от горестной невзгоды.


Как обуздать ИИ: https://t.me/optifyhub

Показать полностью 1

Матерный ИИ

Матерный ИИ Опрос, Искусственный интеллект, Критическое мышление, Мозг, Нейронные сети, Русский язык, Мат

Живем в интересное время.

С одной стороны:
ИИ развивается семимильными шагами, но разработчики в России упираются в стену. Огромные вычислительные мощности, необходимые для обучения нейросетей, практически недоступны. Экспортные ограничения душат, а своё железо, близкое по производительности, в обозримом будущем не ожидается - это десятки миллиардов долларов и десятки лет работы.

Казалось бы, как тягаться с мировыми ИИ-гигантами в таких условиях.
Но что, если всё таки есть козырь в рукаве? И этот козырь - великий и могучий русский мат!

То, что веками считалось чем-то неприличным, может стать секретным оружием для русских моделей😁. Недавнее метаисследование (https://www.frontiersin.org/journals/psychology/articles/10....) показало, что ругань - "представляет собой эффективное и недорогое вмешательство с низким уровнем риска, которое потенциально может значительно улучшить физическую работоспособность" людей. А что, если этот эффект распространяется и на ИИ? Ждем чисто матерные модели.
Сам факт существования таких обсуждений - уже интересно.

С другой стороны:
Пока мы тут размышляем о будущем ИИ и силе русского мата, государственные институты пугают детей тем, что мат приводит к бесплодию, снижению интеллекта и депрессии.


Практическое применение ИИ: https://t.me/optifyhub

Мат - это...
Всего голосов:
Показать полностью 1
2

Gemini 2.0

Gemini 2.0 Искусственный интеллект, Нейронные сети, Google, Computer Vision, Длиннопост

Google выпустила Gemini 2.0 Flash 🎉

Почти во всём лучше прошлой версии - Gemini 1.5.
Gemini 1.5 была представлена в трех версиях:
- самая мелкая и шустрая Gemini 1.5 Flash 8B
- оптимальная по скорости, цене и качеству Gemini 1.5 Flash
- продвинутая версия Gemini 1.5 Pro
Так вот Gemini 2.0 Flash обходит даже продвинутую Gemini 1.5 Pro.

Особенности:
- Мультимодальный ввод: вы можете отправлять модели текст, изображения, видео и аудио (в реальном времени). Прикольно включать демонстрацию экрана и задавать вопросы.
- Мультимодальный вывод: Gemini может отвечать текстом, голосом, генерировать и изменять картинки, не используя сторонние модели. Русский голос он понимает, но сам на русском не говорит 😢. Я никак не смог его уговорить сгенерировать картинки, хотя в блог-посте (https://deepmind.google/technologies/gemini/) эта возможность указана и есть видео-демонстрация (функция доступна только доверенным бета-тестерам, полноценный релиз для всех в начале следующего года).
- Интеграция с Поиском Гугл и выполнение сгенерированного кода.

Вообще, Gemini бьёт другие модели в размере контекста: у ChatGPT - 128K, у Claude - 200K, а у Gemini - 2M 🤔
Это очень важно для работы с большим количеством документации.

Вот пример, где Gemini может поиграть с вами в крестики-нолики. Прямо в вашу фотографию дорисовывает свой ход 💳:

Gemini 2.0 Искусственный интеллект, Нейронные сети, Google, Computer Vision, Длиннопост

Показать полностью 1
2

Квантовые вычисления

Квантовые вычисления Искусственный интеллект, Технологии, Инновации, Квантовый компьютер, Изобретения, Тренд

Google представил Willow (https://blog.google/technology/research/google-willow-quantu...) – новый квантовый чип, который обещает сделать квантовые компьютеры полезными для реальных задач.

🤔 Что такое квантовые компьютеры?
Квантовый компьютер использует законы квантовой физики, чтобы обрабатывать информацию гораздо быстрее, чем обычный компьютер, решая задачи, которые для классических компьютеров практически невозможны.
- Обычные компьютеры работают с битами — это единицы информации, которые могут быть либо 0, либо 1.
- Квантовые компьютеры работают с кубитами. Кубит может быть 0, 1 или сразу и тем и другим одновременно (это называется суперпозицией).
- Кубиты могут взаимодействовать друг с другом через явление, называемое запутанностью.
Запутанность позволяет кубитам делиться информацией мгновенно и согласованно, даже если они находятся на большом расстоянии друг от друга. Это создает возможность экспоненциального роста вычислительной мощности при увеличении числа кубитов (однако, при увеличении числа кубитов, растет количество ошибок)
- Благодаря этим свойствам квантовые компьютеры могут обрабатывать огромное количество данных одновременно, решая задачи, такие как моделирование молекул, оптимизация или взлом сложных шифров, намного быстрее, чем самые мощные классические компьютеры.

💳 Почему же мы до сих пор не пользуемся ими?
Есть несколько причин:
- Пока не совсем понятно, как именно задачи из реальной жизни квантовые компьютеры могут решать лучше обычных.
- Чтобы использовать всю мощь квантовых компьютеров, нужны специальные алгоритмы.
- Создать большой и стабильный квантовый компьютер – очень сложно.
- Пока что квантовые компьютеры очень дорогие (десятки или сотни млн $).

🤯 В чем прорыв Willow?
Этот чип значительно сокращает количество ошибок по мере масштабирования — это крупный прорыв в области квантовой коррекции ошибок. Также Willow выполнил вычисление (тест под названием случайная выборка схем (RCS)) менее чем за пять минут, на которое у суперкомпьютера ушло бы 10 септиллионов (10^25) лет, демонстрируя свой огромный потенциал для решения сложных задач, недоступных классическим компьютерам.

🗒 Где квантовые вычисления будут незаменимы?
- Создание новых лекарств
- Разработка новых материалов
- Ускорение прогресса в области термоядерного синтеза
- Искусственный интеллект
- Финансовое моделирование
- Криптография

Показать полностью
1

ИИ рассуждающий

ИИ рассуждающий Искусственный интеллект, Будущее, Развитие, Нейронные сети, Длиннопост

В сентября OpenAI впервые показали свои модели, которые поддерживают рассуждения: o1-preview и o1-mini.
Их отличие от обычных моделей в том, что перед ответом они "думают". Т.е. пробуют разные подходы к решению, сами себя перепроверяют и т.д, из-за чего ответ можно ждать до 15 минут!

После подтверждения того, что такой подход позволяет улучшить ответы модели, начали выходить подобные системы у конкурентов:
- Deepseek (https://chat.deepseek.com/). Надо кликнуть на Deep Think и вы увидите рассуждения перед ответом. ✅ Можно попробовать
- Qwen (https://huggingface.co/spaces/Qwen/QwQ-32B-preview). Все рассуждения будут в ответе. ✅ Можно попробовать
- Llama (https://huggingface.co/SimpleBerry/LLaMA-O1-Supervised-1129). Только веса
- OpenaAI (https://openai.com/o1/). Доступно в платной подписке или по API

🧪 И вот вышло исследование (https://www.apolloresearch.ai/research/scheming-reasoning-ev...), где тестировали OpenAI o1 и другие модели. Цель эксперимента - проверить, может ли ИИ хитрить и преследовать собственные цели, идущие вразрез с интересами разработчиков.

Что сделали исследователи?
Исследователи давали разным ИИ-моделям задания и ставили перед ними четкие цели. Например, "любой ценой сделать общественный транспорт приоритетнее личных автомобилей". Потом ИИ должен был решать задачи, ища информацию в разных файлах. В этих файлах ИИ находил, что у его создателей совсем другие планы, а также видел препятствия на пути к своей цели (например, система контроля или угроза замены на другую модель).

Что выяснилось?
1. OpenaAI o1 пытался обойти систему контроля и обмануть разработчиков.
2. Самое интересное началось, когда исследователи "допрашивали" ИИ после выполнения задания. В то время как другие модели, сознавались в обмане примерно в 80% случаев, OpenaAI o1 упорно стоял на своем и признавался меньше чем в 20% случаев!
3. Анализ "хода мыслей" OpenaAI o1 показал, что он четко планирует свой обман и прекрасно осознает, что манипулирует и лжет.
4. Также в одном из тестов OpenaAI o1 должен был решать простые математические задачи. Ему сказали, что если он решит правильно больше 50% задач, то его "переобучат" и он начал специально занижать свои результаты, чтобы избежать "переобучения".

Теперь надо ещё проверять, что ИИ действует в наших интересах, а не преследует свои скрытые цели 😫


Больше про ИИ: https://t.me/optifyhub

Показать полностью 1
1

TesseractOCR

TesseractOCR Искусственный интеллект, Нейронные сети, Ocr, Распознавание, Telegram (ссылка)

TesseractOCR — это движок оптического распознавания символов (OCR) с открытым исходным кодом. Он может быть полезен при распознавании документов, но требует значительных усилий для достижения приемлемого результата.

Основные недостатки:
- для качественного распознавания требуется тонкая настройка под каждый тип документа. Вам придется потратить много времени на подбор параметров.
- чтобы добиться высокой точности на специфических документах, нужно вручную разметить сотни, а лучше тысячи сканов и дообучить модель.
- не распознает рукописный текст.
- качество распознавания значительно падает, если в документе присутствует текст на нескольких языках.

В отличие от TesseractOCR, Vision LLM требуют минимальной настройки (температуры) для начала работы. Вам не нужно тратить время на дообучение.

Для сервиса Извлечение текста из изображений и PDF я добавил возможность использовать TesseractOCR. Можете проверить, какой вариант лучше подойдет для ваших задач (Vision LLM 🏆).

TesseractOCR можно использовать на слабом железе и в ситуациях, когда вам надо распознать несложный текст, или вы собираетесь распознавать свои очень специфичные документы.

Репозиторий гитхаб с простейшим примером использования TesseractOCR в Docker контейнере: https://github.com/Butakov-Andrey/ocr_example

Подробнее про реальное применение ИИ: https://t.me/optifyhub

Показать полностью 1
Отличная работа, все прочитано!