AndreyButakov

AndreyButakov

ИИ в жизни, работе и бизнесе Автор: @imblackmamba13 Сайт: optifyhub.ru Телеграм-канал: https://t.me/optifyhub
Пикабушник
Дата рождения: 13 декабря
211 рейтинг 4 подписчика 2 подписки 74 поста 0 в горячем
2

Проблема оцифровки текста

Проблема оцифровки текста Искусственный интеллект, Нейронные сети, Распознавание, Ocr, Документы

Самый распространенный вариант оцифровки текста - OCR (оптическое распознавание символов), например, Tesseract, EasyOCR или PaddleOCR.
Это уже классическая и проверенная технология, которая используется во многих системах, но у которой есть и свои проблемы:
- плохо обрабатывает необычные шрифты, цветной и низкокачественный текст
- точность распознавания снижается при наличии нескольких языков в тексте
- для распознавания рукописного текста требуется дообучение моделей, что затратно по времени и ресурсам (самое трудное - это собрать качественные данные для дообучения)
В итоге получается, что для каждого узкого кейса надо заново подбирать модель, дообучать её и настраивать.

Но есть и альтернатива!
Vision LLM - это большие языковые модели, обученные работать и с текстом и с изображениями.
У них есть ряд преимуществ:
- распознают печатный и рукописный текст на разных языках
- не требуется дообучение
- отлично справляются с сложными (но небольшими) документами
Есть и недостатки:
- использование VLLM дороже (при использовании сторонних сервисов и на своем железе)
- чем больше текста, тем больше вероятность ошибки

Вы можете сами опробовать демо-версию:
1. Загрузите изображение или PDF-файл.
2. Нажмите кнопку "Распознать текст".
3. Скачайте результат в формате Word.
Всегда перепроверяйте ответ, не доверяйте ИИ! 😐

Подробнее про распознавание текста при помощи ИИ: https://t.me/optifyhub

Показать полностью 1
13

Умные очки

Одно из полезных и классных применений искусственного интеллекта:

HEARVIEW GLASSES (https://www.hearview.ai/) - с помощью ИИ эти очки преобразуют слова в текст с 95% точностью с минимальной задержкой.

Для кого?
В первую очередь - для глухих и слабослышащих, кому эта технология реально нужна.
Во вторую - для студентов, журналистов и всех, кому легче воспринимать информацию через текст.
Думаю, что туда легко можно прикрутить переводчик.

Живем в будущем...
Но скоро может исчезнуть возможность пообсуждать коллегу шёпотом 😁

Про лучшие ИИ инструменты: https://t.me/optifyhub

Показать полностью
4

Как ИИ оцифровывает таблицы: сканы, PDF и даже рисунки

Тем, кто работал с документами, знакома ситуация: на почту присылают скан, фотку или PDF, где таблицу нужно вручную переносить в Excel. Это долго и утомительно.

Существующие на рынке продукты плохо работают с таблицами, русским языком или рукописным текстом. Поэтому я решил сделать своё решение 🤷‍♂️.

Как это работает?
- YOLO находит таблицы на изображении, даже если это фотография или скан.
- Vision LLM распознает структуру таблицы и текст.
На выходе вы получаем готовую таблицу в удобном формате: Excel, Word или Markdown.

Кому это полезно?
Подходит для тех, кто часто работает с таблицами в документах:
- оцифровка бумажных архивов
- распознавание таблиц в сканах
- перенос таблиц, нарисованных и заполненных вручную

Подробнее: https://t.me/optifyhub/121

Показать полностью 2
2

Генерация презентаций

Пример генерации

GAMMA.APP ((ссылка реферальная) https://gamma.app/signup?r=h15nrq3hbyyzir3):
- кратко описываем идею презентации
- выбираем язык, размеры и количество слайдов
- выбираем стиль и дизайн
- получаем презентацию по вашей теме в любом удобном формате

Конечно, если это не абстрактная и общая тема, то придется доработать, но как черновик - отлично!

Необходима регистрация. У меня на старте 400 бесплатных кредитов (40 кредитов - 1 презентация на 8 слайдов) , кажется они не обновляются... Цена - 10$/месяц.

Как использовать ИИ: https://t.me/optifyhub

Показать полностью 4
0

LearnLM - новая модель от Google для обучения

LearnLM - новая модель от Google для обучения Искусственный интеллект, Нейронные сети, Образование, Обучение

Google представил новую модель LearnLM, заточенную под образование.

Что умеет (доступно пока некоторым пользователям в USA):
1️⃣ В поиске Google можно будет упростить сложную тему одним нажатием кнопки (например, объяснить квантовую физику как для школьника).
2️⃣ Circle to Search на Android теперь решает задачи по математике и физике прямо с экрана телефона. Скоро добавят поддержку формул, диаграмм и графиков.
3️⃣ В YouTube появится ИИ-помощник, которому можно задавать вопросы прямо во время просмотра лекций.

👀 А самое интересное - два новых инструмента:
Illuminate:
- Берёт научную статью
- Превращает её в короткий аудио-подкаст
- Два ИИ-диктора обсуждают ключевые моменты
- Можно задавать уточняющие вопросы

Learn About:
- Подбирает материалы под ваш уровень или использует ваши
- Создаёт индивидуальный план обучения
- Отвечает на все вопросы, используя видео, картинки, сайты
- Проверяет ваше понимание и дает практические задания

Модель уже можно тестировать в Google AI Studio (https://aistudio.google.com/app/).

ИИ для любой задачи: https://t.me/optifyhub

Показать полностью 1
1

Раскрашиваем старые фото с ИИ

Пробуем фото самурая:

Раскрашиваем старые фото с ИИ Искусственный интеллект, Нейронные сети, Реставрация фото, Самурай, Длиннопост

ОРИГИНАЛ

1. Neural Love (https://neural.love/photo-colorization)
2. Pallete Fm (https://palette.fm/color/filters)
3. Kolorize (https://kolorize.cc/app)

Везде нужна регистрация, везде есть водяные знаки.
Чтобы от них избавиться: https://t.me/optifyhub/42

Показать полностью 4
1

Статья в Nature про ИИ, поэзию и людей

Статья в Nature про ИИ, поэзию и людей Искусственный интеллект, Нейронные сети, Поэзия, Стихи

Статья в Nature (https://www.nature.com/articles/s41598-024-76900-1) про ИИ, поэзию и людей.

Что интересного (и ожидаемого...):
Люди не могут отличить стихи, написанные искусственным интеллектом, от стихов известных поэтов. И тому же - большинство оценивает стихи от ИИ выше!

В исследовании приняли участие 1634 человека и точность распознавания составила 46,6% (т.е. наугад выбирать было бы эффективнее).
Если участникам сообщали, что автор стихотворения - человек, то этот стих сразу оценивали выше по всем параметрам (людишки...) ✅

Какие ИИ справляются с рифмой на русском языке:
1. Claude Sonnet 3.5 - Отлично!
2. Gemini Exp 1114 - Отлично!
3. ChatGPT 4o - бывают умные мысли, но с рифмой не всегда дружит.

Ищем реального автора: https://t.me/optifyhub

Показать полностью 1

ChatGPT-4o предсказал победу Трампа...

ChatGPT-4o предсказал победу Трампа... Политика, Искусственный интеллект, Нейронные сети

Статья (https://arxiv.org/abs/2411.01582) с предсказанием от КИТАЙСКОГО университета опубликована 3 ноября.
Выборы в США стартовали 5 ноября.

ChatGPT-4o предположил 238 - 300 в пользу Трампа.
В реальности было 226 - 312 в пользу Трампа.
Интересно, что многие аналитики ожидали равной гонки.

Для предсказания использовалось два метода:
1. Ролевой сценарий. ИИ вживался в роль избирателя на основе его демографических данных (возраст, пол, образование, религия и т.д.) и выбирал своего кандидата.
2. Структурный сценарий. То же самое, но были учтены исторические тенденции голосования в штате (если штат чаще голосует за республиканцев, то и избиратель с большей вероятностью проголосует за республиканца)
+ были всякие исторические данные для корректировок.

Что это значит для нас?
Корпорации и государства, у которых будет доступ к самым передовым моделям ИИ, будут понимать нас (обычных людей, избирателей, потребителей) намного лучше, может даже лучше нас самих 🥺.

А как они это будут использовать, мы не знаем...

Может направят эти технологии на достижение общественного блага. Или на пропаганду и стимулирование продажи своих товаров. Увидим)

Статью можно изучить используя NotebookLM, (https://notebooklm.google.com/) про который я уже рассказывал.

ЕЩЕ ПРО ИИ: https://t.me/optifyhub

Показать полностью 1
Отличная работа, все прочитано!