ИИ учат распознавать эмоции животных
Великие британские учёные исследователи активно натаскивают нейронки для распознавания эмоций животных. Точность алгоритмов уже приблизилась к 90%.
Выяснилось, мимика кошек и собак оказалась заметно похожа на человеческую. ИИ уже научился замечать стресс и боль, теперь его натаскивают видеть более сложные эмоции: счастье, спокойствие, грусть, страх.
Приложение для сканирование кошачьих лиц морд обещают выпустить уже совсем скоро.
Непонятка про ИИ
Читаю я про ИИ, ну тут, конечно, на Пикабу... Ну и смотрю конечно... И офигеваю... Чувачелы, а Вы точно уверены, чё рисование картинок и дебильные диалоги это ващё зашибись?
1. Этот ваш "разговорник" не способен книжку из pdf (тут можете вписать любой другой текстовый формат) прочесть с правильными ударениями =)
2. Распознавание голоса... блин -- это вообще трындец!!! После его распознавания нужно потратить три раза по столько, сколько звучит файл, для сверки...
Вы заметили, что я не конкретизирую? Заметили... Дык а фигли конкретизировать -- ЛЮБОЙ!!!
Ответ на пост «Сортировка фотографий на компьютере»1
В прицнипе реализуемо , но есть нюансы. В конце есть ссылки на удобное копирование скриптов.
Понадобится:
Компьютер с Windows 10 или Windows 11 и видеокартой Nvidia RTX 3000 или 4000 серии, теоретически можно и младше, но я не гарантирую как оно будет работать.
Powershell 7 - https://aka.ms/powershell-release?tag=stable дефолтный файл для обычных Windows x64. Скачиваем + устанавливаем
PowerShell-7.5.0-win-x64.exe
Но можно и любым другим способом zip/msi, пакетный менеджер и т.д
Ollama - клиент для нейросетей https://ollama.com/download жмём Download. Скачиваем + устанавливаем.
Модель для распознавания объектов на фото и тегирования jpg файлов llama3.2-vision:11b которую можно скачать через powershell командой.
ollama pull llama3.2-vision:11b


Программа exiftool для Windows бинарик которой нужно положить в папку, либо любую другую, но тогда правиьте скрипт сооветствующий образом
C:\ExifTool\exiftool.exe
Качаем сайта https://exiftool.org/ Типовой файл 64-bit:
Программа XNview, доставайте сами знаете где, либо любой другой каталогизатор изображений и фото. В jpeg есть теги, нейросеть проставляет теги в зависимости от того, что изображено на фото, по ним сможете посортировать и найти нужные объекты на фото, в XNView есть поиск по тегам, мне подошло именно так.
Собственно код, который нужно вставить в терминал Powershell с текущей папкой в папке с фотографиями формата jpg/jpeg.
Powershell cкрипт (использует GPU)
Здесь мы попросим нейросеть создать нам описание изображения, теги, комментарий и записатить всё это в EXIF самой картинки.
ВНИМАНИЕ!: скрипт обходит все подпапки!
$exifToolPath = 'C:\ExifTool\exiftool.exe'
Get-ChildItem -Recurse $dir | Where-Object {$_.Extension -in @(".jpg", ".jpeg")} | ForEach-Object {
$imagePath = $_.FullName
$comment = ollama run llama3.2-vision:11b "description in 5-10 words $($_.FullName)"
$description = ollama run llama3.1:8b "description in 3-5 words $($comment)"
$theme = ollama run llama3.1:8b "theme in 2-3 words $($comment)"
$tags = ollama run llama3.1:8b "3 tags from $($comment) separated with comma, write only tags"
$description = $description.Trim().Replace("`"","")
$comment = $comment.Trim().Replace("`"","")
$theme = $theme.Trim().Replace("`"","")
& $exifToolPath -Description="$description" -charset latin -Comment="$comment" -charset latin -XPSubject="$theme" -XPComment="$description" -Keywords="$tags" -overwrite_original "$imagePath" -charset latin
}




Во время отработки скрипта побегут странные символы, видимо консольный интерфейс не предполагал, что его будут так использовать. В конце в файл будут записано описание, теги, и комментарий.
Бонус:
Можно сжать фото (до 70%) с помощью jpegoptim в несколько потоков (гораздо быстрее по сравению с обычным использованием jpegoptim *.jpg)
Jpegoptim для Windows - https://github.com/tjko/jpegoptim/releases бинарик которой нужно положить в папку C:\Jpegoptim\jpegoptim.exe.
Файл
Powershell cкрипт (использует CPU)
ВНИМАНИЕ!: скрипт обходит все подпапки!
Get-ChildItem $dir | ForEach-Object -Parallel { C:\Jpegoptim\jpegoptim.exe -m85 $_.Name } -ThrottleLimit 15
ThrottleLimit ставьте по количеству ядер CPU минус 1 ядро, чтобы не повесить ПК
Если неудобно копировать из статьи, можно взять отсюда.
1. Описание фото с помощью нейросети
https://gist.github.com/FaustineD/e637d19f738ce8eea42cd497c17ab52b
2. Оптимизация jpg
UPD: Небольшой Дисклеймер, некоторые фото нейросеть может отказаться обрабатывать из-за присутствия политиков, клубнички, мата, и т.д, Это законодательные ограничения создателей нейросети.
Вместо тегов она впишет в файл, что не может обработать данные.
Новый искусственный интеллект распознает 97% заболеваний легких и может отличить пневмонию от COVID-19
Новая революционная модель искусственного интеллекта способна обнаружить различные заболевания легких по видеозаписям УЗИ с точностью 96,57%. И даже способна различать, вызваны ли отклонения пневмонией, COVID-19 или другими состояниями.
Искусственный интеллект в медицине
Модель, разработанная исследователями из австралийского Университета Чарльза Дарвина (CDU), Объединенного международного университета и Австралийского католического университета (ACU), способна выявлять определенные закономерности различных заболеваний легких, превосходя предыдущие инструменты ИИ, которые были протестированы на тех же наборах данных УЗИ.
Модель также объясняет рентгенологам, почему она приняла те или иные решения, что позволяет им легче перепроверить результаты и понимать их. Эта модель помогает врачам быстро и точно диагностировать заболевания легких, поддерживает их в принятии решений, экономит время и служит ценным инструментом обучения.
Соавтор исследования Ниуша Шафиабади, профессор CDU.
Команда объединила два типа моделей ИИ, подчеркнув, насколько адаптивна эта технология для диагностических нужд. Одна из них, известная как сверточная нейронная сеть, ищет закономерности в изображениях или кадрах, фокусируясь на мельчайших изменениях на уровне пикселей, которые человеческий глаз легко может пропустить при изучении сканов. Затем модель долговременной краткосрочной памяти (LSTM) использует эту информацию и помещает ее в более широкий контекст, анализируя данные от первой модели в контексте течения времени, «забывая» нерелевантные данные.
Объединяя искусственный интеллект
Благодаря симбиозу, новая гибридная модель, известная как TD-CNNLSTM-LungNet, способна с невероятной точностью выявлять отклонения, а затем объяснять причины проблемы. Датаизм на пике развития. Более того, модель может определить признаки пневмонии, COVID-19, других заболеваний легких или определить, что легкие в норме. Избирательность означает, что этот искусственный интеллект в медицине выявляет очень мало ложноотрицательных результатов, что важно при лечении срочных заболеваний легких.
Используя ультразвуковые видеозаписи существующих наборов данных, модель превзошла существующие диагностические инструменты на основе искусственного интеллекта, которые в настоящее время дают результаты около 90–92%.
То, что модель объясняет природу своих выводов повышает надежность использования этого подхода. Система показывает врачам, почему она приняла те или иные решения, используя визуальные данные, такие как тепловые карты. Этот метод интерпретации поможет рентгенологу локализовать зону фокусировки и существенно улучшит клиническую прозрачность.
Соавтор исследования Ниуша Шафиабади, профессор CDU.
Шафиабади отметил, что пока модель обучается на правильных данных, у нее есть потенциал для дальнейшего развития диагностических возможностей в сфере заболеваний легких, выявляя признаки туберкулеза, астмы, рака, хронических заболеваний легких и легочного фиброза.
Исследователи надеются адаптировать модель, чтобы иметь возможность точно оценивать не только данные с УЗИ, но и КТ и рентген.
Больше материалов о симбиозе технологий, природы человека, сознания и использования всего это во благо продуктивности и личной эффективности вы сможете в материалах сообщества. Подписывайтесь, чтобы не пропустить свежие статьи!
Что и когда на этом фото происходит?
Нейросеть для распознавания текста
Ищу нейронку для распознавания текста. Пример текста на скрине. Критически важна поддержка японского языка, желательны русский и английский.
Нейросеть ищу бесплатную, работающую без всяких логинов-паролей-токенов и вообще без интернета, в программе типа LM Studio.
Кроме распознавания нужна ещё и какая-никакая обработка. Например, над некоторыми знаками здесь имеется фуригана - очевидно, нейронка должна быть способна понять, что фуригана - это фуригана, и правильно её обработать (либо выкинуть вовсе, либо, например, разместить в скобках рядом, либо ещё чего-то в зависимости от промпта). Именно поэтому смотрю в строну нейросетей, а не программ для распознавания текста типа gImageReader.
Есть идеи?