ИИ опять всё

0

0

Сервис Devin, заявленный авторами в качестве «первого ИИ-программиста», оказался не в силах заменить реального разработчика. Грандиозный разрекламированный проект решает лишь малую часть поставленных перед ним задач. Процент успеха находится на уровне 15% – это крайне низкий показатель, тем более, что Devin был запущен сравнительно давно.

Пруф: https://corp.cnews.ru/news/top/2025-01-24_razrabotchiki_mogut_spat

Истерики отменяются (Программисты опять всё.), продолжаем работать

Ссылка

←	Как заработать на журнале?

Признавайтесь, кто придумывал имена для пластика?

→

решает лишь малую часть поставленных перед ним задач

короче заменяет программиста на все 100

alysnix ★★★
(26.01.25 14:15:02 MSK)

Ответ на: комментарий от alysnix 26.01.25 14:15:02 MSK

А kompospec-ов на все 200

Lordwind ★★★★★
(26.01.25 14:17:27 MSK) автор топика

Ссылка

решает лишь малую часть поставленных перед ним задач. Процент успеха находится на уровне 15%

Ну надо же! Кто бы мог подумать!

А в чём, собственно урок? Да в том, что ври да не завирайся. Не рекламировали бы его как диво дивное и чудо чудное, а продвигали бы более-менее адекватно настоящей эффективности, может и не было бы такого провала в итоге.

P.S. в заголовке новости по ссылке желтизна: «бесполезен» и «решает 15% задач» в одном предложении. Так-то, 15% это тоже полезно.

CrX ★★★★★
(26.01.25 14:19:27 MSK)
Последнее исправление: CrX 26.01.25 14:22:22 MSK (всего исправлений: 2)

Ответ на: комментарий от CrX 26.01.25 14:19:27 MSK

Так-то, 15% это тоже полезно

Ты мыслишь как инженер. Получил 100 задач - решил 15 - профит есть. А бизнес считает иначе, там нужна стабильность и предсказуемость. Перекладыватели жсонов не просто так появились, а потому что это хоть и неэффективная, но легкозаменяемая работа. Никто не будет инвестировать в проект, где вероятность успеха только одной технической стадии 15%.

Lordwind ★★★★★
(26.01.25 14:25:46 MSK) автор топика

Разработчики могут спать спокойно. «Первый ИИ-программист» бесполезен, он справляется только с 15% поставленных задач

и разработчики пошли спокойно спать.

самолет можайского имел паровой двигатель и аэродинамику, от которой заплакал бы любой студент МАИ. и потому так и не полетел.

но это не значит, что самолеты не летают.

alysnix ★★★
(26.01.25 14:42:59 MSK)

Грандиозный разрекламированный проект

Однако воспользоваться им смогут лишь те, кто располагает свободными $500

Ежемесячно, однако. Врядли там стояла какая-то особая цель, кроме как срубить деньжат. То, что на самом деле сможет заменить, наверняка выкатят тихо, без лишнего шума.

ControlUnit
(26.01.25 14:54:15 MSK)

Ссылка

Кто бы, б*ть мог подумать. Никогда такого не было и вот опять. Чтоб ИИ в программировании был эффективен, должны быть +- стандартные задачи, +- понятные критерии и т.п. Это очевидно любому, кто вообще понимает как ИИ работает. А сейчас чем дальше в лес, тем требования всё более и более размытые, критерии каждые несколько лет полностью меняются, даже у буржуев, а у нас они всегда были на уровне «сделайте, чтоб нам было хорошо». Так что у ИИ в текущем ИТ мире нет шансов. Вот когда ради ИИ начнут резать осётра, вот тогда можно начинать беспокоиться, но пока никто не хочет отказываться от 100500 бессмысленных фич и возможностей. :-)

Но вот в каком-нить двайверо писании, программировании станков, автомобилей и т.п. в таких небольших нишах ИИ будет, возможно, востребован.

vtVitus ★★★★★
(26.01.25 15:04:28 MSK)
Последнее исправление: vtVitus 26.01.25 15:07:33 MSK (всего исправлений: 3)

Ответ на: комментарий от vtVitus 26.01.25 15:04:28 MSK

На rsdn хороший практический пример применения ИИ есть https://rsdn.org/forum/ai/8786048

На фриланс есть (был) заказ https://freelance.habr.com/tasks/588562

На фрилансе интересная задачка попалась: Преобразовать данные с изображений.
В теории понятно как делать: 1. Находим таблицу на изображении 2. Распознаем текст 3. Переводим 4. Формируем новую таблицу транспонируя матрицу
Как это можно реализовать вообще? Искать какую-то нейросеть для поиска таблиц? И как лучше сделать нарезку изображений для распознавания и перевода? Перевести можно используя Tesseract OCR или что хорошо умеет в китайский. Дальше уже имея распознанную таблицу сформировать новую не проблема.

Как я понял есть какой-то одежный китайский сайт с описанием шмоток и таблицей их размеров. Надо было выдрать эти размеры с описаний и предоставить в виде изображения таблицы с ними.

Основная сложность, что эти таблицы носят достаточно произвольный характер.

Автор сообщения предполагал что-то мутить с тессерактом или еще какой OCR.

Вместо этого запросик к чатгопоте с просьбой найти таблицу размеров и выдать результат в Json https://rsdn.org/forum/ai/8888152

Мне кажется ты сильно недооцениваешь современные LLM. Ниже пример для Chat GPT. Никого тренировать не надо, все уже натренеровано. Цена за 1 картинку 1000х1000 GPT будет около $0.002

Хренак-хренак и готово. Еще конечно Json надо в картинку превратить, но это уже обычная задача, которую думаю даже не самый опытный программист осилит. А то может и на это правильный промпт получится составить.

Нужен конечно платный доступ к API от OpenAI. Но может даже локальные LLM справятся, это проверять надо.

praseodim ★★★★★
(26.01.25 15:32:21 MSK)
Последнее исправление: praseodim 26.01.25 15:33:02 MSK (всего исправлений: 1)

оказался не в силах заменить реального разработчика

Конечно, кто его в пресс-хату пустит-то?

buddhist ★★★★★
(26.01.25 16:03:31 MSK)

Ссылка

Ответ на: комментарий от praseodim 26.01.25 15:32:21 MSK

А где в твоем примере замена программиста ИИ?

Тут банальная задача «распарсить какую-то хрень». С таким современный ИИ отлично справляется, кто-бы спорил

Я вот на GitHub Copilot интегрированный в VSCode подсел. Выводит автокомплит на новый уровень

Но это ни разу не замена меня. Просто ещё сильнее ускоряет печать кода

Merlin86 ★
(26.01.25 16:16:50 MSK)

Ответ на: комментарий от Lordwind 26.01.25 14:25:46 MSK

Ты мыслишь как инженер. Получил 100 задач - решил 15 - профит есть.

Был старый анекдот который я уже дословно не помню, там продавец компьютеров объясняет важному дядьке в галстуке, что мол «компьютер выполняет 50% работы», на что дядька отвечает – «тогда мне два».

Aber ★★★★★
(26.01.25 16:22:53 MSK)
Последнее исправление: Aber 26.01.25 16:23:16 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от praseodim 26.01.25 15:32:21 MSK

Форматировал с помощью ChatGPT задачки по C из pdf оригинала в текст шириной 80 символов и с сишными комментариями вида /* ... */.

Очень удивился, когда этот ИИ помимо форматирования начал переформулировать текст самих задач, иногда выбрасывая целые предложения. Были и ещё нюансы. Сделал вывод, что хоть и быстро, но контроль результата должен быть очень тщательный

Jurik_Phys ★★★★★
(26.01.25 16:38:09 MSK)

Ответ на: комментарий от Lordwind 26.01.25 14:25:46 MSK

А бизнес считает иначе, там нужна стабильность и предсказуемость.

Стабильно и предсказуемо решает 15% задач.

greenman ★★★★★
(26.01.25 17:15:02 MSK)

Ответ на: комментарий от greenman 26.01.25 17:15:02 MSK

Стабильно и предсказуемо решает 15% задач.

Осталось уточнить, что остальные 85% он тоже решает, но неправильно.

vaddd ★☆
(26.01.25 17:31:39 MSK)

Ответ на: комментарий от Merlin86 26.01.25 16:16:50 MSK

А где в твоем примере замена программиста ИИ?

Программиста он не заменил в этой задаче, но радикально снизил ее сложность. Раньше еще попробуй подступись к ней, качество работы тессеракта и других опенсорсных OCR очень такое себе, а тут вообще работы немного осталось.

praseodim ★★★★★
(26.01.25 17:34:45 MSK)

Ответ на: комментарий от Jurik_Phys 26.01.25 16:38:09 MSK

Очень удивился, когда этот ИИ помимо форматирования начал переформулировать текст самих задач, иногда выбрасывая целые предложения. Были и ещё нюансы. Сделал вывод, что хоть и быстро, но контроль результата должен быть очень тщательный

Это да, а то может оказаться, что половина новых таблиц - это фантазии ИИ :)) Вероятно все же тессеракт или что-то вроде стоило бы заюзать для контроля.

Но и системы ИИ непрерывно совершенствуются. 2-3 года назад GPT 3 произвел фурор - сейчас это уже отсталая модель.

praseodim ★★★★★
(26.01.25 17:38:44 MSK)

Ссылка

Просто примите за данность, что ИИ у нас гуманитарий а не технарь, он мыслит образами а не алгоритмами. И задачи ему надо подбирать соответствующие - распознавание, нечеткий поиск, генерация по запросу и т.д, а не заставлять перебирать буковки с циферками.

shimshimshim
(26.01.25 17:41:24 MSK)

Ответ на: комментарий от praseodim 26.01.25 17:34:45 MSK

Ну работа тут только начата 😃 потому что сам json ( или чего запрос там возвращает) никому не нужон его надо как то показывать, пользователь там начнёт что то тыкать, потом какие нить отчёты, ещё чего нить о чём сейчас даже не подозревают, завтра китайский сайтик что то поменяет, надо будет поддерживать старое/новое и тут внезапно выяснится, что магический запрос это 5% всей работы 😃

vtVitus ★★★★★
(26.01.25 18:10:35 MSK)

Ссылка

Ответ на: комментарий от Lordwind 26.01.25 14:25:46 MSK

100 задач - решил 15 - профит есть. А бизнес считает иначе

Бизнес как раз так и считает. Любую книжонку по манагементу возьми - там про то как стать маньяком, охотящимся на нетакусиков. Примени вот эти методы к 100 проектам - на 80 сработают, остальных не жалко, даже если до применения были успешными. Как в армии

DumLemming ★★★
(26.01.25 18:17:44 MSK)

Ответ на: комментарий от DumLemming 26.01.25 18:17:44 MSK

Ты путаешь бизнес и галерную греблю

Lordwind ★★★★★
(26.01.25 18:39:43 MSK) автор топика

Ссылка

Ответ на: комментарий от vaddd 26.01.25 17:31:39 MSK

И без специального погонщика AI (или подписки на него) за много денег не понять, какие 15% правильные :)

Dimez ★★★★★
(26.01.25 18:54:36 MSK)

Ответ на: комментарий от Dimez 26.01.25 18:54:36 MSK

Для ИИ-решателя задач нужен еще ИИ-тестировщик, ИИ-впариватель продукта потребителю, ИИ-написатель отчетов, ИИ-заявитель грантов, ИИ-начальник и ИИ-открыватель ногой дверей в высокорасположенные кабинеты.

vaddd ★☆
(26.01.25 19:06:57 MSK)

Ответ на: комментарий от CrX 26.01.25 14:19:27 MSK

Не рекламировали бы его как диво дивное и чудо чудное, а продвигали бы более-менее адекватно настоящей эффективности, может и не было бы такого провала в итоге.

Так только так и можно, иначе ничего никогда не взлетит, или будет взлетать очень долго. Нужно, чтобы люди обращали внимание, чтобы инвесторы появлялись. А они в основном на хайп реагируют, просто «ну вот мы тут без понтов что-то пилим, и может быть через 50 лет что-то получится» - для коммерсов не нужно.

seiken ★★★★★
(26.01.25 19:09:41 MSK)
Последнее исправление: seiken 26.01.25 19:10:01 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от shimshimshim 26.01.25 17:41:24 MSK

И задачи ему надо подбирать соответствующие - распознавание, нечеткий поиск, генерация по запросу и т.д

Это уже какой-то ИИ-собутыльник - «чего-то хочется выпить», «чем бы закусить?»

vaddd ★☆
(26.01.25 19:10:43 MSK)

Ссылка

Ответ на: комментарий от vaddd 26.01.25 19:06:57 MSK

в высокорасположенные ИИ-кабинеты.

Fixed ;)

Dimez ★★★★★
(26.01.25 19:49:28 MSK)

Ответ на: комментарий от CrX 26.01.25 14:19:27 MSK

Не рекламировали бы его как диво дивное и чудо чудное, а продвигали бы более-менее адекватно настоящей эффективности, может и не было бы такого провала в итоге.

Без прикормки инвесторы не дуреют:

https://www.maginative.com/article/cognition-ai-raises-175m-at-2b-valuation-one-month-after-series-a/

t3n3t ★
(26.01.25 21:36:57 MSK)

Ссылка

Хорошо бы в следующей итерации оно заменяло PM-ов. По КПД уже сравнимо.

t3n3t ★
(26.01.25 21:39:41 MSK)
Последнее исправление: t3n3t 26.01.25 21:39:50 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от Lordwind 26.01.25 14:25:46 MSK

Вот как раз так инженеры и мыслят. Бизнес мыслит так - если 15% задач можно переложить на нейросетку значит из 100 программистов 15 можно уволить. Предсказуемость и стабильность это вот прям вообще не про бизнес, особенно в последние 5-10 лет

upcFrost ★★★★★
(26.01.25 22:51:07 MSK)

Ответ на: комментарий от vaddd 26.01.25 19:06:57 MSK

И ещё ИИ-потребитель.

wicker
(26.01.25 23:03:05 MSK)

Ссылка

Ответ на: комментарий от Dimez 26.01.25 19:49:28 MSK

в высокорасположенные ИИ-кабинеты.

Слишком хорошо, чтобы быть правдой

goingUp ★★★★★
(26.01.25 23:45:20 MSK)

Ссылка

Стоит впрочем упомянуть, что Devin создан не openAI или какими-то другими крупными организациями, а небольшой фирмочкой с громкими анонсами)

goingUp ★★★★★
(26.01.25 23:48:37 MSK)
Последнее исправление: goingUp 26.01.25 23:50:32 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от upcFrost 26.01.25 22:51:07 MSK

Ты сначала выясни какие 15% задач можно переложить и какие 15% программистов можно уволить, а то бизнес тупенький, он не в курсе.

Lordwind ★★★★★
(27.01.25 14:20:43 MSK) автор топика

Ответ на: комментарий от alysnix 26.01.25 14:42:59 MSK

Проблема не в том, что «не летают». Реактивные ранцы тоже вполне себе летают. Причем очень давно. Проблема в том, что привычные средства перемещения они так и не заменили, как бы они круто не выглядели.

r_asian ★☆☆
(27.01.25 14:32:25 MSK)