LINUX.ORG.RU
ФорумTalks

ИИ опять всё

 ,


0

0

Сервис Devin, заявленный авторами в качестве «первого ИИ-программиста», оказался не в силах заменить реального разработчика. Грандиозный разрекламированный проект решает лишь малую часть поставленных перед ним задач. Процент успеха находится на уровне 15% – это крайне низкий показатель, тем более, что Devin был запущен сравнительно давно.

Пруф: https://corp.cnews.ru/news/top/2025-01-24_razrabotchiki_mogut_spat

Истерики отменяются (Программисты опять всё.), продолжаем работать

★★★★★

решает лишь малую часть поставленных перед ним задач

короче заменяет программиста на все 100

alysnix ★★★
()

решает лишь малую часть поставленных перед ним задач. Процент успеха находится на уровне 15%

Ну надо же! Кто бы мог подумать!

А в чём, собственно урок? Да в том, что ври да не завирайся. Не рекламировали бы его как диво дивное и чудо чудное, а продвигали бы более-менее адекватно настоящей эффективности, может и не было бы такого провала в итоге.

P.S. в заголовке новости по ссылке желтизна: «бесполезен» и «решает 15% задач» в одном предложении. Так-то, 15% это тоже полезно.

CrX ★★★★★
()
Последнее исправление: CrX (всего исправлений: 2)
Ответ на: комментарий от CrX

Так-то, 15% это тоже полезно

Ты мыслишь как инженер. Получил 100 задач - решил 15 - профит есть. А бизнес считает иначе, там нужна стабильность и предсказуемость. Перекладыватели жсонов не просто так появились, а потому что это хоть и неэффективная, но легкозаменяемая работа. Никто не будет инвестировать в проект, где вероятность успеха только одной технической стадии 15%.

Lordwind ★★★★★
() автор топика

Разработчики могут спать спокойно. «Первый ИИ-программист» бесполезен, он справляется только с 15% поставленных задач

и разработчики пошли спокойно спать.

самолет можайского имел паровой двигатель и аэродинамику, от которой заплакал бы любой студент МАИ. и потому так и не полетел.

но это не значит, что самолеты не летают.

alysnix ★★★
()

Грандиозный разрекламированный проект

Однако воспользоваться им смогут лишь те, кто располагает свободными $500

Ежемесячно, однако. Врядли там стояла какая-то особая цель, кроме как срубить деньжат. То, что на самом деле сможет заменить, наверняка выкатят тихо, без лишнего шума.

ControlUnit
()

Кто бы, б*ть мог подумать. Никогда такого не было и вот опять. Чтоб ИИ в программировании был эффективен, должны быть +- стандартные задачи, +- понятные критерии и т.п. Это очевидно любому, кто вообще понимает как ИИ работает. А сейчас чем дальше в лес, тем требования всё более и более размытые, критерии каждые несколько лет полностью меняются, даже у буржуев, а у нас они всегда были на уровне «сделайте, чтоб нам было хорошо». Так что у ИИ в текущем ИТ мире нет шансов. Вот когда ради ИИ начнут резать осётра, вот тогда можно начинать беспокоиться, но пока никто не хочет отказываться от 100500 бессмысленных фич и возможностей. :-)

Но вот в каком-нить двайверо писании, программировании станков, автомобилей и т.п. в таких небольших нишах ИИ будет, возможно, востребован.

vtVitus ★★★★★
()
Последнее исправление: vtVitus (всего исправлений: 3)
Ответ на: комментарий от vtVitus

На rsdn хороший практический пример применения ИИ есть https://rsdn.org/forum/ai/8786048

На фриланс есть (был) заказ https://freelance.habr.com/tasks/588562

На фрилансе интересная задачка попалась: Преобразовать данные с изображений.

В теории понятно как делать: 1. Находим таблицу на изображении 2. Распознаем текст 3. Переводим 4. Формируем новую таблицу транспонируя матрицу

Как это можно реализовать вообще? Искать какую-то нейросеть для поиска таблиц? И как лучше сделать нарезку изображений для распознавания и перевода? Перевести можно используя Tesseract OCR или что хорошо умеет в китайский. Дальше уже имея распознанную таблицу сформировать новую не проблема.

Как я понял есть какой-то одежный китайский сайт с описанием шмоток и таблицей их размеров. Надо было выдрать эти размеры с описаний и предоставить в виде изображения таблицы с ними.

Основная сложность, что эти таблицы носят достаточно произвольный характер.

Автор сообщения предполагал что-то мутить с тессерактом или еще какой OCR.

Вместо этого запросик к чатгопоте с просьбой найти таблицу размеров и выдать результат в Json https://rsdn.org/forum/ai/8888152

Мне кажется ты сильно недооцениваешь современные LLM. Ниже пример для Chat GPT. Никого тренировать не надо, все уже натренеровано. Цена за 1 картинку 1000х1000 GPT будет около $0.002

Хренак-хренак и готово. Еще конечно Json надо в картинку превратить, но это уже обычная задача, которую думаю даже не самый опытный программист осилит. А то может и на это правильный промпт получится составить.

Нужен конечно платный доступ к API от OpenAI. Но может даже локальные LLM справятся, это проверять надо.

praseodim ★★★★★
()
Последнее исправление: praseodim (всего исправлений: 1)

оказался не в силах заменить реального разработчика

Конечно, кто его в пресс-хату пустит-то?

buddhist ★★★★★
()
Ответ на: комментарий от praseodim

А где в твоем примере замена программиста ИИ?

Тут банальная задача «распарсить какую-то хрень». С таким современный ИИ отлично справляется, кто-бы спорил

Я вот на GitHub Copilot интегрированный в VSCode подсел. Выводит автокомплит на новый уровень

Но это ни разу не замена меня. Просто ещё сильнее ускоряет печать кода

Merlin86
()
Ответ на: комментарий от Lordwind

Ты мыслишь как инженер. Получил 100 задач - решил 15 - профит есть.

Был старый анекдот который я уже дословно не помню, там продавец компьютеров объясняет важному дядьке в галстуке, что мол «компьютер выполняет 50% работы», на что дядька отвечает – «тогда мне два».

Aber ★★★★★
()
Последнее исправление: Aber (всего исправлений: 1)
Ответ на: комментарий от praseodim

Форматировал с помощью ChatGPT задачки по C из pdf оригинала в текст шириной 80 символов и с сишными комментариями вида /* ... */.

Очень удивился, когда этот ИИ помимо форматирования начал переформулировать текст самих задач, иногда выбрасывая целые предложения. Были и ещё нюансы. Сделал вывод, что хоть и быстро, но контроль результата должен быть очень тщательный

Jurik_Phys ★★★★★
()
Ответ на: комментарий от Lordwind

А бизнес считает иначе, там нужна стабильность и предсказуемость.

Стабильно и предсказуемо решает 15% задач.

greenman ★★★★★
()
Ответ на: комментарий от greenman

Стабильно и предсказуемо решает 15% задач.

Осталось уточнить, что остальные 85% он тоже решает, но неправильно.

vaddd ★☆
()
Ответ на: комментарий от Merlin86

А где в твоем примере замена программиста ИИ?

Программиста он не заменил в этой задаче, но радикально снизил ее сложность. Раньше еще попробуй подступись к ней, качество работы тессеракта и других опенсорсных OCR очень такое себе, а тут вообще работы немного осталось.

praseodim ★★★★★
()
Ответ на: комментарий от Jurik_Phys

Очень удивился, когда этот ИИ помимо форматирования начал переформулировать текст самих задач, иногда выбрасывая целые предложения. Были и ещё нюансы. Сделал вывод, что хоть и быстро, но контроль результата должен быть очень тщательный

Это да, а то может оказаться, что половина новых таблиц - это фантазии ИИ :)) Вероятно все же тессеракт или что-то вроде стоило бы заюзать для контроля.

Но и системы ИИ непрерывно совершенствуются. 2-3 года назад GPT 3 произвел фурор - сейчас это уже отсталая модель.

praseodim ★★★★★
()

Просто примите за данность, что ИИ у нас гуманитарий а не технарь, он мыслит образами а не алгоритмами. И задачи ему надо подбирать соответствующие - распознавание, нечеткий поиск, генерация по запросу и т.д, а не заставлять перебирать буковки с циферками.

shimshimshim
()
Ответ на: комментарий от praseodim

Ну работа тут только начата 😃 потому что сам json ( или чего запрос там возвращает) никому не нужон его надо как то показывать, пользователь там начнёт что то тыкать, потом какие нить отчёты, ещё чего нить о чём сейчас даже не подозревают, завтра китайский сайтик что то поменяет, надо будет поддерживать старое/новое и тут внезапно выяснится, что магический запрос это 5% всей работы 😃

vtVitus ★★★★★
()
Ответ на: комментарий от Lordwind

100 задач - решил 15 - профит есть. А бизнес считает иначе

Бизнес как раз так и считает. Любую книжонку по манагементу возьми - там про то как стать маньяком, охотящимся на нетакусиков. Примени вот эти методы к 100 проектам - на 80 сработают, остальных не жалко, даже если до применения были успешными. Как в армии

DumLemming ★★★
()
Ответ на: комментарий от DumLemming

Ты путаешь бизнес и галерную греблю

Lordwind ★★★★★
() автор топика
Ответ на: комментарий от vaddd

И без специального погонщика AI (или подписки на него) за много денег не понять, какие 15% правильные :)

Dimez ★★★★★
()
Ответ на: комментарий от Dimez

Для ИИ-решателя задач нужен еще ИИ-тестировщик, ИИ-впариватель продукта потребителю, ИИ-написатель отчетов, ИИ-заявитель грантов, ИИ-начальник и ИИ-открыватель ногой дверей в высокорасположенные кабинеты.

vaddd ★☆
()
Ответ на: комментарий от CrX

Не рекламировали бы его как диво дивное и чудо чудное, а продвигали бы более-менее адекватно настоящей эффективности, может и не было бы такого провала в итоге.

Так только так и можно, иначе ничего никогда не взлетит, или будет взлетать очень долго. Нужно, чтобы люди обращали внимание, чтобы инвесторы появлялись. А они в основном на хайп реагируют, просто «ну вот мы тут без понтов что-то пилим, и может быть через 50 лет что-то получится» - для коммерсов не нужно.

seiken ★★★★★
()
Последнее исправление: seiken (всего исправлений: 1)
Ответ на: комментарий от shimshimshim

И задачи ему надо подбирать соответствующие - распознавание, нечеткий поиск, генерация по запросу и т.д

Это уже какой-то ИИ-собутыльник - «чего-то хочется выпить», «чем бы закусить?»

vaddd ★☆
()
Ответ на: комментарий от CrX

Не рекламировали бы его как диво дивное и чудо чудное, а продвигали бы более-менее адекватно настоящей эффективности, может и не было бы такого провала в итоге.

Без прикормки инвесторы не дуреют:

https://www.maginative.com/article/cognition-ai-raises-175m-at-2b-valuation-one-month-after-series-a/

t3n3t
()

Хорошо бы в следующей итерации оно заменяло PM-ов. По КПД уже сравнимо.

t3n3t
()
Последнее исправление: t3n3t (всего исправлений: 1)
Ответ на: комментарий от Lordwind

Вот как раз так инженеры и мыслят. Бизнес мыслит так - если 15% задач можно переложить на нейросетку значит из 100 программистов 15 можно уволить. Предсказуемость и стабильность это вот прям вообще не про бизнес, особенно в последние 5-10 лет

upcFrost ★★★★★
()
Ответ на: комментарий от Dimez

в высокорасположенные ИИ-кабинеты.

Слишком хорошо, чтобы быть правдой

goingUp ★★★★★
()

Стоит впрочем упомянуть, что Devin создан не openAI или какими-то другими крупными организациями, а небольшой фирмочкой с громкими анонсами)

goingUp ★★★★★
()
Последнее исправление: goingUp (всего исправлений: 1)
Ответ на: комментарий от upcFrost

Ты сначала выясни какие 15% задач можно переложить и какие 15% программистов можно уволить, а то бизнес тупенький, он не в курсе.

Lordwind ★★★★★
() автор топика
Ответ на: комментарий от alysnix

Проблема не в том, что «не летают». Реактивные ранцы тоже вполне себе летают. Причем очень давно. Проблема в том, что привычные средства перемещения они так и не заменили, как бы они круто не выглядели.

r_asian ★☆☆
()

По пузырю пошли трешины, ждем когда лопнет

Kolins ★★★★★
()
Последнее исправление: Kolins (всего исправлений: 1)
Ответ на: комментарий от Lordwind

А это будут оценивать сами программисты. Суть - сверху спустили команду «уволить 15%». И дальше все решают кого пустить на котлеты

upcFrost ★★★★★
()
Ответ на: комментарий от upcFrost

Программисты никогда ничего не решали и решать не будут

vaddd ★☆
()
Ответ на: комментарий от upcFrost

сверху спустили команду «уволить 15%»

В сбере сейчас уволили около 30%. Без всяких ИИ.

Lordwind ★★★★★
() автор топика
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)