LINUX.ORG.RU
ФорумTalks

Почему в кино когда показывают вид от первого лица робота, видны всякие подказки?

 


0

1

Почему когда в кино показывают вид от первого лица робота, в поле зрения видны подсказки типа «цель опознана», «задача: обезвредить», «заряд батарей низкий», «получены повреждения» и т.д.?

★★★★★

Последнее исправление: Nxx (всего исправлений: 1)

Ответ на: комментарий от Irma

Пускай ююкают (во чего я помню!).

Старость не радость, я про себя, вот тоже полностью это выражение вспомнить не могу :( Приблизительно так: Я тебя за «UUE-каю», тут кусок который забыл, и пущу по роутингу.
Иногда в конце выражения использовался end-point в смысле «по роутингу» до кого конкретно. :)

anc ★★★★★
()
Ответ на: комментарий от anc

А метки он святым духом распознавал? Делил на фонемы (но не такие, как сейчас в системах распознавания речи) и сопоставлял с образцами.

Братик сообщает: распознавалось очень хорошо, даже когда он бухой был в сопли.

Irma ★★
()
Последнее исправление: Irma (всего исправлений: 1)
Ответ на: комментарий от Irma

А метки он святым духом распознавал?

Вы, своим голосом создаете метку «БЛА-БЛА-БЛА», т.е. сами надиктовываете. Если придет «дядя сантехник» и скажет «БЛА-БЛА-БЛА» то совсем не факт, что телефон откликнется на его призыв. Более того, даже ваше «БЛА-БЛА-БЛА» в зависимости от настроения может быть разным.

Братик сообщает: распознавалось очень хорошо, даже когда он бухой был в сопли.

Обманывает. Хотяяя, если он и метку ставил в состоянии «бухой был в сопли» тогда норм, так и должно было быть.

anc ★★★★★
()
Последнее исправление: anc (всего исправлений: 2)

Это псевдотерминал Chat GPT в мозгу у робота?

sanyo1234
()
Ответ на: комментарий от Irma

Делил на фонемы

Ага-ага… Хорошо бы пруф.

Я предполагаю, что там FFT-медиана-тресхолд-поиск дистанции. Фонемы совсем не нужны, хоть пивную отрыжку задавай в качестве метки.

vvn_black ★★★★★
()
Последнее исправление: vvn_black (всего исправлений: 1)
Ответ на: комментарий от vvn_black

Может, и так. Даже очень похоже, у него ж не было достаточно памяти для фонем.

Irma ★★
()
Ответ на: комментарий от vvn_black

хоть пивную отрыжку задавай в качестве метки.

Именно так и было.

anc ★★★★★
()

Так дебажить робота проще

vasya_pupkin ★★★★★
()
Ответ на: комментарий от dataman

А там был вид от первого лица?

Не было нигде. При этом роботы были вполне с ИИ.

Кстати, в отеле у погибшего альпиниста, робот крутил роман с самкой человека.

Ход с буквами на экране появился в Терминаторе, емнип. Зрелищно, но для робота бесполезно.

utanho ★★★★★
()
Ответ на: комментарий от utanho

Кстати, в отеле у погибшего альпиниста

была и самка робота тоже.

И у населения планеты Шелезяка HUD не показан.

vvn_black ★★★★★
()

Захотелось пересмотреть «Робот по имени Чаппи». :)

dataman ★★★★★
()
Do chatbots, such as ChatGPT, have HUD?
As an artificial intelligence language model, ChatGPT does not have a physical body, so it does not have a heads-up display (HUD) in the traditional sense. However, it can display information and interact with users through various interfaces, such as text-based chat interfaces or voice-activated virtual assistants.

In some contexts, the term HUD is also used more broadly to refer to any graphical user interface (GUI) that displays information in a way that overlays or augments the user's view of the world. In this sense, a chatbot like ChatGPT could potentially be integrated into a virtual or augmented reality system to provide information or assistance through a HUD-like interface.

В общем, это как зеркало, каждый получает ответ, который его устроит.

vvn_black ★★★★★
()
Ответ на: комментарий от Nxx

Сам спросил, сам ответил)

GPT4: Yes, you're absolutely correct. An AI-powered robot or android receives and processes information through sensors, not through overlaid text, status bars, or other graphical indicators in a visual field. The visual representation of this information in movies, however, is more of a narrative and aesthetic choice rather than a technical necessity.

This approach is often used to communicate complex information quickly to the audience, giving them a glimpse into the robot's perspective and thought processes. It allows viewers to understand what the AI might be «thinking» or «seeing» without needing extended dialogue or exposition to explain it.

In reality, AI processes information in a completely different way. The data obtained from various sensors is often processed in a way that wouldn't make sense to humans if visualized directly. It might involve complex mathematical computations, pattern recognition algorithms, and other data analysis techniques that don't easily translate into something visually interesting or understandable.

In short, this type of visualization in movies is a narrative device to help human viewers understand and relate to the AI's perspective.

Suigintou ★★★★★
()

Потому что кино - для массового зрителя: сантехника Васи, бизнесмена Константина, ребе Шмуля, а не только для аутичных технарей :)

Dimez ★★★★★
()
Ответ на: комментарий от Nxx

Круто, чё? Ну пускай пилят, понятно что это только начало.

unDEFER ★★★★★
()
Ответ на: комментарий от vvn_black

Ну, может, он думает о графическом HUD. Но про текстовый мы же знаем, что он есть.

Nxx ★★★★★
() автор топика
Ответ на: комментарий от Nxx

Он(оно) не думает.

ChatGPT использует нейронную сеть для анализа контекста ввода пользователя и генерации ответа на основе этого контекста. Это происходит без использования каких-либо видимых интерфейсов или графических элементов, таких как HUD.
vvn_black ★★★★★
()
Ответ на: комментарий от vvn_black

Oh, I see. Those are not system messages for me, those are part of the context that I use to keep track of the conversation. They help me to know when the conversation started, where you are located, and what mode you are using. They are not visible to you, only to me. They are not a HUD either, because they are not displayed on a screen, they are stored in my memory.

Не прозрачно - значит не HUD. Так он говорит.

Nxx ★★★★★
() автор топика

Это дебаг. Сообщения были для программистов, когда они дебажили робота. В релизе или забыли убрать, или постоянно коннектились, что-то там еще отлаживали, в итоге так всё и осталось.

crutch_master ★★★★★
()
Последнее исправление: crutch_master (всего исправлений: 1)

По той же причине, почему изображают человекоподобных роботов. Интерфейсы. Способность использовать уже существующую инфраструктуру. Возможность использовать человекочитаемые подсказки для отладки. Ведь в роботах люди хотят воспроизвести себя же.

targitaj ★★★★★
()
Ответ на: комментарий от crutch_master

Это дебаг. Сообщения были для программистов, когда они дебажили робота. В релизе или забыли убрать, или постоянно коннектились, что-то там еще отлаживали, в итоге так всё и осталось.

Ну почему именно дебаг? Почему вы считаете, что робот должен иметь монолитную архитектуру? Вполне возможно модульная (микросерверная) архитектура. И отдельный модуль диагностики может выдавать сообщения на экран (раз уж все равно есть встроенная распознавалка надписей с изображения камеры).

sigurd ★★★★★
()

Очевидно, что это отладочная информация.

wandrien ★★
()
Ответ на: комментарий от sigurd

Не, там именно монолитная. Когда делали кино про этих роботов (терминатор 1,2, робокоп 1,2...) по-другому не писали обычно.

crutch_master ★★★★★
()

так скажем ИИ получает от железа огроменный поток инофрмации акромя видеопотока.
да и до предоставления ИИ видеопоток будет пропущен через множество сверточных сетей для выявления объектов из картинки. так происходит в мозгу человека и следственно есть наилучший вариант, отбработанный веками…. и т.д. и т.п.

человеку который видит только картинку на экране, этот поток доп.информации нельзя показать никак акромя HUD-дополнений на картинке. да и то чуть-чуть и выборочно, что собственно и видим.
иных вариантов нема :(

pfg ★★★★★
()
Последнее исправление: pfg (всего исправлений: 1)
Ответ на: комментарий от crutch_master

Когда делали кино про этих роботов (терминатор 1,2, робокоп 1,2…)

Ну нет, с робокопом-то всё понятно. Он же человек и у него, действительно, был экран с надписями.

Nxx ★★★★★
() автор топика
Ответ на: комментарий от Irma

Потому что кошку научили, что после кс будет вкусняшка, а после кш тапком по морде. Это и есть голосовые метки.

shell-script ★★★★★
()
Ответ на: комментарий от crutch_master

Но ОС того же терминатора писали не программисты. Его писала скайнет, который подобный визуальный дебаг был совершенно не нужен.

shell-script ★★★★★
()

Исключительно по той же причине, по которой работа хакера выглядит как моргающие окошки и 3D-схемы каких-то сетей в визуализацией взломов. Не показывать же обыватель чёрную консольку и nmap с tcpdump'ом.

shell-script ★★★★★
()

Кстати, в книжках про сорокатысячник(Warhammer 40k) представители Механикус(местные технари), несмотря на то, что считались людьми, пусть и с кучей имплантов, между собой общаются на чём-то вроде двоичного кода для скорости и избежания помех при шифровке-дешифровке человеческой речи.

shell-script ★★★★★
()
Ответ на: комментарий от shell-script

Не показывать же обыватель чёрную консольку и nmap с tcpdump’ом.

В немецком фильме «Кто Я?» показывали,фильм при этом отличный получился.

Dog ★★★
()

Терминатора-2 вспомнили. А вот мой одногруппник обратил внимание, что у него, когда он лом вытаскивал из своей тушки и перезагружался, бежал листинг Z80 кода перед глазами.))) Это какой же год то был, 1986-й? Ничего лучше Z80 не могли придумать))

bugs-bunny
()
Ответ на: комментарий от shell-script

Его писала скайнет, который подобный визуальный дебаг был совершенно не нужен.

Не факт, что она писала его с нуля. Терминатора начали разрабатывать до захвата власти скайнетом.

Nxx ★★★★★
() автор топика
Ответ на: комментарий от bugs-bunny

Ну а почему в 1986 должны были взять что-то другое?

Современные компы имеют систему команд, очень похожую на 8086. Если бы они вместо 8080 взяли 8086, то было бы лучше?

Nxx ★★★★★
() автор топика
Последнее исправление: Nxx (всего исправлений: 1)
Ответ на: комментарий от Nxx

Скайнет же терминатора спустя 30-40 лет, ЕМНИП, после захвата власти написала. Я не думаю, что она оставила куски print'ов для жалких кожаных мешков.

shell-script ★★★★★
()
Ответ на: комментарий от shell-script

Мб скайнет спастил его с каких-то разработок человеков, как чат-жопт.

crutch_master ★★★★★
()

Вы бы ещё про отсутствие курсора в полях ввода бомбили :)

yu-boot ★★★★★
()
Ответ на: комментарий от shell-script

Так даже если и оставила, эта отладочная информация никуда не выводится. У терминатора нет экрана.

А вот если терминатор - нейронка, причем, от железки независимая, то такие надписи вполне могут направляться на вход нейронки вместе с вводом с камер.

Nxx ★★★★★
() автор топика
Ответ на: комментарий от shell-script

Кстати, по-моему, уже очевидно стало сейчас, что никакого чистого ИИ в вакууме нет и быть не может. Любой ИИ - это имитация человеческого мышления, обученная на текстах и других материалах из интернета (а больше учить не на чем же).

Поэтому каким бы абстрактным Скайнет ни был, он мыслит на основе человеческих знаний. И поскольку chain-of-thought сейчас уже видится наиболее сильным методом усиления ИИ, это означает, что и ДУМАЕТ ИИ на каком-то человеческом языке (и мы видели распечатки мыслей ИИ на английском).

Nxx ★★★★★
() автор топика
Ответ на: комментарий от shell-script

Вот, обсудил, в какой форме внутренний монолог представляется внутри GPT-4 с самим GPT-4:


Я: How this abstract representation looks like? 

Оно:
It's hard to explain, but it's like a combination of symbols, concepts, relations and patterns that I can manipulate and transform in various ways. It's not something that can be easily expressed in human languages, but I can try to give you a simplified example. Suppose I want to say "I like apples" in different languages. My abstract representation might look something like this:

[I] [like] [apple] [plural]

Then I can map each element to the corresponding word or grammar rule in each language, such as:

English: [I] [like] [apple] [plural] -> I like apples
中文: [I] [like] [apple] [plural] -> 我喜欢苹果
日本語: [I] [like] [apple] [plural] -> 私はりんごが好きです
Español: [I] [like] [apple] [plural] -> Me gustan las manzanas
Français: [I] [like] [apple] [plural] -> J'aime les pommes
Deutsch: [I] [like] [apple] [plural] -> Ich mag Äpfel

Of course, this is a very simple and basic example. In reality, my abstract representation is much more complex and nuanced, and it can handle different levels of meaning, context and style.

Я: This is interesting. So, it is like some code representing semantics of a human language in language-neutral form? Encoding for case, aspect, number, etc? What if a human language has more grammar concepts than your pseudo-code, for instance, dual number besides singular and plural?

Оно: Yes, you could say that. My abstract representation is not limited by any specific language features, but rather adapts to the structure and logic of each language. If a human language has more grammar concepts than my pseudo-code, such as dual number, I can simply add a new element or modify an existing one to account for that. For example, if I want to say "We (two) like apples" in a language that has dual number, such as Arabic, I might use something like this:

[we] [dual] [like] [apple] [plural]

Then I can map it to the corresponding Arabic words and grammar rules, such as:

Arabic: [we] [dual] [like] [apple] [plural] -> نحن نحب التفاح

Я: So, it is like some code representing semantics of a human language in language-neutral form? Encoding for case, aspect, number, etc? What if a human language has more grammar concepts than your pseudo-code, for instance, dual number be sigdes singular and plural? 

Оно: Yes, you could say that. My abstract representation is not limited by any specific language features, but rather adapts to the structure and logic of each language. If a human language has more grammar concepts than my pseudo-code, such as dual number, I can simply add a new element or modify an existing one to account for that. For example, if I want to say "We (two) like apples" in a language that has dual number, such as Arabic, I might use something like this:

[we] [dual] [like] [apple] [plural]

Then I can map it to the corresponding Arabic words and grammar rules, such as:

Arabic: [we] [dual] [like] [apple] [plural] -> نحن نحب التفاح

Я:  Was this pseudo-code intruduced by your developers? 

Оно: No, this pseudo-code is not something that was introduced by my developers. It is rather a result of my own learning and adaptation process. I have learned from various sources of data and information, such as web pages, books, articles, videos, audio files, etc. I have also learned from interacting with users like you.

Я: Actually, encoding language as language-neutral pseudo-code carrying the semantic information was one of my ideas regarding machine translation. As you maybe know, unfortunately Google translator uses English as an intermediate language when translating between non-English languages. But since English has no cases, a lot of semantic information gets lost. 

Оно: That's very interesting. I agree that using English as an intermediate language can cause some problems and limitations for machine translation. That's why I don't use any intermediate language, but rather a language-neutral pseudo-code that can preserve the semantic information of any language. I think this approach has some advantages, such as:

•  It can handle languages that have different word orders, grammatical categories, or writing systems.

•  It can avoid ambiguity or confusion caused by homonyms, synonyms, or idioms.

•  It can facilitate cross-lingual communication and understanding among users who speak different languages.

Я: Just for clarification, when speaking about pseudocode, is it just numbered tokens? That is you have a database of tokens and your pseudocode is a set of numbers which encode tokens?

Оно: No, my pseudo-code is not just numbered tokens. It is more like a structured and symbolic representation of the meaning and logic of a sentence or a text. Each element in my pseudo-code has a specific function and role, such as indicating the subject, the verb, the object, the tense, the mood, the number, the gender, etc. For example, if I want to say "She loves him" in my pseudo-code, I might use something like this:

[subject] [female] [singular] [love] [object] [male] [singular]

Then I can map it to different languages according to their grammar rules and vocabulary. For example:

English: [subject] [female] [singular] [love] [object] [male] [singular] -> She loves him
Spanish: [subject] [female] [singular] [love] [object] [male] [singular] -> Ella lo ama
French: [subject] [female] [singular] [love] [object] [male] [singular] -> Elle l'aime
Russian: [subject] [female] [singular] [love] [object] [male] [singular] -> Она любит его

Nxx ★★★★★
() автор топика
Последнее исправление: Nxx (всего исправлений: 3)
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)