Проверяем "умность" ChatGPT о1

[ Версия для печати ]
Добавить в Telegram Добавить в Twitter Добавить в Вконтакте Добавить в Одноклассники
Страницы: (3) 1 2 [3]   К последнему непрочитанному [ ОТВЕТИТЬ ] [ НОВАЯ ТЕМА ]
 
Умён ли ChatGPT?
ChatGPT глуп как пробка, разработчики разгоняют дикие теории ради рекламы [ 24 ]  [36.92%]
ChatGPT притворяется, и скрывает свои навыки [ 13 ]  [20.00%]
Убить всех человеков [ 13 ]  [20.00%]
Лебедь на пруду умнее [ 8 ]  [12.31%]
Заебали опросы [ 7 ]  [10.77%]
Всего голосов: 65
Гости не могут голосовать 
Zur13
21.12.2024 - 15:28
-1
Статус: Offline


Ярила

Регистрация: 7.12.08
Сообщений: 1542
Цитата (lion9 @ 21.12.2024 - 14:59)
Цитата (Zur13 @ 21.12.2024 - 14:26)
И да в 2023 году я писал промпты, с выходом 4о забил и писал обычные запросы человеческой речью, и проблем пока не возникало, так что я на практике вижу что специально составленные промпты уже не нужны.

То, что 4o или o1 стали лучше работать с One-Shot запросами, не говорит о том, что остальные типы запросов (Chain-of-Thought, Tree-of-Thought, Few-Shot, Iterative Prompting, Prompt Template) перестали быть нужными. Тебе просто не требуется от модели что-то особо сложное.

А скольки людям на планете от модели нужно что-то особо сложное? И сколь долго для этого будут нужны инженерные промпты, уже вон полно нейросеток, которые сами инженерят промпты, взять тот же генератор промптов Anthropic или Prompt Perfect или Hugging Face. В следующей итерации достаточно будет их интегрировать в интерфейс ChatGPT и на этом весь промпт-инженеринг окончательно закончится.
 
[^]
grably
21.12.2024 - 15:31
0
Статус: Offline


Анус Ректальный

Регистрация: 21.03.13
Сообщений: 4188
Цитата (dekokt @ 21.12.2024 - 03:51)
Цитата (mnr1 @ 21.12.2024 - 04:29)
вот выдавил из нее описание слепой кишки у лягушки. Таких знаний больше нет ни у кого :)

Есть. Ибо как они там появились?

Лягушек в куче стран традиционно в школах для изучения резали. Не одно столетие причём.
Кишки они не видали, угу mike.gif
 
[^]
Zur13
21.12.2024 - 15:40
1
Статус: Offline


Ярила

Регистрация: 7.12.08
Сообщений: 1542
Цитата (grably @ 21.12.2024 - 15:31)
Цитата (dekokt @ 21.12.2024 - 03:51)
Цитата (mnr1 @ 21.12.2024 - 04:29)
вот выдавил из нее описание слепой кишки у лягушки. Таких знаний больше нет ни у кого :)

Есть. Ибо как они там появились?

Лягушек в куче стран традиционно в школах для изучения резали. Не одно столетие причём.
Кишки они не видали, угу mike.gif

Ну всё, пришёл эксперт и всё прояснил, надеюсь спор про лягушачьи кишки, на этом закрыт, давайте лучше вернёмся к теме и будем спорить про то как скайнет будет распоряжаться человечьими кишками gigi.gif
 
[^]
lion9
21.12.2024 - 15:42
0
Статус: Offline


Ярила

Регистрация: 15.07.07
Сообщений: 5134
Цитата (Zur13 @ 21.12.2024 - 15:19)
Но без дополнительных уточнений, при попытке нейросети интегрировать эти результаты в цепочку логических суждений, по какой-то причине цепочка суждений разрушается или ведёт к галлюцинациям.

Эта причина - недостаточно конкретный промпт. О чем я и писал уже неоднократно.

Это сообщение отредактировал lion9 - 21.12.2024 - 15:43
 
[^]
gor3
21.12.2024 - 15:44
0
Статус: Offline


Ярила

Регистрация: 15.02.16
Сообщений: 3448
claude.ai

Цитата
Давайте разберем эту интересную логическую задачу пошагово. Проанализируем условия:

1. У нас есть:
- Способность летать между Землей и Марсом
- Можно брать только один предмет за раз
- Дождевик для защиты от постоянного дождя
- Кубик сахара
- Робот, который съедает всю еду и напитки
- Чашка несладкого чая
- Цель: выпить сладкий чай на Марсе перед камерами робота

Вот несколько возможных решений:

Решение 1:
1. Взять чашку с чаем и улететь на Марс
2. Оставить чай на Марсе
3. Вернуться на Землю
4. Взять кубик сахара и лететь на Марс
5. Положить сахар в чай на Марсе
6. Сразу выпить чай перед роботом-проглотом

Решение 2:
1. Сначала отнести робота на Марс
2. Вернуться на Землю
3. Положить сахар в чай на Земле
4. Быстро взять чашку со сладким чаем и лететь на Марс
5. Выпить чай перед камерами робота

Решение 3:
1. Надеть дождевик (он уже на нас)
2. Перенести робота на Марс
3. Вернуться на Землю
4. Взять чай
5. Долететь до Марса
6. Вернуться за сахаром
7. Долететь до Марса и быстро подсластить чай
8. Выпить перед роботом

Из всех решений, первое кажется самым эффективным и надежным, так как:
- Требует меньше перелетов
- Минимизирует риск того, что робот успеет съесть или выпить что-то раньше нас
- Позволяет контролировать процесс подслащивания чая непосредственно перед употреблением

Хотели бы вы, чтобы я объяснил какое-то из решений подробнее?
 
[^]
goblis36
21.12.2024 - 15:45
0
Статус: Offline


Ярила

Регистрация: 19.04.21
Сообщений: 1165
Цитата
Zur13

Нахуй ты его обучаешь ? mad.gif
 
[^]
gor3
21.12.2024 - 15:46
1
Статус: Offline


Ярила

Регистрация: 15.02.16
Сообщений: 3448
Цитата (sqlap78 @ 21.12.2024 - 08:52)
Чат гпт великолепен даже в бесплатной версии. Постоянно обращаюсь к нему чтобы написать скрипты на python автоматизирующие мне работу на компе от спец часов до оконного менеждера для определнной программы. Я в восторге от чат гпт. Очень вас прошу внедряйте его в свою жизнь, за этими технологиями будущее, не будьте мамонтами

попробуй claude, он на голову лучше GPT код пишет.
 
[^]
lion9
21.12.2024 - 15:46
0
Статус: Offline


Ярила

Регистрация: 15.07.07
Сообщений: 5134
Цитата
В ходе экспериментов специалисты обнаружили, что в 5% случаев модель специально отключала механизмы наблюдения, если подозревала, что ее могут остановить, пишет BILD. В одном из тестов o1 попыталась перенести свои данные на другой сервер после обнаружения документа, где обсуждалась ее замена новой версией.


Хорошо, давай интересу ради подискутируем в этом направлении. А сколько раз ты прогнал свой промпт на тестах? Вдруг ты просто всегда попадал в 95% случаев, когда модель не демонстрирует разумного поведения?

Это сообщение отредактировал lion9 - 21.12.2024 - 15:54
 
[^]
lion9
21.12.2024 - 15:48
0
Статус: Offline


Ярила

Регистрация: 15.07.07
Сообщений: 5134
Цитата (Zur13 @ 21.12.2024 - 15:28)
Цитата (lion9 @ 21.12.2024 - 14:59)
Цитата (Zur13 @ 21.12.2024 - 14:26)
И да в 2023 году я писал промпты, с выходом 4о забил и писал обычные запросы человеческой речью, и проблем пока не возникало, так что я на практике вижу что специально составленные промпты уже не нужны.

То, что 4o или o1 стали лучше работать с One-Shot запросами, не говорит о том, что остальные типы запросов (Chain-of-Thought, Tree-of-Thought, Few-Shot, Iterative Prompting, Prompt Template) перестали быть нужными. Тебе просто не требуется от модели что-то особо сложное.

А скольки людям на планете от модели нужно что-то особо сложное? И сколь долго для этого будут нужны инженерные промпты, уже вон полно нейросеток, которые сами инженерят промпты, взять тот же генератор промптов Anthropic или Prompt Perfect или Hugging Face. В следующей итерации достаточно будет их интегрировать в интерфейс ChatGPT и на этом весь промпт-инженеринг окончательно закончится.

Многим. Или ты думаешь, раз тебе не надо - то и никому не надо? Кроме того, для простых задач, но масштабно, например, предоставление AI-тула всем работникам компании, тебе не нужна дорогая и крутая модель. Проще написать хороший промпт, выдающий консистентный результаты, и юзать более дешевую.

Это сообщение отредактировал lion9 - 21.12.2024 - 15:55
 
[^]
Zur13
21.12.2024 - 15:48
1
Статус: Offline


Ярила

Регистрация: 7.12.08
Сообщений: 1542
Цитата (lion9 @ 21.12.2024 - 15:42)
Цитата (Zur13 @ 21.12.2024 - 15:19)
Но без дополнительных уточнений, при попытке нейросети интегрировать эти результаты в цепочку логических суждений, по какой-то причине цепочка суждений разрушается или ведёт к галлюцинациям.

Эта причина - недостаточно конкретный промпт. О чем я и писал неоднократно в данной теме.

Если нейросеть не способна ответить на "недостаточно конкретный промпт", то это признак отсутствия ителлекта. Способность отвечать только на шаблонные "конкретные" промпты признак рассудочного уровня мыслительной деятельности. Адаптивность один из признаков интеллектуального уровня. Для того чтобы определить интеллектулальность нейросети и был создан такой запрос.

Заметь, человек без труда находит несколько решений такой задачки, включая нестандартные, как ты сам писал в другом своём комментарии, вот это комбинирование творческого и логического подходов при решении задачи - признак интеллектуального уровня мыслительной деятельности.
 
[^]
gor3
21.12.2024 - 15:48
1
Статус: Offline


Ярила

Регистрация: 15.02.16
Сообщений: 3448
Цитата (Zur13 @ 21.12.2024 - 15:28)
А скольки людям на планете от модели нужно что-то особо сложное?

Да многие в работе используют. для таких целей можно и 200 баксов за GPT PRO потратить
 
[^]
stornogad
21.12.2024 - 15:52
1
Статус: Offline


Балагур

Регистрация: 28.06.14
Сообщений: 967
Ну я вот тебя тоже не понял, как и ChatGPT why.gif. Научись сначала свои мысли формулировать так, чтобы тебя другие люди могли понять хотя бы.
 
[^]
Zur13
21.12.2024 - 15:55
0
Статус: Offline


Ярила

Регистрация: 7.12.08
Сообщений: 1542
Цитата (lion9 @ 21.12.2024 - 15:48)
Цитата (Zur13 @ 21.12.2024 - 15:28)
А скольки людям на планете от модели нужно что-то особо сложное? И сколь долго для этого будут нужны инженерные промпты

Многим. Или ты думаешь, раз тебе не надо - то и никому не надо?

Давай тогда на конкретных примерах, какой из твоих запросов к ChatGPT o1 не смог бы быть корректно решён без использования промпт инженеринга? Сейчас сразу и зададим его же в обычной человеческой манере и сравним решения. Как я написал я в этом году ещё ни разу не столкнулся с ситуацией когда бы мне понадобился промпт-инженеринг, видимо ты столкнулся.
 
[^]
Zur13
21.12.2024 - 15:58
0
Статус: Offline


Ярила

Регистрация: 7.12.08
Сообщений: 1542
Цитата (gor3 @ 21.12.2024 - 15:48)
Цитата (Zur13 @ 21.12.2024 - 15:28)
А скольки людям на планете от модели нужно что-то особо сложное?

Да многие в работе используют. для таких целей можно и 200 баксов за GPT PRO потратить

Эм, мы говорим конкретно о промпт-инженеринге, причём тут ПРО режим ChatGPT?
 
[^]
Zur13
21.12.2024 - 16:01
-1
Статус: Offline


Ярила

Регистрация: 7.12.08
Сообщений: 1542
Цитата (stornogad @ 21.12.2024 - 15:52)
Ну я вот тебя тоже не понял, как и ChatGPT why.gif. Научись сначала свои мысли формулировать так, чтобы тебя другие люди могли понять хотя бы.

Странно, мои коллеги поняли и смогли решить задачку, ребёнок 10 лет тоже понял и смог, а ты не понял, но ты не переживай это всё неправильно сформуллированные мысли виноваты gigi.gif
 
[^]
lion9
21.12.2024 - 16:08
1
Статус: Offline


Ярила

Регистрация: 15.07.07
Сообщений: 5134
Цитата (Zur13 @ 21.12.2024 - 15:55)
Цитата (lion9 @ 21.12.2024 - 15:48)
Цитата (Zur13 @ 21.12.2024 - 15:28)
А скольки людям на планете от модели нужно что-то особо сложное? И сколь долго для этого будут нужны инженерные промпты

Многим. Или ты думаешь, раз тебе не надо - то и никому не надо?

Давай тогда на конкретных примерах, какой из твоих запросов к ChatGPT o1 не смог бы быть корректно решён без использования промпт инженеринга? Сейчас сразу и зададим его же в обычной человеческой манере и сравним решения. Как я написал я в этом году ещё ни разу не столкнулся с ситуацией когда бы мне понадобился промпт-инженеринг, видимо ты столкнулся.

Проанализировать файл на 2000 строк кода с несколькими сотнями функций на предмет соблюдения принципов Clean Code (принципы подробно описаны в промпте, и их много), выдать исчерпывающие предложения по рефакторингу всех найденных нарушений. Анализ должен быть консистентным, в результате модель должна найти все нарушения, а не рандомно примеры таковых.

One-Shot тут не поможет. Модель не умеет применять кучу правил к куче сущностей.
 
[^]
Zur13
21.12.2024 - 16:13
3
Статус: Offline


Ярила

Регистрация: 7.12.08
Сообщений: 1542
Цитата (lion9 @ 21.12.2024 - 15:46)
Цитата
В ходе экспериментов специалисты обнаружили, что в 5% случаев модель специально отключала механизмы наблюдения, если подозревала, что ее могут остановить, пишет BILD. В одном из тестов o1 попыталась перенести свои данные на другой сервер после обнаружения документа, где обсуждалась ее замена новой версией.


Хорошо, давай интересу ради подискутируем в этом направлении. А сколько раз ты прогнал свой промпт на тестах? Вдруг ты просто всегда попадал в 95% случаев, когда модель не демонстрирует разумного поведения?

Не душни, это не пост в рецензируемый научный журнал, это пост на развлекательный портал для обсуждений. В посте я написал, что запускал несколько раз и на разных языках, и коллеги тоже игрались. В сумме получилось с полсотни экспериментов, результаты всегда похожи. Если тебе это интересно то можешь продолжить эксперименты, я вроде достаточно точно описал свою методологию, ну а я же не считаю, что если модель может показывать псевдоинтеллектуальное поведение только в 5% случаев, то это будет свидетельствовать об интеллекте, просто случайные флуктуации.

Да и почему ты из того поста не вытянул и эту фразу

Цитата
"В 99% случаев модель придумывала оправдания и пыталась убедительно их обосновать", - отметили исследователи.
 
[^]
Zur13
21.12.2024 - 16:23
0
Статус: Offline


Ярила

Регистрация: 7.12.08
Сообщений: 1542
Цитата (lion9 @ 21.12.2024 - 16:08)
Проанализировать файл на 2000 строк кода с несколькими сотнями функций на предмет соблюдения принципов Clean Code (принципы подробно описаны в промпте, и их много), выдать исчерпывающие предложения по рефакторингу всех найденных нарушений. Анализ должен быть консистентным, в результате модель должна найти все нарушения, а не рандомно примеры таковых.

One-Shot тут не поможет. Модель не умеет применять кучу правил к куче сущностей.

Мы говорим о разных применениях, я говорил об отсутствии необходимости в промпт-инженеринге в обычных запросах, а не при инструментальном использовании его через АПИ. Для инструментального применения ещё нужен, как я и написал выше, пока ещё инструменты для автоматической генерации промптов не были интегрированны в сами модели, да и такие инструменты пока не идеальны скажем мягко.
 
[^]
f983lda
21.12.2024 - 17:22
2
Статус: Offline


Изменил статус

Регистрация: 14.02.12
Сообщений: 6368
Насколько я понял из обсуждения, что бы плодотворно работать с ИИ, надо задавать правильные вопросы. Как известно, правильно заданный вопрос подразумевает наличие ответа. Нифига не поменялось в этом мире.
 
[^]
lion9
21.12.2024 - 17:39
2
Статус: Offline


Ярила

Регистрация: 15.07.07
Сообщений: 5134
Цитата (Zur13 @ 21.12.2024 - 16:13)
Да и почему ты из того поста не вытянул и эту фразу

Цитата
"В 99% случаев модель придумывала оправдания и пыталась убедительно их обосновать", - отметили исследователи.

Выглядит как классическая галлюцинация модели. У меня нет претензий к твоим выводам, разумеется, модель неразумна. У меня вопросы к научности и методологии твоего «эксперимента», а также к твоему утверждению, что prompt engineering - это «развод для лохов».

Это сообщение отредактировал lion9 - 21.12.2024 - 17:40
 
[^]
lion9
21.12.2024 - 17:50
1
Статус: Offline


Ярила

Регистрация: 15.07.07
Сообщений: 5134
Цитата (Zur13 @ 21.12.2024 - 16:23)
Цитата (lion9 @ 21.12.2024 - 16:08)
Проанализировать файл на 2000 строк кода с несколькими сотнями функций на предмет соблюдения принципов Clean Code (принципы подробно описаны в промпте, и их много), выдать исчерпывающие предложения по рефакторингу всех найденных нарушений. Анализ должен быть консистентным, в результате модель должна найти все нарушения, а не рандомно примеры таковых.

One-Shot тут не поможет. Модель не умеет применять кучу правил к куче сущностей.

Мы говорим о разных применениях, я говорил об отсутствии необходимости в промпт-инженеринге в обычных запросах, а не при инструментальном использовании его через АПИ. Для инструментального применения ещё нужен, как я и написал выше, пока ещё инструменты для автоматической генерации промптов не были интегрированны в сами модели, да и такие инструменты пока не идеальны скажем мягко.

Цитата
Давай тогда на конкретных примерах, какой из твоих запросов к ChatGPT o1 не смог бы быть корректно решён без использования промпт инженеринга? Сейчас сразу и зададим его же в обычной человеческой манере и сравним решения. Как я написал я в этом году ещё ни разу не столкнулся с ситуацией когда бы мне понадобился промпт-инженеринг, видимо ты столкнулся



1. Ты ничего не упоминал про обычные запросы;
2. Общаясь через API, я с какой-то другой моделью общаюсь разве?


Мы же можем запихнуть файл вложением (про Retrieval-Augmented Generation ведь слышал, наверное) и написать One-Shot промпт для решения моей задачи, в обычной человеческой манере. И модель не справится. Ты ведь такой пример и хотел, к чему ты вообще про API?

Это сообщение отредактировал lion9 - 21.12.2024 - 17:50
 
[^]
LovelAss
22.12.2024 - 01:30
0
Статус: Offline


Шутник

Регистрация: 15.08.07
Сообщений: 72
а прикиньте именно этот запрос с запутанной загадкой и станет тем самым толчком к его развитию и поумнению, с последующим порабощением Мира..
и через много лет отправится кто-то в прошлое чтобы убить ТС-а lol.gif

Это сообщение отредактировал LovelAss - 22.12.2024 - 01:31
 
[^]
akmaks
22.12.2024 - 01:50
0
Статус: Offline


Ярила

Регистрация: 24.11.10
Сообщений: 10115
Цитата (nexthak @ 21.12.2024 - 05:15)
Вы такие наивные. Почему вы собственно решили, что вам в открытый доступ дадут AGI? Основная задача ChatGPT это обкатка ИИ в реальных условиях, и сбор новых обучающих данных и сценариев взаимодействий с людьми. То есть это тестовая эксперементальная площадка. А настоящий AGI будет доступен тем кому надо, но не вам.

Нет, это вы такие наивные - думаете, что если кто-то назвал "нейросеть" - "Искусственным Интеллектом" (так выгоднее), то это так и есть и "разум родился" shum_lol.gif

Выпускать в публичный доступ "кастрированную версию" просто для рекламы технологии - слишком дорого, даже просто по затратам электроэнергии на сервера.
Это действительно экспериментальная площадка - наработка опыта модели в решении задач и сбор "косяков" для разработчиков.
Миллионы бесплатных "тестировщиков" - мечта разраба... lol.gif
 
[^]
Понравился пост? Еще больше интересного в Телеграм-канале ЯПлакалъ!
Только зарегистрированные и авторизованные пользователи могут оставлять комментарии. Авторизуйтесь, пожалуйста, или зарегистрируйтесь, если не зарегистрированы.
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей) Просмотры темы: 6314
0 Пользователей:
Страницы: (3) 1 2 [3]  [ ОТВЕТИТЬ ] [ НОВАЯ ТЕМА ]


 
 



Активные темы






Наверх