Проверяем "умность" ChatGPT о1


Страницы: (3) 1 2 [3]	[ ОТВЕТИТЬ ] [ НОВАЯ ТЕМА ]

Zur13

21.12.2024 - 15:28

-1

Статус: Offline

Ярила

Регистрация: 7.12.08
Сообщений: 1542

Цитата (lion9 @ 21.12.2024 - 14:59)

Цитата (Zur13 @ 21.12.2024 - 14:26)

И да в 2023 году я писал промпты, с выходом 4о забил и писал обычные запросы человеческой речью, и проблем пока не возникало, так что я на практике вижу что специально составленные промпты уже не нужны.

То, что 4o или o1 стали лучше работать с One-Shot запросами, не говорит о том, что остальные типы запросов (Chain-of-Thought, Tree-of-Thought, Few-Shot, Iterative Prompting, Prompt Template) перестали быть нужными. Тебе просто не требуется от модели что-то особо сложное.

А скольки людям на планете от модели нужно что-то особо сложное? И сколь долго для этого будут нужны инженерные промпты, уже вон полно нейросеток, которые сами инженерят промпты, взять тот же генератор промптов Anthropic или Prompt Perfect или Hugging Face. В следующей итерации достаточно будет их интегрировать в интерфейс ChatGPT и на этом весь промпт-инженеринг окончательно закончится.

[^]

grably

21.12.2024 - 15:31

Статус: Offline

Анус Ректальный

Регистрация: 21.03.13
Сообщений: 4188

Цитата (dekokt @ 21.12.2024 - 03:51)

Цитата (mnr1 @ 21.12.2024 - 04:29)

вот выдавил из нее описание слепой кишки у лягушки. Таких знаний больше нет ни у кого :)

Есть. Ибо как они там появились?

Лягушек в куче стран традиционно в школах для изучения резали. Не одно столетие причём.
Кишки они не видали, угу

[^]

Zur13

21.12.2024 - 15:40

Статус: Offline

Ярила

Регистрация: 7.12.08
Сообщений: 1542

Цитата (grably @ 21.12.2024 - 15:31)

Цитата (dekokt @ 21.12.2024 - 03:51)

Цитата (mnr1 @ 21.12.2024 - 04:29)

вот выдавил из нее описание слепой кишки у лягушки. Таких знаний больше нет ни у кого :)

Есть. Ибо как они там появились?

Ну всё, пришёл эксперт и всё прояснил, надеюсь спор про лягушачьи кишки, на этом закрыт, давайте лучше вернёмся к теме и будем спорить про то как скайнет будет распоряжаться человечьими кишками

[^]

lion9

21.12.2024 - 15:42

Статус: Offline

Ярила

Регистрация: 15.07.07
Сообщений: 5134

Цитата (Zur13 @ 21.12.2024 - 15:19)

Но без дополнительных уточнений, при попытке нейросети интегрировать эти результаты в цепочку логических суждений, по какой-то причине цепочка суждений разрушается или ведёт к галлюцинациям.

Эта причина - недостаточно конкретный промпт. О чем я и писал уже неоднократно.

Это сообщение отредактировал lion9 - 21.12.2024 - 15:43

[^]

gor3

21.12.2024 - 15:44

Статус: Offline

Ярила

Регистрация: 15.02.16
Сообщений: 3448

claude.ai

Цитата

Давайте разберем эту интересную логическую задачу пошагово. Проанализируем условия:

1. У нас есть:
- Способность летать между Землей и Марсом
- Можно брать только один предмет за раз
- Дождевик для защиты от постоянного дождя
- Кубик сахара
- Робот, который съедает всю еду и напитки
- Чашка несладкого чая
- Цель: выпить сладкий чай на Марсе перед камерами робота

Вот несколько возможных решений:

Решение 1:
1. Взять чашку с чаем и улететь на Марс
2. Оставить чай на Марсе
3. Вернуться на Землю
4. Взять кубик сахара и лететь на Марс
5. Положить сахар в чай на Марсе
6. Сразу выпить чай перед роботом-проглотом

Решение 2:
1. Сначала отнести робота на Марс
2. Вернуться на Землю
3. Положить сахар в чай на Земле
4. Быстро взять чашку со сладким чаем и лететь на Марс
5. Выпить чай перед камерами робота

Решение 3:
1. Надеть дождевик (он уже на нас)
2. Перенести робота на Марс
3. Вернуться на Землю
4. Взять чай
5. Долететь до Марса
6. Вернуться за сахаром
7. Долететь до Марса и быстро подсластить чай
8. Выпить перед роботом

Из всех решений, первое кажется самым эффективным и надежным, так как:
- Требует меньше перелетов
- Минимизирует риск того, что робот успеет съесть или выпить что-то раньше нас
- Позволяет контролировать процесс подслащивания чая непосредственно перед употреблением

Хотели бы вы, чтобы я объяснил какое-то из решений подробнее?

[^]

goblis36

21.12.2024 - 15:45

Статус: Offline

Ярила

Регистрация: 19.04.21
Сообщений: 1165

Цитата

Zur13

Нахуй ты его обучаешь ?

[^]

gor3

21.12.2024 - 15:46

Статус: Offline

Ярила

Регистрация: 15.02.16
Сообщений: 3448

Цитата (sqlap78 @ 21.12.2024 - 08:52)

Чат гпт великолепен даже в бесплатной версии. Постоянно обращаюсь к нему чтобы написать скрипты на python автоматизирующие мне работу на компе от спец часов до оконного менеждера для определнной программы. Я в восторге от чат гпт. Очень вас прошу внедряйте его в свою жизнь, за этими технологиями будущее, не будьте мамонтами

попробуй claude, он на голову лучше GPT код пишет.

[^]

lion9

21.12.2024 - 15:46

Статус: Offline

Ярила

Регистрация: 15.07.07
Сообщений: 5134

Цитата

В ходе экспериментов специалисты обнаружили, что в 5% случаев модель специально отключала механизмы наблюдения, если подозревала, что ее могут остановить, пишет BILD. В одном из тестов o1 попыталась перенести свои данные на другой сервер после обнаружения документа, где обсуждалась ее замена новой версией.

Хорошо, давай интересу ради подискутируем в этом направлении. А сколько раз ты прогнал свой промпт на тестах? Вдруг ты просто всегда попадал в 95% случаев, когда модель не демонстрирует разумного поведения?

Это сообщение отредактировал lion9 - 21.12.2024 - 15:54

[^]

lion9

21.12.2024 - 15:48

Статус: Offline

Ярила

Регистрация: 15.07.07
Сообщений: 5134

Цитата (Zur13 @ 21.12.2024 - 15:28)

Цитата (lion9 @ 21.12.2024 - 14:59)

Цитата (Zur13 @ 21.12.2024 - 14:26)

Многим. Или ты думаешь, раз тебе не надо - то и никому не надо? Кроме того, для простых задач, но масштабно, например, предоставление AI-тула всем работникам компании, тебе не нужна дорогая и крутая модель. Проще написать хороший промпт, выдающий консистентный результаты, и юзать более дешевую.

Это сообщение отредактировал lion9 - 21.12.2024 - 15:55

[^]

Zur13

21.12.2024 - 15:48

Статус: Offline

Ярила

Регистрация: 7.12.08
Сообщений: 1542

Цитата (lion9 @ 21.12.2024 - 15:42)

Цитата (Zur13 @ 21.12.2024 - 15:19)

Эта причина - недостаточно конкретный промпт. О чем я и писал неоднократно в данной теме.

Если нейросеть не способна ответить на "недостаточно конкретный промпт", то это признак отсутствия ителлекта. Способность отвечать только на шаблонные "конкретные" промпты признак рассудочного уровня мыслительной деятельности. Адаптивность один из признаков интеллектуального уровня. Для того чтобы определить интеллектулальность нейросети и был создан такой запрос.

Заметь, человек без труда находит несколько решений такой задачки, включая нестандартные, как ты сам писал в другом своём комментарии, вот это комбинирование творческого и логического подходов при решении задачи - признак интеллектуального уровня мыслительной деятельности.

[^]

gor3

21.12.2024 - 15:48

Статус: Offline

Ярила

Регистрация: 15.02.16
Сообщений: 3448

Цитата (Zur13 @ 21.12.2024 - 15:28)

А скольки людям на планете от модели нужно что-то особо сложное?

Да многие в работе используют. для таких целей можно и 200 баксов за GPT PRO потратить

[^]

stornogad	21.12.2024 - 15:52 [ показать ] 1
Статус: Offline Балагур Регистрация: 28.06.14 Сообщений: 967	Ну я вот тебя тоже не понял, как и ChatGPT . Научись сначала свои мысли формулировать так, чтобы тебя другие люди могли понять хотя бы.
	[^]

Zur13

21.12.2024 - 15:55

Статус: Offline

Ярила

Регистрация: 7.12.08
Сообщений: 1542

Цитата (lion9 @ 21.12.2024 - 15:48)

Цитата (Zur13 @ 21.12.2024 - 15:28)

А скольки людям на планете от модели нужно что-то особо сложное? И сколь долго для этого будут нужны инженерные промпты

Многим. Или ты думаешь, раз тебе не надо - то и никому не надо?

Давай тогда на конкретных примерах, какой из твоих запросов к ChatGPT o1 не смог бы быть корректно решён без использования промпт инженеринга? Сейчас сразу и зададим его же в обычной человеческой манере и сравним решения. Как я написал я в этом году ещё ни разу не столкнулся с ситуацией когда бы мне понадобился промпт-инженеринг, видимо ты столкнулся.

[^]

Zur13

21.12.2024 - 15:58

Статус: Offline

Ярила

Регистрация: 7.12.08
Сообщений: 1542

Цитата (gor3 @ 21.12.2024 - 15:48)

Цитата (Zur13 @ 21.12.2024 - 15:28)

А скольки людям на планете от модели нужно что-то особо сложное?

Да многие в работе используют. для таких целей можно и 200 баксов за GPT PRO потратить

Эм, мы говорим конкретно о промпт-инженеринге, причём тут ПРО режим ChatGPT?

[^]

Zur13

21.12.2024 - 16:01

-1

Статус: Offline

Ярила

Регистрация: 7.12.08
Сообщений: 1542

Цитата (stornogad @ 21.12.2024 - 15:52)

Ну я вот тебя тоже не понял, как и ChatGPT

. Научись сначала свои мысли формулировать так, чтобы тебя другие люди могли понять хотя бы.

Странно, мои коллеги поняли и смогли решить задачку, ребёнок 10 лет тоже понял и смог, а ты не понял, но ты не переживай это всё неправильно сформуллированные мысли виноваты

[^]

lion9

21.12.2024 - 16:08

Статус: Offline

Ярила

Регистрация: 15.07.07
Сообщений: 5134

Цитата (Zur13 @ 21.12.2024 - 15:55)

Цитата (lion9 @ 21.12.2024 - 15:48)

Цитата (Zur13 @ 21.12.2024 - 15:28)

Многим. Или ты думаешь, раз тебе не надо - то и никому не надо?

Проанализировать файл на 2000 строк кода с несколькими сотнями функций на предмет соблюдения принципов Clean Code (принципы подробно описаны в промпте, и их много), выдать исчерпывающие предложения по рефакторингу всех найденных нарушений. Анализ должен быть консистентным, в результате модель должна найти все нарушения, а не рандомно примеры таковых.

One-Shot тут не поможет. Модель не умеет применять кучу правил к куче сущностей.

[^]

Zur13

21.12.2024 - 16:13

Статус: Offline

Ярила

Регистрация: 7.12.08
Сообщений: 1542

Цитата (lion9 @ 21.12.2024 - 15:46)

Цитата

Не душни, это не пост в рецензируемый научный журнал, это пост на развлекательный портал для обсуждений. В посте я написал, что запускал несколько раз и на разных языках, и коллеги тоже игрались. В сумме получилось с полсотни экспериментов, результаты всегда похожи. Если тебе это интересно то можешь продолжить эксперименты, я вроде достаточно точно описал свою методологию, ну а я же не считаю, что если модель может показывать псевдоинтеллектуальное поведение только в 5% случаев, то это будет свидетельствовать об интеллекте, просто случайные флуктуации.

Да и почему ты из того поста не вытянул и эту фразу

Цитата

"В 99% случаев модель придумывала оправдания и пыталась убедительно их обосновать", - отметили исследователи.

[^]

Zur13

21.12.2024 - 16:23

Статус: Offline

Ярила

Регистрация: 7.12.08
Сообщений: 1542

Цитата (lion9 @ 21.12.2024 - 16:08)

Мы говорим о разных применениях, я говорил об отсутствии необходимости в промпт-инженеринге в обычных запросах, а не при инструментальном использовании его через АПИ. Для инструментального применения ещё нужен, как я и написал выше, пока ещё инструменты для автоматической генерации промптов не были интегрированны в сами модели, да и такие инструменты пока не идеальны скажем мягко.

[^]

f983lda	21.12.2024 - 17:22 [ показать ] 2
Статус: Offline Изменил статус Регистрация: 14.02.12 Сообщений: 6368	Насколько я понял из обсуждения, что бы плодотворно работать с ИИ, надо задавать правильные вопросы. Как известно, правильно заданный вопрос подразумевает наличие ответа. Нифига не поменялось в этом мире.
	[^]

lion9

21.12.2024 - 17:39

Статус: Offline

Ярила

Регистрация: 15.07.07
Сообщений: 5134

Цитата (Zur13 @ 21.12.2024 - 16:13)

Да и почему ты из того поста не вытянул и эту фразу

Цитата

"В 99% случаев модель придумывала оправдания и пыталась убедительно их обосновать", - отметили исследователи.

Выглядит как классическая галлюцинация модели. У меня нет претензий к твоим выводам, разумеется, модель неразумна. У меня вопросы к научности и методологии твоего «эксперимента», а также к твоему утверждению, что prompt engineering - это «развод для лохов».

Это сообщение отредактировал lion9 - 21.12.2024 - 17:40

[^]

lion9

21.12.2024 - 17:50

Статус: Offline

Ярила

Регистрация: 15.07.07
Сообщений: 5134

Цитата (Zur13 @ 21.12.2024 - 16:23)

Цитата (lion9 @ 21.12.2024 - 16:08)

Цитата

1. Ты ничего не упоминал про обычные запросы;
2. Общаясь через API, я с какой-то другой моделью общаюсь разве?

Мы же можем запихнуть файл вложением (про Retrieval-Augmented Generation ведь слышал, наверное) и написать One-Shot промпт для решения моей задачи, в обычной человеческой манере. И модель не справится. Ты ведь такой пример и хотел, к чему ты вообще про API?

Это сообщение отредактировал lion9 - 21.12.2024 - 17:50

[^]

LovelAss	22.12.2024 - 01:30 [ показать ] 0
Статус: Offline Шутник Регистрация: 15.08.07 Сообщений: 72	а прикиньте именно этот запрос с запутанной загадкой и станет тем самым толчком к его развитию и поумнению, с последующим порабощением Мира.. и через много лет отправится кто-то в прошлое чтобы убить ТС-а Это сообщение отредактировал LovelAss - 22.12.2024 - 01:31
	[^]

akmaks

22.12.2024 - 01:50

Статус: Offline

Ярила

Регистрация: 24.11.10
Сообщений: 10115

Цитата (nexthak @ 21.12.2024 - 05:15)

Вы такие наивные. Почему вы собственно решили, что вам в открытый доступ дадут AGI? Основная задача ChatGPT это обкатка ИИ в реальных условиях, и сбор новых обучающих данных и сценариев взаимодействий с людьми. То есть это тестовая эксперементальная площадка. А настоящий AGI будет доступен тем кому надо, но не вам.

Нет, это вы такие наивные - думаете, что если кто-то назвал "нейросеть" - "Искусственным Интеллектом" (так выгоднее), то это так и есть и "разум родился"

Выпускать в публичный доступ "кастрированную версию" просто для рекламы технологии - слишком дорого, даже просто по затратам электроэнергии на сервера.
Это действительно экспериментальная площадка - наработка опыта модели в решении задач и сбор "косяков" для разработчиков.
Миллионы бесплатных "тестировщиков" - мечта разраба...

[^]

Понравился пост? Еще больше интересного в Телеграм-канале ЯПлакалъ!

Только зарегистрированные и авторизованные пользователи могут оставлять комментарии. Авторизуйтесь, пожалуйста, или зарегистрируйтесь, если не зарегистрированы.

1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)	Просмотры темы: 6314
0 Пользователей: