Разрешаването на проблеми е една от вродените способности на хората. Още от примитивните ни дни, когато нашите основни предизвикателства в живота не бяха да бъдем изядени от хищен звяр до съвременните времена, за да получим нещо бързо доставено у дома, ние комбинирахме нашата креативност, логически разсъждения и интелигентност, за да излезем с решения за конфликти .
Сега, когато сме свидетели на генезиса на AI съзнателните, сме изправени пред нови предизвикателства по отношение на техните способности за вземане на решения. Докато предишното десетилетие беше изцяло за празнуване на възможностите и потенциала на AI моделите и приложенията, това десетилетие е за отиване на крачка напред – да се постави под съмнение легитимността на решенията, взети от такива модели, и да се изведат мотивите зад тях.
Тъй като обяснимият изкуствен интелект (XAI) придобива все по-голяма известност, това е моментът да обсъдим ключова концепция в разработването на AI модели, които наричаме Подсказване по веригата на мислите. В тази статия подробно ще декодираме и демистифицираме какво означава това и прости термини.
Какво е подсказване на веригата от мисли?
Когато човешкият ум е изправен пред предизвикателство или сложен проблем, той естествено се опитва да го раздели на фрагменти от по-малки последователни стъпки. Воден от логиката, умът установява връзки и симулира причинно-следствени сценарии, за да изготви най-доброто възможно решение за предизвикателството.
Процесът на възпроизвеждане на това в AI модел или система е Подсказване по веригата на мислите.
Както подсказва името, AI моделът генерира серия или верига от логически мисли (или стъпки), за да се подходи към запитване или конфликт. Визуализирайте това като даване на инструкции завой по завой на някой, който пита за маршрут до дестинация.
Това е преобладаващата техника, използвана в моделите за разсъждение на OpenAI. Тъй като са проектирани да мислят, преди да генерират отговор или отговор, те са успели да разбият състезателни изпити, взети от хора.
[Прочетете също: Всичко, което трябва да знаете за LLM]
Ползи от подсказването по веригата на мислите
Всичко, което се ръководи от логика, дава значително предимство. По подобен начин моделите, обучени на подсказване по веригата на мислите, предлагат не само точност и уместност, но и разнообразна гама от предимства, включително:
Засилено решаване на проблеми способности, където тяхното значение е критично в области като здравеопазване и финанси. Учебните програми LLM, които прилагат подсказване по веригата на мислите, разбират по-добре изричните и основни предизвикателства и генерират отговори след разглеждане на различни вероятности и най-лоши сценарии.
Смекчаващи предположения и резултати, генерирани от предположения, тъй като моделите прилагат логическо и последователно мислене и обработка, за да направят заключение, вместо да правят прибързани заключения.
Повишена гъвкавост тъй като моделите не трябва да бъдат обучавани стриктно върху нов случай на употреба, тъй като те се основават на логиката, а не на целта.
Оптимизиран съгласуваност в задачи, включващи многократни/многочастни отговори.
Анатомията на функционирането на техниката за подсказване на веригата от мисли
Ако сте запознати с монолитната софтуерна архитектура, ще знаете, че цялото софтуерно приложение е разработено като единна съгласувана единица. Опростяването на такъв сложен данък пристигна с метода на архитектурата на микроуслугите, който включва разбиването на софтуера на независими услуги. Това доведе до по-бързо развитие на продуктите и безпроблемна функционалност.
CoT подсказване в AI е подобно, където LLMs се ръководят през серия от последователни процеси на разсъждение, за да генерират отговор. Това става чрез:
- Изрични инструкции, при които моделите са директно инструктирани да подходят към проблем последователно чрез ясни команди.
- Неявните инструкции са по-фини и нюансирани в своя подход. При това моделът се прекарва през логиката на подобна задача и използва своите възможности за извод и разбиране, за да възпроизведе логиката за представените проблеми.
- Демонстративни примери, при които моделът би изложил разсъждения стъпка по стъпка и генерирал постепенни прозрения за решаване на проблем.
3 случая от реалния свят, при които се използва подканяне на CoT
Модели на финансови решения
| Мултимодален CoT в ботове
| Здравна служба
|
---|---|---|
В този силно променлив сектор подканите на CoT могат да се използват за разбиране на потенциалната финансова траектория на дадена компания, извършване на оценки на риска на търсещите кредит и други | Чатботовете, които са разработени и внедрени за предприятия, изискват нишови функционалности. Те трябва да покажат способности за разбиране на различни формати на входове. Подканването на CoT работи най-добре в такива случаи, когато ботовете трябва да комбинират текст и изображения, за да генерират отговори за заявки. | От диагностициране на пациенти въз основа на здравни данни до генериране на персонализирани планове за лечение за пациенти, CoT подсказването може да допълни целите на здравеопазването за клиники и болници. |
Пример
Клиентско запитване: Забелязах транзакция в моя акаунт, която не разпознавам, дебитната ми карта е изгубена и искам да настроя известия за транзакциите в моя акаунт. Можете ли да ми помогнете с тези проблеми?
Стъпка 1: Идентифицирайте и категоризирайте проблемите
- Неразпозната транзакция.
- Загубена дебитна карта.
- Настройване на сигнали за транзакции.
Стъпка 2: Адресирайте неразпознатата транзакция
Попитайте за подробности: Бихте ли посочили датата и сумата на транзакцията?
- Клон 1: Ако са предоставени подробности:
- Прегледайте транзакцията. Ако е измама, попитайте дали клиентът иска да я оспори.
- Клон 2: Ако няма подробности:
- Предложете да предоставите списък на последните транзакции.
Стъпка 3: Адресирайте изгубената дебитна карта
Замразете картата: Препоръчва се незабавно замразяване.
- Клон 1: Ако клиентът е съгласен:
- Замразете картата и попитайте дали искат замяна. Потвърдете адреса за доставка.
- Клон 2: Ако клиентът откаже:
- Посъветвайте да наблюдавате сметката за неоторизирани транзакции.
Стъпка 4: Настройте сигнали за транзакции
Изберете метод за предупреждение: SMS, имейл или и двете?
- Клон 1: Ако клиентът избере:
- Задайте сигнали за транзакции над определена сума. Поискайте сумата.
- Клон 2: Ако не сте сигурни:
- Предложете сума по подразбиране (напр. $50) и потвърдете.
Стъпка 5: Предоставете резюме и следващи стъпки
- Проучване на неразпознатата транзакция.
- Замразяване на дебитната карта и евентуално издаване на заместваща.
- Настройване на сигнали за транзакции, както е поискано.
Обосновка:
Този процес ефективно адресира множество клиентски заявки чрез ясни стъпки и разклонения за вземане на решения, осигурявайки цялостни решения.
Ограничения на подсказването на CoT
Мисловната верига наистина е ефективна, но също така зависи от случая на употреба, към който се прилага, и няколко други фактора. Има специфични предизвикателства, свързани с CoT подсказване в AI които пречат на заинтересованите страни да използват напълно неговия потенциал. Нека да разгледаме често срещаните тесни места:
Прекалено усложнявайте простите задачи
Въпреки че подканването на CoT работи най-добре за сложни задачи, то може да усложни прости задачи и да генерира грешни отговори. За задачи, които не изискват разсъждения, моделите с директен отговор работят най-добре.
Повишено изчислително натоварване
Обработката на подкани за CoT изисква значително изчислително натоварване и ако техниката се разгърне на по-малки модели, които са изградени с ограничени възможности за обработка, тя може да ги претовари. Последиците от такова внедряване може да включват по-бавно време за реакция, ниска ефективност, несъгласуваност и др.
Качество на бързото инженерство с изкуствен интелект
CoT подсказване в AI работи при предположението (или принципа), че конкретна подкана е добре артикулирана, структурирана и ясна. Ако в подкана липсват тези фактори, подканването на CoT губи способността да схване изискването, което води до генериране на неподходящи последователни стъпки и в крайна сметка отговори.
Намалени възможности в мащаб
Заинтересованите страни могат да изпитат затруднения в своите модели, ако трябва да се възползват от подсказването на веригата от мисли за огромни обеми набори от данни или сложност на проблемите. За задачи, включващи по-големи стъпки на разсъждение, техниката може да забави времето за реакция, което я прави неподходяща за приложения или случаи на употреба, които изискват генериране на отговор в реално време.
Подсказването на CoT е феноменална техника за оптимизиране на производителността на Големи езикови модели. Ако такива недостатъци могат да бъдат адресирани и разрешени чрез техники за оптимизация или заобиколни решения, те могат да дадат невероятни резултати. С напредването на технологиите ще бъде интересно да се види как подсказването на веригата от мисли се развива и става по-просто, но и по-нишово.