Итак, есть пара вещей, которые мы можем сделать, чтобы справиться с этим. Во-первых, с точки зрения нас как личностей, мы можем помнить, что длинные разговоры по сути все сбрасываются в это контекстное окно. Так что если мы говорим с ним об одном, а затем хотим переключиться на что-то другое, мы можем просто решить переключиться на новый чат, что очень легко в этих интерфейсах. Еще одна вещь, которую мы можем сделать, это быть внимательными к таким вещам, как мегаподсказки.
Итак, это действительно сжатые блоки инструкций, которые вы довольно часто видите, как люди помещают в начало этих взаимодействий. Опять же Данные телеграммы Бельгии это может означать, что вещи как бы смещаются в эту среднюю часть, где вещи часто теряются. Так что мы как бы пытаемся убедиться, что мы фокусируем вещи как можно больше. Конечно, если мы также сбрасываем туда большие блоки информации, мы пытаемся сделать некоторую прополку того, что, как мы знаем, менее важно.
Дополненная генерация поиска (RAG)
Дополненная генерация поиска (RAG)
Другое решение этой проблемы более технологично и более предпринимательски, но это определенно то, о чем мы все должны знать как о растущей отрасли, и это то, что называется RAG. Итак, RAG означает retrieval augmented generation. Способ, которым это меняется, в основном заключается в том, что вместо того, чтобы наш вопрос направлялся прямо в ChatGPT, например, без чего-либо еще, у нас есть отдельная база данных важной информации, которая нам нужна.
Так что это может быть вся внутренняя документация нашей компании, которую мы не хотим выносить наружу. Или это может быть просто куча вещей, которые, как мы знаем, важны, но мы не можем скопировать и вставить их все прямо в контекст. Итак, у нас есть эта отдельная база данных, и есть инструменты, называемые векторными базами данных, которые по сути разработаны для очень хорошей работы с большими языковыми моделями, и у них очень похожая логика.