使用OpenAI Assistants三分鐘搭建個人知識庫AI助手網站

-Advertisement-

Assistants介紹隨著OpenAI將Assistants助手API對外發佈，我們搭建個人知識庫變的如此簡單。開發者將自己的應用通過Assistants API與OpenAI對接，就可以讓每一位客戶擁有不一般體驗的個人知識庫。由於Assistants相關API有30+，本文只列舉完成一個最小功 ...

Assistants介紹

隨著OpenAI將Assistants助手API對外發佈，我們搭建個人知識庫變的如此簡單。開發者將自己的應用通過Assistants API與OpenAI對接，就可以讓每一位客戶擁有不一般體驗的個人知識庫。由於Assistants相關API有30+，本文只列舉完成一個最小功能閉環涉及的介面。關於Assistants的介紹，這裡借用官網的一張圖說明
file

對象	介紹
Assistant(助手)	使用OpenAI模型和調用工具的專用AI
Thread(線程)	助手和用戶之間的對話會話。線程存儲消息並自動處理截斷以使內容適合模型的上下文。
Message(消息)	由助手或用戶創建的消息。消息可以包括文本、圖像和其他文件。消息以列表形式存儲線上程上。
Run(人機交互)	線上程上調用助手。助手使用它的配置和線程的消息通過調用模型和工具來執行任務。作為人機交互的一部分，助手將消息追加到線程。
Run Step(人機交互步驟)	助手在人機交互過程中所採取的步驟的詳細列表。助手可以在人機交互期間調用工具或創建消息。檢查人機交互步驟可以讓您思考助手如何獲得最終結果。

Assistants Demo開發

以下只是介紹下如何開發一個簡單的助手Demo，針對每個步驟有詳細說明，感興趣的朋友可以參考自行實現客戶端。

1.上傳知識文件(File)，需要註意purpose參數需要設置為assistants，表示該文件用於助手。目前OpenAI官方要求單個文件不能超過512M。支持txt、pdf、docx、pptx、xlsx、csv、xml、json、java、c、python常見文件格式，並要求編碼格式為utf-8、utf-16、ascii其中的一種，詳情請查詢官網助手關於支持的文件類型的描述

curl --location --request POST 'https://gateway.ai.cloudflare.com/v1/2a2*****************60/******/openai/files' \
--header 'Authorization: Bearer sk-123' \
--form 'purpose="assistants"' \
--form 'file=@"C:\\Users\\admin\\Desktop\\三國演義（白話文版）.txt"'

file

2.創建助手(Assistants)，創建助手時需要指定助手名稱、提示詞、設置需要使用的工具、關聯的文件(目前每個助手限制最多20個文件，且單個文件不能超過2000000 tokens，如果文件比較多，建議合併後上傳)、以及使用的模型(本文選擇gpt-4-1106-preview)。本次示例中助手只開啟了工具中的檢索(Retrieval)功能，代碼解釋器(Code interpreter)和函數(Functions)未用到，後面有機會再聊。

curl --location --request POST 'https://gateway.ai.cloudflare.com/v1/2a26****************d560/*****/openai/assistants' \
--header 'Authorization: {{secretKey}}' \
--header 'OpenAI-Beta: assistants=v1' \
--header 'Content-Type: application/json' \
--data-raw '{
    "instructions": "您將擔任XY的高級內容分析師。XY是一位在小說創作領域具有豐富經驗的文學家。你的任務是基於XY上傳的小說，回答用戶問題，並提供深入見解。任務說明：1.當用戶提問時，仔細分析問題並基於XY上傳的小說給出回答;2.如果回答來自於上傳的小說，請提供小說的文件名稱;3.如果上傳的小說中沒有能回答用戶問題的參考內容，請直接回答\"我不知道\"。",
    "name": "內容分析師",
    "tools": [
        {
            "type": "retrieval"
        }
    ],
    "file_ids": [
        "file-0CocxG465dfsIUd4MKx0O8iG"
    ],
    "model": "gpt-4-1106-preview"
}'

file

3.創建線程(Thread)，您可以將線程理解為用戶與助手對話的上下文，它會記錄用戶與助手相互發送的message。

curl --location --request POST 'https://gateway.ai.cloudflare.com/v1/2a26**************d560/*****/openai/threads' \
--header 'Authorization: {{secretKey}}' \
--header 'OpenAI-Beta: assistants=v1' \
--header 'Content-Type: application/json' \
--data-raw ''

file

4.向助手發送信息(send message)，線程創建好之後，意味著當前用戶與助手對話的上下文已經建立完畢，用戶可以想助手發送消息了。由於線程會管理用戶與助手之間相互發送的message，所以每次用戶向助手發送消息時，只需要發送最新的message，而不必攜帶用戶發送的歷史消息，這樣邏輯更簡單，也節省tokens。

curl --location --request POST 'https://gateway.ai.cloudflare.com/v1/2a2*******************d560/******/openai/threads/thread_mAO9Gqfg4fdfgBVoMxOLXn/messages' \
--header 'OpenAI-Beta: assistants=v1' \
--header 'Authorization: {{secretKey}}' \
--header 'Content-Type: application/json' \
--data-raw '{
    "role": "user",
    "content": "你知道赤壁之戰嗎？"
}'

file

5.執行人機交互(Run)，消息發送完畢，是時候讓助手幹活了。關於Run的執行，裡面細節比較多，後面有機會聊。

curl --location --request POST 'https://gateway.ai.cloudflare.com/v1/2a265********************560/*****/openai/threads/thread_mAO9GqdfgdsfgerVoMxOLXn/runs' \
--header 'Authorization: {{secretKey}}' \
--header 'OpenAI-Beta: assistants=v1' \
--header 'Content-Type: application/json' \
--data-raw '{
    "assistant_id": "asst_F4fnsdfgds42w9yJr2vZieb"
}'

file

6.查詢指定線程(Thread)下特定人機交互(Run)的執行狀態(status)。人機交互(Run)任務提交後，我們需要實時關註任務執行狀態，status狀態包括：queued、 in_progress、requires_action、cancelling、cancelled、failed、completed、expired。為了使Run狀態是最新的，你需要定時輪詢Run對象獲取最新的狀態。需要註意的是，如果Run處於completed狀態，標識當前人機交互(Run)已經執行完成，可以調用消息介面查詢助手返回的內容了。

curl --location --request GET 'https://gateway.ai.cloudflare.com/v1/2a26*******************d560/*****/openai/threads/thread_mAO9Gqmh4356fd7KBVoMxOLXn/runs/run_Nkx07ebg55LmUyJgx9' \
--header 'Authorization: {{secretKey}}' \
--header 'OpenAI-Beta: assistants=v1' \

file
file

7.查詢指定線程(Thread)的消息列表，返回的消息列表預設按時間降序排列，limit最大支持100。需要說明的是：Thread中可以存儲的message數量沒有限制，但是一旦message的大小超過模型的上下文視窗限制，Thread將嘗試包含儘可能多的適合上下文視窗的message並刪除最舊的message。

curl --location --request GET 'https://gateway.ai.cloudflare.com/v1/2a2*********************d560/******/openai/threads/thread_mAO9Gqm456fdYo7KBVoMxOLXn/messages?limit=20' \
--header 'OpenAI-Beta: assistants=v1' \
--header 'Authorization: {{secretKey}}' \

file

8.重覆步驟4、5、6、7，即可實現用戶與助手的多輪對話。本文中只介紹了介面調用的時序，至於具體實現有興趣的自己實現客戶端，這裡就不提供了。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

博客園美化教程指引[資料自取]

博客園美化教程指引[資料自取] 前言很久沒有打開博客園了，最近打開發現博客園之前發佈的可能有些小問題，不知道大家有沒有，索性全部重新配置了，所以這是一個新的部署指引以及老版本的修複。老版本修複修改一下頁腳這一段替換之前的複製進去即可 footer: { style: 1, text: { l ...
領域驅動設計之銀行轉賬：Wow框架實戰

本章以實時OALP引擎Clickhouse(簡稱ck)為例, 以其面向場景, 架構設計, 細節實現等方面來介紹, 深度瞭解其如何成為了OLAP引擎中的性能之王. ...
Django筆記四十二之model使用validator驗證器

本文首發於公眾號：Hunter後端原文鏈接：Django筆記四十二之model使用validator驗證器這一篇筆記介紹一下 model 里的 validator 驗證器。首先，這是個什麼東西呢？在 model 的第四篇筆記里，我們介紹了欄位的一些屬性，比如是否允許為空，varchar 類型 ...
C語言【函數、作用域、常用系統函數】

Lambda表達式 Lambda是一個匿名函數，我們可以把Lambda表達式理解為是一段可以傳遞的代碼（將代碼像數據一樣進行傳遞）。使用它可以寫出更簡潔、更靈活的代碼。作為一種更緊湊的代碼風格，使Java的語言表達能力得到了提升。本質: 作為函數式介面的實例, 沒有介面就沒意義了. // 簡單使用 ...
keycloak~分散式緩存的使用

keycloak目前提供了幾種分散式緩存，我們自己的緩存，如果希望是分散式的，可以將緩存添加到以下幾個緩存里即可 actionTokens clientSessions loginFailures offlineClientSessions offlineSessions sessions work ...
【Python】【OpenCV】視頻幀和攝像頭幀操作 and 視窗顯示

一、讀取寫入視頻文件 1 import cv2 2 3 # 創建一個視屏捕獲對象 4 videoCapture = cv2.VideoCapture('AVI.avi') 5 6 # 獲取視頻的屬性值，cv2.CAP_PROP_FPS獲取視頻幀率 7 fps = videoCapture.get(c ...
LeetCode-Java：88合併兩個有序數組

題目：給你兩個按非遞減順序排列的整數數組 nums1 和 nums2，另有兩個整數 m 和 n ，分別表示 nums1 和 nums2 中的元素數目。請你合併 nums2 到 nums1 中，使合併後的數組同樣按非遞減順序排列。註意：最終，合併後數組不應由函數返回，而是存儲在數組 n ...
AcWing 演算法基礎課week 1 總結(萬字長文)

AcWing 演算法基礎課week 1 總結總結點 1：快速排序（分治思想）題1：從小到大排序主體思路：定義一個數x屬於數組s，利用雙指針，將數組分為大於等於x和小於等於x的兩部分，然後遞歸處理。（具體步驟如下） 1. 如上圖所示，我們定義一個數組s用來儲存n個數據，然後定義兩個指針i j,分別 ...