使用OpenAI Assistants三分鐘搭建個人知識庫AI助手網站

来源:https://www.cnblogs.com/xfishup/archive/2023/11/21/17846555.html
-Advertisement-
Play Games

Assistants介紹 隨著OpenAI將Assistants助手API對外發佈,我們搭建個人知識庫變的如此簡單。開發者將自己的應用通過Assistants API與OpenAI對接,就可以讓每一位客戶擁有不一般體驗的個人知識庫。由於Assistants相關API有30+,本文只列舉完成一個最小功 ...


Assistants介紹

隨著OpenAI將Assistants助手API對外發佈,我們搭建個人知識庫變的如此簡單。開發者將自己的應用通過Assistants API與OpenAI對接,就可以讓每一位客戶擁有不一般體驗的個人知識庫。由於Assistants相關API有30+,本文只列舉完成一個最小功能閉環涉及的介面。關於Assistants的介紹,這裡借用官網的一張圖說明
file

對象 介紹
Assistant(助手) 使用OpenAI模型和調用工具的專用AI
Thread(線程) 助手和用戶之間的對話會話。線程存儲消息並自動處理截斷以使內容適合模型的上下文。
Message(消息) 由助手或用戶創建的消息。消息可以包括文本、圖像和其他文件。消息以列表形式存儲線上程上。
Run(人機交互) 線上程上調用助手。助手使用它的配置和線程的消息通過調用模型和工具來執行任務。作為人機交互的一部分,助手將消息追加到線程。
Run Step(人機交互步驟) 助手在人機交互過程中所採取的步驟的詳細列表。助手可以在人機交互期間調用工具或創建消息。檢查人機交互步驟可以讓您思考助手如何獲得最終結果。

Assistants Demo開發

以下只是介紹下如何開發一個簡單的助手Demo,針對每個步驟有詳細說明,感興趣的朋友可以參考自行實現客戶端。

  • 1.上傳知識文件(File),需要註意purpose參數需要設置為assistants,表示該文件用於助手。目前OpenAI官方要求單個文件不能超過512M。支持txt、pdf、docx、pptx、xlsx、csv、xml、json、java、c、python常見文件格式,並要求編碼格式為utf-8、utf-16、ascii其中的一種,詳情請查詢官網助手關於支持的文件類型的描述
curl --location --request POST 'https://gateway.ai.cloudflare.com/v1/2a2*****************60/******/openai/files' \
--header 'Authorization: Bearer sk-123' \
--form 'purpose="assistants"' \
--form 'file=@"C:\\Users\\admin\\Desktop\\三國演義(白話文版).txt"'

file

  • 2.創建助手(Assistants),創建助手時需要指定助手名稱、提示詞、設置需要使用的工具、關聯的文件(目前每個助手限制最多20個文件,且單個文件不能超過2000000 tokens,如果文件比較多,建議合併後上傳)、以及使用的模型(本文選擇gpt-4-1106-preview)。本次示例中助手只開啟了工具中的檢索(Retrieval)功能,代碼解釋器(Code interpreter)和函數(Functions)未用到,後面有機會再聊。
curl --location --request POST 'https://gateway.ai.cloudflare.com/v1/2a26****************d560/*****/openai/assistants' \
--header 'Authorization: {{secretKey}}' \
--header 'OpenAI-Beta: assistants=v1' \
--header 'Content-Type: application/json' \
--data-raw '{
    "instructions": "您將擔任XY的高級內容分析師。XY是一位在小說創作領域具有豐富經驗的文學家。你的任務是基於XY上傳的小說,回答用戶問題,並提供深入見解。任務說明:1.當用戶提問時,仔細分析問題並基於XY上傳的小說給出回答;2.如果回答來自於上傳的小說,請提供小說的文件名稱;3.如果上傳的小說中沒有能回答用戶問題的參考內容,請直接回答\"我不知道\"。",
    "name": "內容分析師",
    "tools": [
        {
            "type": "retrieval"
        }
    ],
    "file_ids": [
        "file-0CocxG465dfsIUd4MKx0O8iG"
    ],
    "model": "gpt-4-1106-preview"
}'

file

  • 3.創建線程(Thread),您可以將線程理解為用戶與助手對話的上下文,它會記錄用戶與助手相互發送的message。
curl --location --request POST 'https://gateway.ai.cloudflare.com/v1/2a26**************d560/*****/openai/threads' \
--header 'Authorization: {{secretKey}}' \
--header 'OpenAI-Beta: assistants=v1' \
--header 'Content-Type: application/json' \
--data-raw ''

file

  • 4.向助手發送信息(send message),線程創建好之後,意味著當前用戶與助手對話的上下文已經建立完畢,用戶可以想助手發送消息了。由於線程會管理用戶與助手之間相互發送的message,所以每次用戶向助手發送消息時,只需要發送最新的message,而不必攜帶用戶發送的歷史消息,這樣邏輯更簡單,也節省tokens。
curl --location --request POST 'https://gateway.ai.cloudflare.com/v1/2a2*******************d560/******/openai/threads/thread_mAO9Gqfg4fdfgBVoMxOLXn/messages' \
--header 'OpenAI-Beta: assistants=v1' \
--header 'Authorization: {{secretKey}}' \
--header 'Content-Type: application/json' \
--data-raw '{
    "role": "user",
    "content": "你知道赤壁之戰嗎?"
}'

file

  • 5.執行人機交互(Run),消息發送完畢,是時候讓助手幹活了。關於Run的執行,裡面細節比較多,後面有機會聊。
curl --location --request POST 'https://gateway.ai.cloudflare.com/v1/2a265********************560/*****/openai/threads/thread_mAO9GqdfgdsfgerVoMxOLXn/runs' \
--header 'Authorization: {{secretKey}}' \
--header 'OpenAI-Beta: assistants=v1' \
--header 'Content-Type: application/json' \
--data-raw '{
    "assistant_id": "asst_F4fnsdfgds42w9yJr2vZieb"
}'

file

  • 6.查詢指定線程(Thread)下特定人機交互(Run)的執行狀態(status)。人機交互(Run)任務提交後,我們需要實時關註任務執行狀態,status狀態包括:queued、 in_progress、requires_action、cancelling、cancelled、failed、completed、expired。為了使Run狀態是最新的,你需要定時輪詢Run對象獲取最新的狀態。需要註意的是,如果Run處於completed狀態,標識當前人機交互(Run)已經執行完成,可以調用消息介面查詢助手返回的內容了。
curl --location --request GET 'https://gateway.ai.cloudflare.com/v1/2a26*******************d560/*****/openai/threads/thread_mAO9Gqmh4356fd7KBVoMxOLXn/runs/run_Nkx07ebg55LmUyJgx9' \
--header 'Authorization: {{secretKey}}' \
--header 'OpenAI-Beta: assistants=v1' \

file
file

  • 7.查詢指定線程(Thread)的消息列表,返回的消息列表預設按時間降序排列,limit最大支持100。需要說明的是:Thread中可以存儲的message數量沒有限制,但是一旦message的大小超過模型的上下文視窗限制,Thread將嘗試包含儘可能多的適合上下文視窗的message並刪除最舊的message。
curl --location --request GET 'https://gateway.ai.cloudflare.com/v1/2a2*********************d560/******/openai/threads/thread_mAO9Gqm456fdYo7KBVoMxOLXn/messages?limit=20' \
--header 'OpenAI-Beta: assistants=v1' \
--header 'Authorization: {{secretKey}}' \

file

  • 8.重覆步驟4、5、6、7,即可實現用戶與助手的多輪對話。本文中只介紹了介面調用的時序,至於具體實現有興趣的自己實現客戶端,這裡就不提供了。

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 博客園美化教程指引[資料自取] 前言 很久沒有打開博客園了,最近打開發現博客園之前發佈的可能有些小問題,不知道大家有沒有,索性全部重新配置了,所以這是一個新的部署指引以及老版本的修複。 老版本修複 修改一下頁腳這一段 替換之前的複製進去即可 footer: { style: 1, text: { l ...
  • 本章以實時OALP引擎Clickhouse(簡稱ck)為例, 以其面向場景, 架構設計, 細節實現等方面來介紹, 深度瞭解其如何成為了OLAP引擎中的性能之王. ...
  • 本文首發於公眾號:Hunter後端 原文鏈接:Django筆記四十二之model使用validator驗證器 這一篇筆記介紹一下 model 里的 validator 驗證器。 首先,這是個什麼東西呢? 在 model 的第四篇筆記里,我們介紹了欄位的一些屬性,比如是否允許為空,varchar 類型 ...
  • Lambda表達式 Lambda是一個匿名函數,我們可以把Lambda表達式理解為是一段可以傳遞的代碼(將代碼像數據一樣進行傳遞)。使用它可以寫出更簡潔、更靈活的代碼。作為一種更緊湊的代碼風格,使Java的語言表達能力得到了提升。 本質: 作為函數式介面的實例, 沒有介面就沒意義了. // 簡單使用 ...
  • keycloak目前提供了幾種分散式緩存,我們自己的緩存,如果希望是分散式的,可以將緩存添加到以下幾個緩存里即可 actionTokens clientSessions loginFailures offlineClientSessions offlineSessions sessions work ...
  • 一、讀取寫入視頻文件 1 import cv2 2 3 # 創建一個視屏捕獲對象 4 videoCapture = cv2.VideoCapture('AVI.avi') 5 6 # 獲取視頻的屬性值,cv2.CAP_PROP_FPS獲取視頻幀率 7 fps = videoCapture.get(c ...
  • 題目: 給你兩個按 非遞減順序 排列的整數數組 nums1 和 nums2,另有兩個整數 m 和 n ,分別表示 nums1 和 nums2 中的元素數目。 請你 合併 nums2 到 nums1 中,使合併後的數組同樣按 非遞減順序 排列。 註意:最終,合併後數組不應由函數返回,而是存儲在數組 n ...
  • AcWing 演算法基礎課week 1 總結 總結點 1:快速排序(分治思想) 題1:從小到大排序 主體思路:定義一個數x屬於數組s,利用雙指針,將數組分為大於等於x和小於等於x的兩部分,然後遞歸處理。(具體步驟如下) 1. 如上圖所示,我們定義一個數組s用來儲存n個數據,然後定義兩個指針i j,分別 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...