企業GPT幫助手冊
# 企業GPT幫助手冊
近期,以OpenAI的ChatGPT為型別的,基於人工智慧的自然語言處理技術發佈以來,大語言模型(LLM)進入了快速發展時期,各種大語言模型如同雨後春筍般不斷涌現。大語言模型是基於深度學習和自然語言處理技術,使用大規模的語料庫和神經網路模型,通過對大量語言數據的學習和訓練,來產生高質量的自然語言文字和回答各種問題。大語言模型如何運用到企業的生產管理流程中?愛招飛的企業GPT提供了一套解決方案。
如今大語言模型已經具備強大的文字推理能力,但是實際運用到企業生產流程中還有一個問題需要解決:大語言模型在訓練時並沒有將企業生產的資訊作為數據集進行訓練,讓大語言「瞭解」企業生產經營的情況,並利用其推理能力做出分析預測,愛招飛的企業GPT目前已初步實現上述功能。
在使用企業GPT之前,使用者需要充分了解以下概念:
神經元(Neuron):就像形成我們大腦基本元素的神經元一樣,神經元形成神經網路的基本結構。想像一下,當我們得到新資訊時我們該怎麼做。當我們獲取資訊時,我們一般會處理它,然後產生一個輸出。類似地,在神經網路里,神經元接收輸入,處理它併產生輸出,而這個輸出被髮送到其他神經元用於進一步處理,或者作為最終輸出進行輸出。
權重(weights):當輸入進入神經元時,它會乘以一個權重。例如,如果一個神經元有兩個輸入,則每個輸入將具有分配給它的一個關聯權重。我們隨機初始化權重,並在模型訓練過程中更新這些權重。訓練后的神經網路對其輸入賦予較高的權重,這是它認為與不那麼重要的輸入相比更為重要的輸入。為零的權重則表示特定的特徵是微不足道的。
AI模型(AI model):運用數學、統計、電腦科學和機器學習等領域的方法,對具有一定規律性和可預測性的數據進行分析、處理、預測和優化的數學模型。與傳統的數學模型相比,AI模型具有更加強大、高效、靈活的特點。因此,在現代數學和計算機技術的支援下,AI模型被廣泛應用於各種領域,包括金融、醫療、交通、農業、能源等多個領域。
訓練(train):簡單來說,模型就是一個複雜的計算函式,這個計算函式是無法使用數學表達式來表達的,使用現有的數據來擬合出目標函式,產生權重參數的過程就叫訓練。
提示詞(prompt):在大語言模型中,提示詞是一種程式設計方式,用於讓大語言模型輸出我們想要的結果的詞彙。這與其它實現單一任務的模型(比如情感識別、實體識別等)使用方式是不同的。通常在提示詞中,我們會提供一些說明與實體,實現類似於對話的功能,比如我們可以利用提示詞實現內容或程式碼產生、摘要、擴充套件、對話、創意寫作等等。
詞元(token):大語言模型理解和處理文字的基本單元。不同的模型單次能處理的詞元數量是不同的,這裡的單次是指一對提問與回答,也就是提問與回答的詞元數量不能超過模型限制的最大詞元數量。
微調訓練(finetune):如果對大語言模型產生的結果不滿意,可以通過後期的微調訓練,讓模型獲得新的語言回答傾向,從而讓模型實現一些特定功能,比如與語言模型開發框架結合,實現API呼叫、閱讀文字回答問題(知識庫)、提供自動代理服務(由語言模型自行判斷使用的工具,實現提示詞要求的事項)。
愛招飛企業GPT的主要功能包含如下:
- 模型管理:對大語言模型進行管理設定、可自定選擇大語言模型進行載入。
- 模型訓練:對模型進行微調訓練,實現新的功能。
- API呼叫:使模型實現對特定API的呼叫引用,引用API呼叫的結果來回答提問。
- 知識庫:給模型提供特定的知識內容,讓模型根據知識回答提問。
- 自定義工具:可以自行建立給模型使用的工具,讓模型自行判斷並智能呼叫工具獲取提問所需的回答。
以下是手冊說明導航: